当前位置: 首页 > article >正文

大模型AI-入门-发展历程-机器学习

部分内容可能来自网络或者由AI生成。如有雷同纯属巧合仅供学习参考之用。机器学习ML机器学习是人工智能的核心分支其本质是让计算机系统从数据中自动学习规律并用于预测或决策。一、机器学习的三大核心阶段机器学习项目可抽象为以下三个阶段形成一个完整的“学习-应用”闭环阶段名称核心任务类比1记忆Memorize收集、清洗、理解数据“读万卷书”——积累经验2制定Formulate构建模型、训练参数、优化性能“总结规律”——提炼方法论3预测Predict应用模型对新数据做出预测或决策“学以致用”——解决实际问题 这一框架强调数据是燃料模型是引擎预测是价值输出。二、基础概念解析1. 数据、特征与数据点数据Data用于训练和测试模型的原始信息集合。特征Feature描述数据属性的变量是模型的输入。例如房屋的“面积”、“卧室数”。数据点Data Point又称样本Sample或实例Instance在结构化数据中每一行 一个数据点每一列 一个特征或标签三、线性回归最简单的监督学习模型1. 数学表达线性回归假设目标变量 $ y $ 与输入特征 $ x_1, x_2, …, x_n $ 之间存在线性关系yw_1x_1w_2x_2⋯w_nx_nby w\_1 x\_1 w\_2 x\_2 \cdots w\_n x\_n byw_1x_1w_2x_2⋯w_nx_nb其中$ y $目标变量因变量/标签如房价$ x_i $输入特征自变量如面积、房龄$ w_i $权重Weight表示特征对预测的贡献程度即“斜率”$ b $偏置Bias当所有特征为0时的基准预测值参数 权重 偏置是模型通过训练学习到的核心内容。2. 模型训练目标通过最小化预测值与真实值之间的误差如均方误差 MSE自动调整 $ w $ 和 $ b $使拟合直线尽可能贴近数据分布。3. 与大模型的联系线性回归仅有 $ n1 $ 个参数$ n $ 个权重 1 个偏置而像DeepSeek-671B这样的大语言模型拥有6710亿个参数即671B个权重与偏置更多参数 → 更强的非线性拟合能力 → 可捕捉复杂模式如语言、图像中的深层语义⚠️ 但参数越多 ≠ 效果越好需权衡过拟合风险、计算成本与数据规模。四、机器学习三大范式1. 监督学习Supervised Learning定义使用带标签的数据训练模型学习输入 → 输出的映射关系。特点有“教师指导”目标明确。主要类型回归Regression预测连续值如房价、温度分类Classification预测离散类别如垃圾邮件/非垃圾邮件、猫/狗类比不断给婴儿看“冰激凌”的图片并告诉它“这是冰激凌”之后让它判断新图片是否为冰激凌。优势准确性高可解释性强应用广泛医疗诊断、金融风控、推荐系统等2. 无监督学习Unsupervised Learning定义处理无标签数据目标是发现数据内在结构或模式。特点无教师指导靠“自主探索”。主要类型聚类Clustering将相似样本分组如客户细分、图像分割降维Dimensionality Reduction压缩特征维度保留关键信息如PCA、t-SNE生成模型Generative Models学习数据分布以生成新样本如GAN、VAE类比给婴儿一堆未标注的图片让它自己将“看起来像的”图片归为一类。应用场景探索性数据分析异常检测数据预处理如降维加速后续建模3. 强化学习Reinforcement Learning, RL定义智能体Agent在环境中通过试错Trial-and-Error学习策略以最大化长期累积奖励。核心要素Agent学习者如机器人Environment外部世界如迷宫ActionAgent可执行的操作Reward环境反馈的即时奖惩信号PolicyAgent的决策策略目标找到最优策略特点无需标签仅依赖奖励信号强调序列决策与长期收益广泛应用于游戏AIAlphaGo、自动驾驶、机器人控制五、特征工程模型性能的“隐形推手”“数据和特征决定了机器学习的上限而模型和算法只是逼近这个上限。” —— 吴恩达特征工程的核心任务任务说明示例数据清洗处理缺失值、异常值、噪声用均值填补空缺年龄特征选择保留对目标最有用的特征从10个房产特征中选出面积、地段、房龄特征提取从原始数据构造新特征从“出生日期”提取“年龄”CNN自动提取图像边缘特征转换改变特征表示形式归一化Min-Max、标准化Z-score编码类别将非数值特征转为数值性别{男,女} → One-Hot: [1,0], [0,1]比喻特征工程就像“厨师处理食材”——把生肉、蔬菜加工成适合烹饪的形式模型才能“消化吸收”。六、文本表示Token、向量化与Embedding在NLP和大模型中如何将文本转化为模型可理解的数字形式至关重要。1. Tokenization分词将文本切分为基本单元Token形式取决于任务需求粒度示例适用场景字符级“机器学习” → [“机”,“器”,“学”,“习”]拼写纠错、小语种子词级“unhappiness” → [“un”, “happi”, “ness”]BPE、WordPiece如BERT、LLaMA单词级“I love AI.” → [“I”, “love”, “AI”, “.”]传统NLP任务词组级“New York” → [“New York”]保留专有名词语义 每个 Token 会被映射为一个Token ID整数供模型内部使用。2. Vectorization向量化将 Token ID 转换为数值向量使模型能进行数学运算。传统方法One-Hot Encoding稀疏、高维、无语义Bag-of-Words (BoW)忽略词序TF-IDF衡量词的重要性❌ 缺陷无法捕捉语义相似性如“猫”和“狗”在One-Hot中完全无关3. Embedding嵌入一种低维、稠密、语义丰富的向量表示方法。核心思想语义相近的词其向量在空间中距离更近。代表方法Word2Vec通过上下文预测学习静态词向量 → “猫” ≈ “狗”远于“石头”BERT / Transformer-based动态上下文嵌入→ “苹果”在“吃苹果” vs “苹果手机”中向量不同 Embedding 是大模型理解语言的基础也是 Prompt Engineering、RAG 等技术的前提。七、总结构建完整的 ML 认知地图维度关键要点流程记忆数据→ 制定建模→ 预测应用范式监督有标签、无监督无标签、强化奖励驱动模型从线性回归简单到大模型复杂参数规模决定表达能力数据特征工程是提升效果的关键杠杆表示Token → ID → Vector → Embedding文本理解的基石

相关文章:

大模型AI-入门-发展历程-机器学习

部分内容可能来自网络或者由AI生成。 如有雷同,纯属巧合,仅供学习参考之用。机器学习(ML) 机器学习是人工智能的核心分支,其本质是让计算机系统从数据中自动学习规律,并用于预测或决策。一、机器学习的三大…...

【AI Agent 学习笔记 task1】Day2:初识智能体

【AI Agent 学习笔记 task1】Day2:初识智能体 上一篇:【AI Agent 学习笔记】Hello-Agents 环境配置与首个 Agent 实战 一、Agent 的本质 Agent(智能体) 大模型(大脑) 工具(手脚) 控…...

一次生成、无限复用:易元 AI 双引擎重构生产逻辑,AI 混剪素材复用让内容越做越省

内容生产的真正效率,从来不取决于单条视频做得有多快,而在于单次投入能产生多少次价值、一次制作能支撑多少次产出,这就是素材复用的核心价值。在传统模式下普通的混剪工具只是机械拼接、单次产出,无法实现素材沉淀与循环使用&…...

5-11字典合并

输入用字符串表示两个字典,输出合并后的字典。字典的键用一个字母或数字表示。注意:1和‘1’是不同的关键字!输入格式:在第一行中输入第一个字典字符串;在第二行中输入第二个字典字符串。输出格式:在一行中输出合并的字典&#xf…...

86745238

86745238...

AI 模型推理系统的延迟优化方案

AI模型推理系统的延迟优化方案 随着AI技术的广泛应用,模型推理延迟成为影响用户体验和系统性能的关键因素。无论是实时语音识别、自动驾驶,还是在线推荐系统,高延迟都会降低响应速度,甚至导致业务损失。如何优化AI推理系统的延迟…...

LeetCode 3070. 元素和小于等于 k 的子矩阵数目

LeetCode 3070. 元素和小于等于 k 的子矩阵数目 题目描述 给你一个大小为 m x n 的整数矩阵 grid 和一个整数 k。你需要找出 grid 中所有以左上角 (0,0) 为起始点的子矩阵,并统计这些子矩阵中元素和不超过 k 的个数。 注意:子矩阵必须包含 (0,0) 这个格子…...

Java的虚拟线程调度与平台线程池在IO密集型应用中的扩展性

Java虚拟线程与平台线程池在IO密集型应用中的扩展性探索 随着微服务与云原生架构的普及,IO密集型应用对高并发的需求日益增长。传统Java线程模型因平台线程(OS线程)的创建成本高、上下文切换开销大等问题,难以实现高效扩展。Java…...

都跟掉电保护有关,但不是一个东西

以前会误以为 BKP 就等于 RTC因为它们有三个很容易让人混淆的共同点:它们都和“掉电保持”有关它们都在备份域里访问它们时常常都要先打开相关权限于是很容易脑子里变成:既然都和掉电保持有关,那它们是不是一回事其实不是。这就像&#xff1a…...

虚拟实验室:物理化学实验的计算机模拟

虚拟实验室:物理化学实验的计算机模拟 在传统物理化学实验中,学生常受限于设备、安全风险或时间成本,而虚拟实验室通过计算机模拟技术,为学习者提供了全新的实验体验。虚拟实验室不仅能高度还原真实实验场景,还能突破…...

Python的__init_subclass__类方法在框架开发中的钩子机制与扩展点设计

Python作为一门灵活的动态语言,其元编程能力为框架设计提供了强大的扩展性。在众多魔法方法中,__init_subclass__作为Python 3.6引入的类方法,正逐渐成为框架开发中实现钩子机制与扩展点设计的秘密武器。这个特殊方法允许父类在子类创建时进行…...

去中心化应用(DApp)开发全流程

去中心化应用(DApp)开发全流程:从构思到落地 随着区块链技术的普及,去中心化应用(DApp)成为开发者关注的热点。与传统应用不同,DApp运行在区块链网络上,具备透明、不可篡改和去中心…...

Rust Trait 对象动态分派原理

Rust Trait对象动态分派原理探析 Rust作为一门注重安全与性能的系统级语言,其多态实现机制一直是开发者关注的焦点。Trait对象通过动态分派(Dynamic Dispatch)实现了运行时的多态行为,这种机制在需要灵活处理不同类型但共享相同行…...

SSH隧道实战:内网穿透与端口转发

SSH隧道实战:内网穿透与端口转发 在当今数字化时代,远程访问内网资源成为许多企业和开发者的刚需。由于防火墙或NAT的限制,直接访问内网服务往往困难重重。SSH隧道作为一种安全高效的解决方案,能够轻松实现内网穿透和端口转发&am…...

如何设计一个安全的 RESTful API?

如何设计一个安全的 RESTful API?在当今数字化时代,RESTful API 已成为不同系统间数据交互的核心桥梁。随着网络攻击手段的日益复杂,API 的安全性已成为开发者不可忽视的挑战。一个设计不当的 API 可能导致数据泄露、服务瘫痪甚至法律风险。那…...

计算机视觉算法优化

计算机视觉算法优化:让机器更懂世界 计算机视觉作为人工智能的核心领域之一,正深刻改变着我们的生活。从人脸识别到自动驾驶,从医疗影像分析到工业质检,计算机视觉算法的性能直接决定了应用的准确性和效率。随着数据量的爆炸式增…...

STM32:UART串口通信

将一个设备的数据传送到另一个设备时,需要根据情况的不同,制定通信的规则,即通信协议。通信双方按照协议规则进行数据收发。常用的通信协议有名称引脚双工时钟电平设备USARTTX\RX全双工异步单端点对点I2CSCL\SDA半双工同步单端多设备SPISCLK\…...

# WebHID:用 JavaScript 实现浏览器与物理设备的“直连”交互在传统Web 开发中,浏览器对硬件设备的

WebHID:用 JavaScript 实现浏览器与物理设备的“直连”交互 在传统 Web 开发中,浏览器对硬件设备的支持始终受限于安全策略。但随着 WebHID API 的出现,开发者终于可以绕过复杂的驱动层和中间件,直接通过标准 JavaScript 与 USB H…...

Java synchronized 锁优化与偏向锁分析

Java synchronized锁优化与偏向锁分析 在多线程编程中,synchronized关键字是Java实现线程同步的核心机制。早期的synchronized实现因性能问题饱受诟病,直到JVM引入了锁优化技术,尤其是偏向锁的引入,显著提升了并发性能。本文将深…...

Python的__getattr__业务对象

Python魔法方法揭秘:灵活操控属性的__getattr__在Python的面向对象编程中,__getattr__是一个强大而神秘的魔法方法,它像一位隐藏在幕后的属性调度员。当常规属性访问失败时,这个方法就会被自动触发,为开发者提供了处理…...

软件工程软件开发生命周期瀑布模型与敏捷模型的比较

软件工程中的开发模型选择直接影响项目成败,瀑布模型与敏捷模型作为两种经典方法论,分别代表了结构化与灵活性的两极。随着数字化转型加速,开发团队常面临模型选择的困惑。本文将从核心维度对比二者的差异,帮助读者理解不同场景下…...

wythoff构造(正十二面体)

...

C++ 析构函数的隐藏风险

C析构函数的隐藏风险:那些容易被忽视的陷阱 在C编程中,析构函数作为对象生命周期的终结者,负责释放资源、清理内存等重要任务。其看似简单的设计背后却暗藏诸多风险,稍有不慎便可能导致内存泄漏、未定义行为甚至程序崩溃。本文将…...

JavaScript性能优化实战不赜

JavaScript性能优化实战技术文章大纲 性能优化的核心原则 减少代码执行时间 降低内存占用 优化网络请求 提升用户体验 代码层面的优化 避免全局变量污染,使用模块化或闭包 减少DOM操作,批量更新或使用文档片段 使用事件委托减少事件监听器数量 优化循环结…...

C++中的策略模式实战

1、非修改序列算法这些算法不会改变它们所操作的容器中的元素。1.1 find 和 find_iffind(begin, end, value):查找第一个等于 value 的元素,返回迭代器(未找到返回 end)。find_if(begin, end, predicate):查找第一个满…...

开源软件的使用贡献与社区参与经验分享

开源世界的大门:我的贡献与成长之旅 在数字化浪潮中,开源软件已成为技术发展的核心驱动力。从个人开发者到大型企业,无数人通过使用、改进和共享代码推动创新。作为一名长期参与开源项目的技术爱好者,我深刻体会到开源不仅是工具…...

MySQL 查询优化与索引覆盖机制

MySQL查询优化与索引覆盖机制是提升数据库性能的核心技术。随着数据量激增,高效的查询处理成为系统流畅运行的关键。索引覆盖机制通过避免回表操作,显著减少I/O消耗,而查询优化则能从根本上改善执行效率。本文将深入解析其原理与实践方法&…...

身份认证方案

身份认证方案:构建数字世界的安全基石 在数字化时代,身份认证是保障信息安全的第一道防线。无论是登录银行账户、访问企业内网,还是使用社交媒体,身份认证方案都在确认“你是谁”的过程中扮演关键角色。随着网络攻击手段的日益复…...

湖南特产酱板鸭项目有哪些

大家好,今天咱们聊聊湖南特产中的明星产品——酱板鸭。说到酱板鸭,大家可能会想到各种品牌,但今天我要重点介绍的是“渔小站君山酱板鱼”这个品牌。为什么呢?因为它不仅传承了传统的制作工艺,还在经营模式上做了很多创…...

Spring Boot 异步任务超时控制机制

Spring Boot异步任务超时控制机制解析 在现代高并发系统中,异步任务处理是提升性能的关键手段,但若任务执行时间过长,可能导致资源阻塞或系统雪崩。Spring Boot通过灵活的异步任务超时控制机制,帮助开发者平衡效率与稳定性。本文…...