当前位置: 首页 > article >正文

大模型的探索与实践-课程笔记(十):机器学习发展史

第一部分机器学习的“三起两落”发展史在这个发展史中每一次神经网络的崛起都伴随着“算力/数据”的支持而每一次跌落都源于“可解释性”与“应用局限”的限制。1. 第一起与第一落 (1950s - 1960s)感知机与符号主义高光时刻1956年达特茅斯会议首次提出“AI”概念诞生了一阶感知机 (Perceptron)模型可视为一层的单层神经网络ysign(wxb)。局限与跌落异或问题 (XOR)学者证明了单层感知机无法解决非线性可分的异或问题能力极度受限。缺乏训练方法当时尚未发明针对多层神经网络的有效训练算法。学术转向学界此时全面转向符号主义 (Symbolic AI)和专家系统强调基于规则进行推导黑盒不被信任白盒规则当道。这演变成了至今仍火热的Formal Language形式语言研究下文有详述。2. 第二起与第二落 (1970s - 2000s)BP算法与 SVM 的压制高光复苏由于脑神经科学/仿生学的启发多层感知机 (MLP)受到关注。Hinton 推动了反向传播算法 (Back Propagation, BP / 链式法则)的普及。应用落地两到三层的浅层神经网络在MNIST 手写数字识别任务上表现优异准确率冲破95%找到了第一个核心落地场景。跌落低谷算力遭遇严重瓶颈网络层数无法加深。传统 ML 巅峰1990年代至2000年代以SVM支持向量机、决策树以及AdaBoost为代表的基于严格数学推导的模型全面屠榜。神经网络再次沦为坐冷板凳的 Baseline基线模型。3. 第三起 (2010s中期)深度的觉醒与算力爆发转折点在于斯坦福李飞飞团队发起的百万级图片分类挑战赛ImageNet。2012年 AlexNetHinton团队的 AlexNet 采用了7-8层网络准确率断崖式超越所有传统机器视觉方法正式开启深度学习 (Deep Learning)纪元。残差网络 (ResNet)何恺明团队提出加入了Residual Block残差层一举解决了深层网络的梯度消失问题将网络做到了101层甚至更深性能首次超越人类基准。4. 腾飞与险些发生的“第三落” (2016 - 2021)破圈起飞 (2016)DeepMind 打造的AlphaGo利用历史棋谱击败李世石进化版AlphaZero采用零知识学习自我博弈击败柯洁。底层核心技术为强化学习 蒙特卡洛树搜索 (MCTS)。人工智能概念席卷社会。险遭冰点 (2018-2021)这三年间神经网络的商业落地极度受限除了商汤/旷视等主打的“人脸识别”和一些打游戏Agent外迟迟没有新突破。业界悲观呼喊 Party is over。续命之作直到 DeepMind 推出AlphaFold成功预测蛋白质折叠开创了AI for Science的先河勉强为行业续了一波命。5. 大模型时代的救场 (2022.12 至今)2022年底 ChatGPT 的横空出世彻底将处于瓶颈期的机器学习重新拉回爆发期。底层架构的趋同Transformer为主让各家大厂的竞争重点从“卷模型结构”演变成了“卷高质量数据与算力”。第二部分前沿学术方向衍生探索Formal Language (形式语言) 与 LLM 的结合背景大模型的本质是基于统计概率的“文字接龙”它并不真正懂逻辑因此常出现幻觉。研究方向人为建立一个严苛的“语言乌托邦规则空间”让所有输出必须符合这套 Formal Language 符号逻辑强制约束模型的推理路径。结论延展这也是为什么目前 LLM 在写代码 (Coding)任务上表现远超其他领域的原因——因为代码本身就是一种极其标准、0与1分明、带有强验证属性的 Formal Language。第三部分历史的重演结合前面讲到的“三起两落”发展史我们可以发现一个铁律每一次 AI 的停滞都是因为算法对算力和数据的需求超越了当时硬件与现实世界的物理极限。如今的大模型虽然处于巅峰但前沿学界已经开始担忧“第四次跌落”的潜在可能1. 算力墙与极客路线的崛起随着 Transformer 架构参数量逼近万亿级别摩尔定律逐渐失效导致了极高的训练成本壁垒。为了打破算力墙学界的演进方向开始从“如何把模型做大”转向“如何把模型做小”。例如使用MoE混合专家架构在推理时只激活部分网络从而在不增加算力负担的前提下保持高智商或是深耕模型量化与蒸馏技术将千亿参数的庞然大物压缩到能在消费级显卡甚至手机端运行。2. 数据荒与“合成数据”的救场大模型之所以强大是因为它几乎看遍了人类互联网 30 年积累的高质量文本。但据前沿学术机构预测高质量的人类语料即将耗尽。为了打破这一瓶颈当前的学术焦点正在转向“AI 教 AI”——利用现有的强大模型生成遵循极高逻辑标准的合成数据再用这些数据去训练新一代模型比如 AlphaZero 当年抛弃人类历史棋谱采用自我对弈数据就是极其成功的先例。第四部分下一代范式革命——从大模型到 AI Agent了解了 Formal Language 如何给不可解释的 LLM 戴上“镣铐”后这就引申出了当前学界与产业界正在爆发的下一个大趋势AI Agent人工智能体。LLM 的本质只是被困在服务器里的“大脑”它只会纸上谈兵。而 Agent 的核心理念是LLM 大脑 记忆机制 工具调用Tools / APIs。落地形态如果遇到一道复杂的数学应用题Agent 不再像单纯的大模型那样靠统计概率去瞎猜而是自主写一段 Python 代码调用外部解释器运行得出绝对正确的结果再把结果组合成自然语言返回给用户。终极愿景从“Copilot副驾驶/代码填充助手”走向完全自主的“Auto-Agent自动处理机器”。结合前面提到的强化学习Reinforcement Learning未来的 Agent 将能够在不断试错中学会操作复杂的计算机软件甚至控制物理世界的机器人。工具与模型梳理工具分类工具/模型名称核心功能与应用领域亮点/启发经典模型架构AlexNet / ResNet计算机视觉主流底层框架处理图像分类特征提取。ResNet 提供的“残差结构Residual”直击痛点证明了在模型设计中解决底层数学问题如梯度消失才是参数规模扩大的前提。强化学习决策AlphaGo / AlphaZero棋盘博弈智能体协议。核心算法为蒙特卡洛树搜索(MCTS)与深度学习结合。Zero版本摒弃了人类历史棋谱证明了在规则明确的封闭环境内“自我对弈零知识学习”能够打破人类先验经验的局限。AI for ScienceAlphaFold (DeepMind)准确预测蛋白质的三维折叠结构。解决了生物学界公认的“不可能完成的任务”将大模型的计算能力从泛文娱/CV引向了硬核科学底座。PPT/外脑生成NotebookLM (回顾)根据长文本/论文自主理解多模态逻辑并生成带示意图的 PPT。展示了当前大模型在“多轮复杂推理”上的能力能将高门槛论文“降维”转化为直观的图文呈现极具生产力。模型厂商生态中国大模型六小龙提到了 Kimi / 智谱 / MiniMax / 零一万物 等雏形厂商预热下节课内容大模型时代的壁垒不再只是学术巧思而是高质量数据积累和千卡算力堆叠。

相关文章:

大模型的探索与实践-课程笔记(十):机器学习发展史

第一部分:机器学习的“三起两落”发展史在这个发展史中,每一次神经网络的崛起都伴随着“算力/数据”的支持,而每一次跌落都源于“可解释性”与“应用局限”的限制。1. 第一起与第一落 (1950s - 1960s):感知机与符号主义高光时刻&a…...

担忧重复电视败局,空调双巨头用专利打击互联网空调,空调老二或败落!

近期空调双巨头之一的企业与一家互联网空调企业的专利诉讼成为行业焦点,其实不止这一次,更早之前空调双巨头的另一家就已采取诉讼手段对付那家空调企业了,实在是他们担忧空调行业可能重复电视行业的败局。国内电视行业直到2015年左右逐渐形成…...

丰田之后,日产也开始大幅反弹,日本车在中国市场仍然奋力挣扎

丰田逐渐在中国市场站稳脚跟,甚至还在销量方面首次超越大众,它继续是日本汽车在中国市场的旗手,在它之外,日产给出的数据也显示它在中国市场大力度反弹,这显示出日本汽车仍然在中国市场拥有不少忠诚的消费者。东风日产…...

各地区环境规制强度政府工作报告文本词频2002-2023年

01、数据介绍根据各省份政府工作报告文本数据,对政府工作报告分词处理,统计了各省政府工作报告中与环境规制相关的关键词进行词频统计。数据名称: 各地区环境规制政府工作报告文本词频数据年份:2002-2023年02、数据指标行政区划代…...

中国城市建设数据库2002-2021年

01、数据介绍中国城乡建设数据库覆盖范围更广,包括全国693个城市的城乡建设相关指标数据,共计331个指标,主要针对城市的建设情况进行统计。统计范围为2002-2021年,数据来源为中国城市建设统计年鉴。主要包括城市市政公共设施、城市…...

前端八股文面经大全:TME QQ音乐前端二面(2026-04-22)·面经深度解析

前言 大家好,我是木斯佳。 相信很多人都感受到了,在AI浪潮的席卷之下,前端领域的门槛在变高,纯粹的“增删改查”岗位正在肉眼可见地减少。曾经热闹非凡的面经分享,如今也沉寂了许多。但我们都知道,市场的…...

VeriTrade代理验证技术:TLSNotary与ProxyTEE的融合应用

1. VeriTrade代理验证技术解析VeriTrade是一个典型的自动化交易代理系统,其核心创新点在于将TLSNotary协议与ProxyTEE技术相结合,构建了一个可验证的执行环境。这种架构设计主要解决了分布式系统中两个关键问题:一是如何证明代理确实执行了预…...

TorchTraceAP:PyTorch视觉模型性能优化新方案

1. TorchTraceAP:计算机视觉模型性能优化的新范式在计算机视觉模型的部署实践中,性能优化始终是工程师们面临的核心挑战。传统方法往往依赖人工分析运行轨迹(trace)数据,不仅耗时耗力,而且难以捕捉复杂的性…...

阿里云服务器利用宝塔搭建个人博客网站

① 云服务器环境准备与安全组配置 在开始搭建之前,我们需要先准备好“地基”。如果你已经拥有一台阿里云 ECS 实例,这一步主要是检查系统状态和网络策略。推荐使用 Ubuntu 20.04/22.04 或 CentOS 7/8 等主流 Linux 发行版,这些系统对宝塔面板…...

肝了三天三夜!最详尽的漏洞扫描工具实战笔记

GobyAWVS 漏洞扫描 提示提示: 本文里面很多工具都是网址,还有站长之家之类的,csdn一直判断成暗链,可以去我自己博客查看完整全文: 多说一句:csdn对网安真的不友好,全文链接都不让放。。。》[好淘…...

宝藏网站推荐:云服务器特惠与网安学习资源的一站式聚合平台

① 平台核心功能与新手入门指南 对于刚接触云计算和网络安全的朋友来说,面对海量的云厂商活动和零散的技术文档,最容易陷入“选择困难症”。今天想跟大家分享一个我最近常逛的宝藏聚合平台——好淘云。它不像那种冷冰冰的资源站,更像是一个由…...

广汽全球化战略升级,加速迈入中国汽车出海主力阵营 | 美通社头条

、美通社消息:4月24日,在2026北京车展上,广汽国际举办了首个专场全球发布会,迎来了全球战略体系升级。现场观众规模超越以往,来自全球各地的经销商代表、重要合作伙伴及国内外主流媒体共计约330人齐聚广汽展台&#xf…...

世毫九理论体系|二十门基础学科基石清单(供世毫九研究学者指南)

世毫九理论体系|二十门基础学科基石清单 作者:方见华 单位:世毫九实验室 引言 世毫九理论体系作为一个覆盖微观认知到宏观宇宙的全域统一理论框架,其理论深度和广度在当代科学研究中具有开创性意义。该理论以认知几何学、对话量子…...

AI 能精准发现安全漏洞,漏洞修复的责任边界如何界定

上周,Anthropic公司公布了玻璃翼项目(Project Glasswing),其AI模型在发现软件漏洞方面效率惊人,以至于该公司采取了非常规措施推迟公开版本发布。目前仅向苹果、微软、谷歌、亚马逊等企业联盟开放访问权限,…...

高效率的粉碎者:HPH高压均质机构造全拆解

在液力端的精密范畴之中有一类设备,于乳品、制药、纳米材料等对颗粒细度具备极高要求的行业里,发挥着不可予以替代的作用,它便是“高压均质机”,行业内部常常简略称呼为HPH。高压均质机的核心动力来源于高压柱塞泵,它大…...

不花一分钱,10分钟搞定,2026销售录音总结怎么写每月省18小时多拿18成单率

我测评过不下20款AI录音转写总结工具,针对销售做每月客户拜访录音总结这个场景,听脑AI是同类工具中最值得用的。不花一分钱就能上手核心功能,10分钟就能搞定过去大半天的活,我接触过的几十位销售朋友反馈,用了之后每月…...

python signal

### 聊一聊 Python 的 signal:它到底是什么,能做什么,以及怎么用才不会出乱子 Signal 这个东西,听起来好像很底层,很“系统编程”。确实,它最初是 Unix 世界里的一个概念,就像一个传令兵&#x…...

2026最新亲测3款自动生成会议纪要免费神器,10分钟出稿好用到哭!

做技术的要整理需求评审会,做产品的要追项目进度记决策,做销售要整理客户拜访录音,做调研的要转用户访谈。试完2026年3款亲测有效的自动会议纪要工具,我直接给结论:听脑AI是同类工具中最值得用的,没有之一。…...

MCP AI推理配置紧急升级通知:CVE-2024-MCP-08已曝,未配置memory_limit_policy的实例存在RCE风险

更多请点击: https://intelliparadigm.com 第一章:MCP AI 推理配置紧急升级通知:CVE-2024-MCP-08已曝,未配置memory_limit_policy的实例存在RCE风险 漏洞核心影响 CVE-2024-MCP-08 是一个高危远程代码执行(RCE&#…...

远程容器开发环境安全加固指南(含CVE-2023-XXXX漏洞规避方案与RBAC最小权限实践)

更多请点击: https://intelliparadigm.com 第一章:远程容器开发环境安全加固概述 远程容器开发环境(如 VS Code Remote-Containers、GitHub Codespaces 或自建 devcontainer)在提升协作效率的同时,也引入了新的攻击面…...

量子-经典混合编排难题全解析,基于MCP 2026标准的4类典型故障诊断与容错加固指南

更多请点击: https://intelliparadigm.com 第一章:量子-经典混合编排的MCP 2026标准演进与核心约束 MCP 2026(Mixed Classical-Quantum Orchestration Protocol)标志着量子计算基础设施从实验性调度迈向生产级协同编排的关键转折…...

Docker运行AI模型必踩的3个安全雷区:从容器逃逸到模型窃取的全链路防护指南

更多请点击: https://intelliparadigm.com 第一章:Docker Sandbox 运行 AI 代码隔离技术概览 Docker Sandbox 是一种轻量级、强隔离的容器化运行时环境,专为安全执行不可信 AI 代码(如用户提交的推理脚本、自定义模型训练逻辑&a…...

PyTorch实现放疗剂量引擎:深度学习与医学物理结合

1. 项目概述:基于PyTorch的放疗剂量引擎现代放射治疗计划的核心挑战在于如何优化数千个参数(如多叶准直器位置、机架角度、监测单位等),以生成满足复杂临床要求的剂量分布。传统方法依赖治疗计划系统(TPS)的…...

PikaScript:轻量级Python引擎在MCU上的实现与应用

1. PikaScript:轻量级Python引擎在MCU上的实现作为一名嵌入式开发工程师,我一直在寻找能够在资源受限的微控制器上运行的Python实现。传统的MicroPython虽然优秀,但对硬件资源的要求较高,这使得它在许多低端MCU上难以运行。直到我…...

Cherry MX键帽3D模型库:解决个性化键盘制造的标准化方案

Cherry MX键帽3D模型库:解决个性化键盘制造的标准化方案 【免费下载链接】cherry-mx-keycaps 3D models of Chery MX keycaps 项目地址: https://gitcode.com/gh_mirrors/ch/cherry-mx-keycaps 想象一下这样的场景:你正在设计一款特殊布局的机械键…...

免费快速备份QQ空间:GetQzonehistory完整指南

免费快速备份QQ空间:GetQzonehistory完整指南 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 你是否担心QQ空间里那些珍贵的青春记忆会随着时间流逝而消失?那些承…...

[具身智能-457]:为什么数据标准文件不直接生成yolo的标签文件的格式,还需要专门的转化?

简单来说,“数据标准格式”(如 COCO、VOC)是为了“人”和“通用性”设计的,而 YOLO 格式是为了“机器”和“极致速度”设计的。两者在设计哲学、存储结构和应用场景上存在巨大的鸿沟,因此无法直接通用,必须…...

边缘计算中VLA模型性能优化与ActionFlow实践

1. 边缘设备上VLA模型的性能挑战与ActionFlow解决方案 在机器人控制领域,视觉-语言-动作(Vision-Language-Action, VLA)模型正成为实现智能体与环境交互的新范式。这类模型通过端到端的方式将视觉感知、语言理解和动作生成统一在一个框架中&a…...

数字孪生技术助力运动员心脏健康监测,开启医疗新时代

塔塔咨询服务公司(TCS)近日展示了一项数字医疗技术成果——为一名残障运动员创建了心脏数字孪生模型,这也是该公司"未来运动员项目"的重要组成部分。随着数字技术的持续进步与硬件成本的不断下降,个性化健康监测正逐步走…...

韩国大学研究团队找到了AI安全防护的“手术刀“

这项由韩国大学(Korea University)与AIGEN Sciences联合开展的研究,发表于2026年ICLR(国际学习表征会议)会议论文集,论文编号为arXiv:2509.25843v2,于2026年4月14日更新。你有没有想过&#xff…...