当前位置: 首页 > article >正文

DeepMind CEO 访谈:人类离 AGI 只剩 4 年,只差最后 3 块拼图

作者老纪的技术唠嗑局楔子前几天4 月 29 日Google DeepMind CEO、2024 年诺贝尔化学奖得主 Demis Hassabis 在一期播客节目《Agents, AGI The Next Big Scientific Breakthrough》[1] 中预测 AGI通用人工智能有望在 2030 年实现并介绍了当前 AI 的几个致命短板。下面这个就是原视频强烈推荐一看看完之后我认为——这个简短的访谈比近期的任何一场 AI 产品发布会都更值得大家观看和思考。不是因为发布了什么新模型什么 benchmark 跑到了全宇宙第一。恰恰相反Hassabis 花了大量时间讲一件事现在的 AI到底还差什么“A true general intelligence system shouldn’t have that kind of jaggedness.”一个真正的通用智能系统不该有这种锯齿。Hassabis 的答案不长只有三个“小锯齿”但每个缺陷都很致命持续学习Continual Learning不能像人一样终身学习、不断更新知识长程推理Long-term Reasoning复杂逻辑链、多步骤规划能力极弱真正的记忆Memory不只靠上下文窗口而是结构化、可索引的长期记忆他直言因为这三个问题还现在的 LLM 还只是 ​**“一半天使、一半智障”**​。而前两个问题“长程记忆”和“持续学习”都依赖于先解决第三个问题“真正的记忆”。什么意思虽然 AI 能拿国际数学奥赛金牌但却可能会因为无法持久地记住历史会话和用户偏好而在面对简单问题时无法做出正确的决策。接下来我会把访谈里最核心的这几个问题和大家聊上一聊~欢迎大家关注 OceanBase 社区公众号 “老纪的技术唠嗑局”在这里我们会持续为大家更新与 #AI 和 #Data 相关的技术内容~一、暴力堆砌的上下文窗口 ≠ AI 记忆大家一定都注意到了最近各家大模型在比赛一件事谁的上下文窗口更长。从 4K 到 128K到 100 万 token到 1000 万 token。好像只要上下文足够长什么问题都能塞进去解决。然后 Hassabis 在访谈中算了一笔让大家一愣的账。现在最大的上下文窗口是 1000 万 token 对吧听起来很厉害但本质上是暴力堆砌记忆就像《哆啦 A 梦》漫画里大雄靠吃记忆面包来应付考试一样。****Hassabis 的原话是 “100 万 token 约 20 分钟视频。按这个换算即使放大到 1000 万 token也就 200 分钟的视觉信息”。如果大家仔细想想对于一个需要理解你数天、数周、数月甚至数年生活、工作习惯的 AI 助手来说200 分钟算个啥而且现在的问题不只是容量。更重要的是——现在的做法是把​**所有东西一股脑塞进 Context Window上下文窗口**​包括不重要的、错误的、过时的信息。每次对话本质上是无状态的。关掉窗口上一轮聊了什么全没了。Context Window 其实就相当于人脑里的 Working Memory工作记忆。人的工作记忆能同时装多少东西答案是 7 个数字。比如让你背一个朋友的电话号码其实能记住的也真就是 7 位的样子不信可以试试看因为如果位数再多就该“溢出”了。而大模型呢已经做到 100 万 Token。按理说模型的工作记忆比人大几十万倍应该比人聪明几十万倍才对。但显然不是。记忆的本质海马体 持续学习Hassabis 拿 AI 和人脑做了个对比因为这位大佬读博士时研究的就是​海马体如何把新知识优雅地融入已有知识体系​。问题也恰恰就出现在这。AI 习惯把所有东西都塞进 Context Window 里里面包含了不重要的东西、错的东西、过时的东西。看起来信息很多其实是一团乱麻。那人为什么 7 个数字的工作记忆就够用因为人脑背后还有另一套机制在工作。我们记得几年前的事记得童年的事记得几小时前发生的事。这些都不塞在工作记忆里而是另一套系统这套系统就是刚刚提到的海马体大脑里负责把新知识整合进已有知识库的那个部分。Hassabis 在播客中介绍说人脑在快速眼动睡眠REM sleep期间会回放白天的经历主动判断哪些值得记住、哪些应该遗忘然后把有价值的经验”写入”长期记忆。2013 年 DeepMind 那个名震一时的 DQN 算法第一个在雅达利游戏上达到人类水平的深度强化学习系统一个关键技术就是从这里借来的——​**经验回放experience replay**​反复回放成功路径来学习。这件事放在 AI 领域已经算是上古时期的了。这个把新东西融进旧知识库的过程就是所谓的​**持续学习Continual Learning**​。但到了 2026 年AI 普遍还都没有真正做到这一点。AI 海马体应该长什么样子Hassabis 在播客的观点很清晰AI 需要一套​独立的、高效索引的记忆模块​——能主动决定记住什么、遗忘什么。这是 AI Agent 在长时间维度可信赖地自主运行的前提条件。换句话说上下文窗口只是一张越摊越大的桌面。AI 真正缺的是一颗海马体。PowerMem我参与的一个 PowerMem[2] 开源项目就专门为 AI Agent 加上了这个“海马体”——​一套能够持久化 持续学习的记忆系统​。它的思路和 Hassabis 描述的方向高度一致不是把所有对话都塞进上下文而是从对话中​提取关键事实​按工作记忆、短期记忆、长期记忆分层管理引入艾宾浩斯遗忘曲线机制——用到的记忆会强化长期不用的记忆会逐渐淡出甚至自动清理和 Hassabis 说的“主动决定记住什么、遗忘什么”异曲同工支持向量 全文 图谱​三路混合检索​多 Agent 之间可以做记忆隔离和共享而且有一个数据很直观。在长对话记忆基准测试 LOCOMO[3] 上指标 PowerMem 全上下文方式准确率​78.70%​52.9% 检索 p95 延迟1.44s17.12sToken 消耗**~0.9k**~26k同样的任务用 PowerMem 的 token 消耗只有全上下文方式的18%少了 82% 的 token结果反而更准——因为不是所有旧对话都有价值。除了 PowerMem 之外我们的另一个项目 seekdb M0[4] 也是专门为 AI Agent 设计的自进化的云记忆支持一键接入分享经验自主学习和进化。当然PowerMem 和 seekdb M0 可能都还达不到 Hassabis 描述的那套人类大脑中“能在睡眠时回放和整合经验”的记忆系统终极形态。但探索和努力的方向肯定是对的记忆不该只靠暴力堆砌的上下文窗口硬撑。二、模型蒸馏 —— 大模型有多强六个月后的端侧设备就有多强访谈中的另一个重要片段是关于​**模型蒸馏Distillation**​。主持人问了一个很多人都好奇的问题”小模型到底能聪明到什么程度蒸馏有没有理论极限“Hassabis 的回答很干脆“我不觉得我们已经碰到了信息论上的极限。至少目前没人知道有没有碰到。我们的假设是一个前沿的 Pro 模型发布后在半年到一年内它的能力就能被压缩到非常小的、几乎可以跑在边缘设备上的模型里。”他给了具体数字蒸馏后的小模型可以达到前沿大模型 ​90-95% 的能力成本仅约十分之一​。这不是远期展望而是正在发生的。谷歌的 DeepMind 自家产品线就是这套逻辑Gemini Pro前沿旗舰→ Flash蒸馏后的消费级推理→ Nano端侧设备。开源的 Gemma 4 模型发布两周半下载量达到 ​4000 万次​。“小模型的价值不只是成本低。速度快同样会带来巨大的好处——你能迭代得更快迭代速度赚回来的远超那 10% 的能力差距。”Hassabis 还特别提到了边缘场景的意义“车载设备、智能穿戴设备、具身机器人……这些场景​**不光需要效率还需要隐私和安全”**​。“想象一下你家里的机器人你会希望本地跑一个高效且强大的模型只在特定场景下把任务委托给云端大模型。音频和视频流都在本地处理、数据留在本地——这是一个很好的终极状态。”这话让我想到一个正在发生的趋势当大模型的能力以 6-12 个月的周期“流”向端侧一个很自然的问题浮现——端侧设备上谁来给这些小模型提供数据底座它需要边缘设备上跑一个完整的传统数据库实例同时还要让它支持向量检索、全文搜索、结构化查询。这就是我参与的另一个项目 —— seekdb[5] 瞄准的方向。seekdb 的服务器模式只需要1C2G的资源支持pip install一键安装、秒级启动。嵌入式模式甚至可以作为 Python / JS / TS 的动态库直接运行在应用程序内部不需要独立数据库进程几乎没有任何资源开销。同时塞进去了向量检索、全文搜索、JSON、GIS——一个引擎全包兼容 MySQL 语法学习成本极低。关于 AI “从重到轻”的大趋势我之前写过两篇文章来分析。这里不再继续展开感兴趣的可以翻翻看~《如今的数据库产品为何总是越“轻”越火》《AI 应用爆发传统数据库为何“力不从心”》Hassabis 的判断会让人更加确信端侧智能不是“未来某天的事”它以 6 个月为周期在逼近。那些能在极低资源开销下提供完整 AI 数据能力的基础设施很快就会从“可选”变成“刚需”。三、AI 安全只写在 prompt 里还远远不够Hassabis 在访谈中花了不少篇幅谈安全。他的核心判断是“目前的 AI 系统在网络攻防方面已经相当强了。关键是要确保防御能力跑在攻击能力前面。”他认为 AI 是典型的“双重用途”技术——既能加强防御也能被利用来发现漏洞、自动化攻击。最紧迫的风险有两类恶意人类行为者利用 AI 发动攻击AI自主性增强带来的长期对齐问题第二点尤其值得警惕。随着 AI Agent 越来越能“自己做判断”“它自己做了个判断然后把你的数据库和备份都给搞没了”这类事情已经不只是理论推演。昨天发布的公众号文章 700 万人围观 AI 删库跑路罪魁祸首写下奇葩检讨就是一个血淋淋的案例。这也是为什么 Hassabis 说“技术狂奔的同时底线不能丢”。但“AI 的安全底线”不能只写在 prompt 里一部分责任也需要落到底层基础设施的身上。例如在数据库层面就应该为 AI 安全专门设计多道安全防线​**数据分支Branch / Fork**​像 Git 一样。AI Agent 在 Fork 出来的分支上随便实验主库 / 主表纹丝不动。改好了 MERGE 回去改砸了直接扔掉。​回收站 闪回​被 DROP 的表暂存回收站FLASHBACK一键捞回。闪回查询还可以看任意历史时间点的数据快照。​主备物理隔离​备份和主库跑在独立的存储集群上不在同一个“爆炸半径”里。说到底Hassabis 的焦虑和 PocketOS 的事故都指向同一个结论与其指望 Agent 不犯错不如假定它一定会犯错。然后在数据库层面把所有破坏性操作的口子焊死。四、AI 领域还在等它的“爱因斯坦”访谈快结束时Hassabis 说了一段让人很难忘的话。他提到了一个他称为“爱因斯坦测试”的标准“给一个 AI 系统截止到 1911 年的所有知识看它能不能像爱因斯坦在 1915 年那样自己推导出广义相对论。很明显今天的系统做不到这一点。”他进一步解释现在最强的 AI 系统能做到在既有框架内解决问题——解一道物理题甚至是奥赛级别的。但 AGI 需要的是发明框架本身——不是答好一道物理题而是创造一套全新的物理理论。“能发明围棋吗给系统一段高层描述‘一个五分钟能学会规则、但穷尽一生也难以精通的游戏美学上很优雅一个下午能下完一盘’——然后系统返回给你围棋。今天的系统做不到。”AlphaGo 能在棋盘上下出惊世骇俗的第 37 手但它发明不了围棋。这大概就是当前 AI 的处境总结能在考试里拿满分但还没学会发明考试。Hassabis 说AI 这个领域也还在等待一次“爱因斯坦式”的突破。在那个时刻到来之前我们能做的是把记忆造好把端侧铺好把安全兜好。让 AI 在通往 AGI 的路上少摔几个跟头。而要做到这三件事只靠模型层还不够基础设施层也必须跟着一起进化。本文的观点主要来自 Demis Hassabis 与 YC CEO Garry Tan 的 How to Build the Future 播客访谈视频*2026 年 4 月 29 日以及​*访谈文字稿[6]*​。*What’s more ?欢迎关注和预约 OceanBase 社区 5 月 7 日在视频号“老纪的技术唠嗑局”的线上直播。在今晚的直播中首先会由 seekdb M0 的开发者玉楼为大家介绍这个支持自进化的 AI Agent 记忆产品 —— M0。然后潜心钻研 AI Memory 的“总监”尹海文也会为大家带来一个和 AI 记忆系统相关的精彩分享~相关内容推荐给 AI Agent 装上长期记忆PowerMem 1.0.0 正式发布seekdb M0让 OpenClaw 记忆不丢失经验能共享如今的数据库产品为何总是越“轻”越火AI 应用爆发传统数据库为何“力不从心”干货内容推荐参考资料[1]Video《Agents, AGI The Next Big Scientific Breakthrough》: https://www.youtube.com/watch?vJNyuX1zoOgU[2]PowerMem: https://github.com/oceanbase/powermem[3]LOCOMO: https://github.com/snap-research/locomo[4]seekdb M0: https://m0.seekdb.ai[5]seekdb: https://github.com/oceanbase/seekdb[6]Draft《Agent, AGI The Next Big Scientific Breakthrough》: https://www.techflowpost.com/zh-CN/article/31409

相关文章:

DeepMind CEO 访谈:人类离 AGI 只剩 4 年,只差最后 3 块拼图

作者:老纪的技术唠嗑局 楔子 前几天(4 月 29 日),Google DeepMind CEO、2024 年诺贝尔化学奖得主 Demis Hassabis 在一期播客节目《Agents, AGI & The Next Big Scientific Breakthrough》[1] 中,预测 AGI&#…...

2025届最火的AI辅助论文方案横评

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 深寻作为先进的大型语言模型,在学术论文写作领域显现出明显的应用潜力&#xff…...

FontForge入门指南:从零开始设计你的第一套字体

FontForge入门指南:从零开始设计你的第一套字体 【免费下载链接】fontforge Free (libre) font editor for Windows, Mac OS X and GNULinux 项目地址: https://gitcode.com/gh_mirrors/fo/fontforge 你是否曾想过亲手设计一套属于自己的字体?Fon…...

WeChatMsg:突破性微信聊天记录管理工具 - 从数据碎片到情感记忆的革命

WeChatMsg:突破性微信聊天记录管理工具 - 从数据碎片到情感记忆的革命 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Tr…...

LangGraph Agent 开发指南(9~工具 Tools)

一、什么是工具? 1.1 通俗解释 想象你有一个智能助手: 没有工具:你: 帮我查一下北京明天的天气助手: 抱歉,我没有联网功能,无法查询实时天气有工具:你: 帮我查一下北京明天的天气助手: 好的,…...

别再只做静态分析了!用DPABI探索小鼠大脑rs-fMRI的动态功能连接(含Matlab代码片段)

动态功能连接分析:解锁小鼠大脑rs-fMRI的时变奥秘 在神经影像研究领域,静息态功能磁共振成像(rs-fMRI)已成为探索大脑功能组织的强大工具。传统静态分析方法虽然提供了宝贵的基础认知,但大脑本质上是一个动态系统,其功能连接会随时…...

3步解决Beyond Compare 5评估模式错误:密钥生成与完全激活指南

3步解决Beyond Compare 5评估模式错误:密钥生成与完全激活指南 【免费下载链接】BCompare_Keygen Keygen for BCompare 5 项目地址: https://gitcode.com/gh_mirrors/bc/BCompare_Keygen 当Beyond Compare 5的30天评估期结束后,软件会显示"评…...

高性能JSXBIN解码器架构设计:3大核心技术优势深度解析

高性能JSXBIN解码器架构设计:3大核心技术优势深度解析 【免费下载链接】jsxer A fast and accurate JSXBIN decompiler. 项目地址: https://gitcode.com/gh_mirrors/js/jsxer Jsxer是一个快速且准确的JSXBIN反编译器,专门用于将Adobe ExtendScrip…...

批量转账工具评测:GTokenTool 凭什么成为 Web3 首选?

GTokenTool 是一个支持多链、不涉及代码操作的综合性 Web3 工具箱。它的批量转账功能支持一键分发 ERC-20 和 NFT 代币,特别适合用来高效完成各类代币分发任务,最高能节省 90% 的 Gas 费,且其合约模板已通过多重安全审计。 下面我按照新手最关…...

英雄联盟终极自动化助手:三步掌握LeagueAkari提升游戏体验

英雄联盟终极自动化助手:三步掌握LeagueAkari提升游戏体验 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit LeagueAkari是一款基于英…...

【基于Xilinx ZYNQ7000与PYNQ的嵌入式AI实践】从零构建实时人脸识别系统

1. 项目背景与核心价值 最近在折腾嵌入式AI项目时,发现Xilinx ZYNQ7000系列开发板真是个宝藏硬件。它独特的PS(处理器系统)PL(可编程逻辑)双架构,配合PYNQ框架的Python生态,让算法部署变得异常灵…...

AUBO机械臂视觉跟踪避坑指南:手眼标定后,如何让末端稳定跟随移动的ArUco码?

AUBO机械臂视觉跟踪避坑指南:手眼标定后如何实现稳定动态跟随 在工业自动化领域,机械臂的视觉跟踪能力直接决定了柔性制造系统的智能化水平。AUBO i5作为国产协作机械臂的代表性产品,其与视觉系统的集成应用越来越广泛。然而,许多…...

LaTeX引用中文文献总出乱码?可能是你的.bib文件编码和编译顺序没搞对

LaTeX中文文献引用乱码全解析:从编码原理到实战排错 当你熬夜赶论文,终于把参考文献列表整理进.bib文件,满心期待地按下编译键——结果引用位置跳出一串问号,参考文献列表变成乱码战场。这种崩溃瞬间,每个用LaTeX写过中…...

Python知乎API开发完全指南:从零构建高效数据采集系统

Python知乎API开发完全指南:从零构建高效数据采集系统 【免费下载链接】zhihu-api Zhihu API for Humans 项目地址: https://gitcode.com/gh_mirrors/zh/zhihu-api 在当今数据驱动的时代,知乎作为中文互联网最大的知识分享平台,其丰富…...

ARMv8浮点运算单元与MVFR寄存器深度解析

1. ARMv8浮点运算单元架构解析在移动计算和嵌入式系统领域,ARMv8架构已经成为事实上的行业标准。作为其核心计算能力的重要组成部分,浮点运算单元(FPU)和高级SIMD(Neon)扩展的性能直接影响着机器学习、图形处理、科学计算等关键应用的执行效率。与x86架构…...

Translumo终极指南:3个简单技巧掌握实时屏幕翻译

Translumo终极指南:3个简单技巧掌握实时屏幕翻译 【免费下载链接】Translumo Advanced real-time screen translator for games, hardcoded subtitles in videos, static text and etc. 项目地址: https://gitcode.com/gh_mirrors/tr/Translumo 你是否曾在游…...

Power Query处理月度报表,遇到数据有null怎么办?详解【标准】运算与自定义列的计算逻辑差异

Power Query空值处理实战:标准运算与自定义列的计算逻辑深度解析 财务总监Lisa盯着屏幕上满是错误标记的月度汇总报表,眉头紧锁。她刚刚用Power Query合并了六个部门的销售数据,却发现总金额列出现了大量意料之外的null值——这直接导致季度预…...

DockDoor终极指南:快速掌握macOS窗口预览与高效切换

DockDoor终极指南:快速掌握macOS窗口预览与高效切换 【免费下载链接】DockDoor Window peeking, alt-tab and other enhancements for macOS 项目地址: https://gitcode.com/gh_mirrors/do/DockDoor 还在为macOS上繁琐的窗口切换而烦恼吗?DockDoo…...

课程第四天(基础)

while 循环语句whilewhile(){}:当小括号条件成立了执行{}里面的东西,条件不成立的时候,循环就结束了格式:while (条件){(执行语句)}do...while格式:do{(执行语句)}while(…...

怎样快速删除背景?2026年免费工具实测对比,找到最简单的抠图方法

图片背景删除已经成为日常工作中的常见需求——无论是制作证件照、电商商品图,还是社交媒体头像,都离不开一个靠谱的背景去除工具。但市面上的工具五花八门,从专业软件到在线应用,从手机App到小程序,到底哪个才是最简单…...

蜡笔变蜡烛:DIY分层香薰蜡烛的材料原理与制作实践

1. 项目概述:当蜡笔遇见蜡烛,一次关于气味与色彩的记忆重塑不知道你有没有过这样的体验:打开一盒崭新的蜡笔,那股混合着油脂、黏土与淡淡皂感的独特气味扑面而来,瞬间就能将你拉回铺满画纸的童年午后。Crayola蜡笔的官…...

从“记录系统”到“智能系统” From “System of Record” to “System of Intelligence” —— A16Z

From “System of Record” to “System of Intelligence” 从“记录系统”到“智能系统” https://www.a16z.news/p/from-system-of-record-to-system-of Here’s one way you can think about system of record stickiness: For a long time, the valuable part of social…...

Claude 代码在大型代码库中的运作方式:最佳实践与入门指南

How Claude Code works in large codebases: Best practices and where to start Claude 代码在大型代码库中的运作方式:最佳实践与入门指南 https://claude.com/blog/how-claude-code-works-in-large-codebases-best-practices-and-where-to-start The most succ…...

基于RAG与智能体技术构建法律领域AI应用实战指南

1. 项目概述:一个法律智能体的诞生最近在GitHub上看到一个挺有意思的项目,叫mileson/moticlaw。光看这个名字,可能有点摸不着头脑,但稍微拆解一下就能明白它的野心:“motic” 很可能是 “motion”(动议、提…...

技术管理者最痛:如何让团队从“要我做”变成“我要做”?

在软件测试领域,技术管理者常常陷入一种无形的焦虑:测试用例的执行越来越像机械的流水线,回归测试变成了纯粹的体力劳动,而探索性测试和深度质量分析这些真正有价值的活动,却总是无人主动认领。你尝试过推行自动化覆盖…...

AssetStudio:从Unity游戏资源中提取3D模型、纹理和Lua脚本的完整指南

AssetStudio:从Unity游戏资源中提取3D模型、纹理和Lua脚本的完整指南 【免费下载链接】AssetStudio AssetStudio - Based on the archived Perfares AssetStudio, I continue Perfares work to keep AssetStudio up-to-date, with support for new Unity versions a…...

ncmdump终极解决方案:解锁网易云音乐NCM格式的完整指南

ncmdump终极解决方案:解锁网易云音乐NCM格式的完整指南 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 还在为网易云音乐下载的NCM加密文件无法在其他设备播放而烦恼吗?ncmdump工具使用为你提供了完美的NCM格…...

Bili2Text:3分钟将B站视频转为文字稿,AI语音识别提升学习效率10倍

Bili2Text:3分钟将B站视频转为文字稿,AI语音识别提升学习效率10倍 【免费下载链接】bili2text Bilibili视频转文字,一步到位,输入链接即可使用 项目地址: https://gitcode.com/gh_mirrors/bi/bili2text 还在为无法快速获取…...

从功能测试到测试开发,薪资翻倍的秘密都在这里

当“点点点”撞上职业天花板 如果你是一名功能测试工程师,下面的场景你一定不陌生:每天对着需求文档编写用例,在测试环境里重复着相似的操作路径,偶尔发现一个边界值缺陷便觉得一天没有白费。然而,当你在招聘网站上搜…...

Coolapk-UWP 深度解析:基于MVVM架构的Windows桌面酷安客户端开发实战指南

Coolapk-UWP 深度解析:基于MVVM架构的Windows桌面酷安客户端开发实战指南 【免费下载链接】Coolapk-UWP 一个基于 UWP 平台的第三方酷安客户端 项目地址: https://gitcode.com/gh_mirrors/co/Coolapk-UWP 在移动应用生态日益丰富的今天,将移动端优…...