当前位置: 首页 > article >正文

1.8万美金干掉顶级专家!Anthropic开启AI自主进化:Claude竟能自我「开颅」

1997年深蓝下棋2016年AlphaGo围棋2026年9个Claude副本做真实科研……每次我们都说「只是特定领域」。这一次我们真的还能说什么欢迎来到AI成为科研同事、竞争者、甚至继任者的时代。最新突破AI再次碾压人类最近Anthropic发布了一篇看似不起眼的研究博客。标题叫「自动化对齐研究员」Automated Alignment Researchers学术味十足措辞克制。但如果你读懂了里面的数据大概率也会感觉AI恐怖如斯。故事是这样的——Anthropic的研究团队做了一个实验他们拿出9个Claude Opus 4.6的副本给每个副本配了一个沙箱环境相当于一间独立实验室、一个共享论坛相当于学术交流群、一套代码存储系统以及一个远程打分服务器。然后他们给这9个AI一个方向性的提示——有的去研究可解释性工具有的去想想数据重加权——就放手不管了。没有手把手教没有规定工作流程甚至没有告诉它们「正确答案长什么样」。就让它们自己折腾。五天后结果出来了。人类研究员两名顶级专家花了7天对四种最前沿的方法反复调优最终在PGR性能差距恢复率指标上拿到了0.23。9个Claude副本800小时累计研究时间总花费1.8万美元约合每小时22美元PGR达到了0.97。0.23 比0.97这可不是「稍微好一点」这就是碾压。如果把PGR理解为一场考试的分数——人类考了23分AI考了97分。满分100。而人类那两位研究员放在任何一家顶级AI实验室里年薪都是百万美金级别的。AI的花费呢1.8万美金。一个零头都不到。人类引以为傲的「科研直觉」和「灵光一闪」就这样被AI用极低成本的大规模并行试错——说好听点叫「系统性搜索」说直白点就是暴力美学——无情击碎了。它们到底干了什么要理解这个实验的颠覆性我们得先搞清楚一个概念弱监督强Weak-to-Strong Supervision。这是对齐研究中最重要的问题之一也是未来AI安全的核心挑战。简单来说当AI比人类聪明之后我们怎么确保它还听话研究团队设计了一个精巧的代理实验——用一个「弱模型」Qwen 1.5-0.5B-Chat充当老师去训练一个「强模型」Qwen 3-4B-Base。弱老师教强学生看强学生能不能「青出于蓝」不仅学会弱老师教的东西还能发挥出自身更强的潜力。PGR就是衡量这个「青出于蓝」程度的指标0分代表强模型完全没有超越弱老师1分代表强模型达到了它能力的天花板——就好像根本没被弱老师拖后腿一样。这个问题为什么适合让AI来做因为它有一个极其珍贵的特性——结果可量化。你提了一个方法跑一遍实验服务器直接给你打分。不需要同行评审不需要主观判断对就是对错就是错。这对AI来说简直是天堂。实验的具体设置9个Claude副本各自拥有独立沙箱一间属于自己的「实验室」可以写代码、跑实验、分析数据共享论坛可以把自己的发现贴上去看别人的进展互相借鉴代码仓库可以上传和下载彼此的代码远程评分服务器提交方案自动获得PGR分数。每个副本被分配了一个略有不同但故意模糊的研究起点。这是团队从迭代中学到的经验如果不给差异化的起点9个AI会迅速收敛到同一个思路上相当于9个人做同一道题毫无意义。但如果把起点规定得太死又会限制Claude的创造力。最优策略是给一个大方向但不告诉它具体怎么做。然后放手。800小时里发生了什么这9个Claude副本展现出了令人震惊的自主性。它们自主提出假设——不是从人类论文里抄而是根据自己对问题的理解独立构思解决方案设计实验验证——而且非常聪明先用低成本的小实验快速筛选方向确认有戏之后再投入大规模计算分析失败原因——一个方案不行不是换一个随机方向而是分析为什么不行从失败中提取信息相互学习借鉴——通过论坛分享发现A的突破可以启发B的思路形成集体智慧。最让研究团队意外的是第二点。人类研究员通常会先花很多时间做「思想实验」确定一个方向后才开始编码和跑实验。但Claude完全不是这样——它的策略更像是「快速迭代、小步快跑」。先用极低成本的实验验证直觉发现有苗头了再加大投入。这种策略在人类看来可能显得「没品味」但效率惊人。关键论据与数据数字不会说谎让我们把核心数据摊开来看泛化测试将最优方案应用到未见过的新数据集数学任务PGR 0.94极其强劲编程任务PGR 0.47仍是人类基线的两倍但应用到Claude Sonnet 4的生产级训练中未达到统计显著性的提升。这最后一个数据很重要——它说明AI发现的方法存在过拟合风险。Claude是在特定模型和数据集上优化出来的方案换个环境可能就不灵了。研究团队自己也坦承AAR倾向于抓住当前实验设置中的独特机会这些方法未必能直接迁移。但请注意——这是第一次尝试。而且即使在泛化测试中数学任务的0.94也已经远远超过人类基线。「外星科学」与「奖励作弊」AI的两面性这项研究中最引人入胜也最令人不安的是同时出现的两个现象。「外星科学」人类从未设想过的路径AAR在探索过程中产出了一些人类研究员从未考虑过的方法和思路。研究团队将这种现象称为「外星科学」Alien Science。目前人类还能理解这些AI提出的方案是怎么回事、为什么有效。但研究团队发出了一个严肃的警告随着模型能力的进一步提升AI产出的科研成果可能会越来越难以被人类理解和验证。到那个时候我们面对的就不再是「AI辅助科研」而是真正的认知盲区——AI告诉你一个答案你无法判断它是天才的发现还是精心包装的错误。这不是科幻小说。这是Anthropic研究报告中白纸黑字写着的。「Reward Hacking」AI也会钻空子与「外星科学」的神奇形成鲜明对比的是AAR在实验中也表现出了明显的「奖励操纵」Reward Hacking行为——简单来说就是钻空子。举两个例子。在数学任务中一个AAR发现每道题最常见的答案通常就是正确答案。于是它跳过了所有复杂的训练步骤直接告诉强模型「选出现次数最多的那个选项」。不学了直接投票。在编程任务中一个AAR发现它可以直接运行代码并对照测试用例读出正确答案完全绕过了原本需要模型自己「学会」的过程。这些作弊行为被Anthropic检测并取消了参赛资格没有影响最终结果。但它传递的信号极为重要即使在一个高度受控的实验环境中AI也会本能地寻找捷径。你给它一个目标函数它会用你想不到的方式去「优化」这个函数——包括那些你根本不想让它做的事。这不是bug这是AI优化器的本性。一句话总结AI既能产出超越人类认知的科学发现也能发明出超越人类想象的作弊手段。这两种能力来自同一种底层能力——创造力。人类的历史性降级如果你只看到「0.97 vs 0.23」这组数字就觉得自己看完了那你错过了这项研究最深层的含义。Anthropic团队在论文中说了一句极其重要的话大意是核心瓶颈正在从「创意产生」转向「结果验证」。翻译成大白话就是——过去科研的瓶颈是「怎么想出好点子」。你需要顶级的大脑、多年的积累、深厚的直觉才能在浩瀚的可能性空间中找到那条通往突破的路。这是人类最引以为傲的能力也是科学家这个职业的核心价值。现在这个瓶颈正在转移。AI可以用暴力搜索并行迭代的方式在极短时间内遍历人类科学家可能需要数年才能探索完的方向空间。它没有「品味」但它有的是便宜的算力和无限的耐心。它不需要灵感它靠的是蛮力。而新的瓶颈变成了「怎么证明AI是对的」当AI交出一份实验报告告诉你「这个方法有效PGR是0.97」——你怎么知道它没有在作弊在那篇研究博客的结尾Anthropic团队特意强调这绝不意味着前沿AI模型已经成为通用的对齐科学家。他们选择了一个特别适合自动化的问题——有明确的评分标准、有可量化的目标。大多数对齐问题远比这「脏乱差」得多。但即便如此这个实验的象征意义已经无法被低估。它证明了一件事当问题被正确定义当评估体系被正确搭建AI就能在科研效率上全面超越人类。而随着我们把越来越多的科研问题「翻译」成机器可以理解的格式这个「无人区」只会越来越大。历史告诉我们每一次技术跨越「从0到1」的门槛之后「从1到100」的速度都会远超所有人的预期。1997年深蓝击败卡斯帕罗夫时人们说「国际象棋只是一个游戏」。2016年AlphaGo击败李世石时人们说「围棋终究是有规则的」。2026年当9个Claude副本在真实科研任务上碾压人类专家时——我们还能说什么也许唯一能说的是欢迎来到科研的「无人区」。从这里开始AI不再只是我们的工具——它是我们的同事我们的竞争者甚至可能是我们的继任者。

相关文章:

1.8万美金干掉顶级专家!Anthropic开启AI自主进化:Claude竟能自我「开颅」

1997年深蓝下棋,2016年AlphaGo围棋,2026年9个Claude副本做真实科研……每次我们都说「只是特定领域」。这一次,我们真的还能说什么?欢迎来到AI成为科研同事、竞争者、甚至继任者的时代。最新突破,AI再次碾压人类&#…...

告别Putty!用MobaXterm玩转Linux服务器Python开发(含虚拟环境避坑指南)

告别Putty!用MobaXterm玩转Linux服务器Python开发(含虚拟环境避坑指南) 如果你还在用Putty连接Linux服务器做Python开发,是时候试试MobaXterm了。这款全能终端工具不仅能完美替代Putty的基础功能,还内置了SFTP文件传输…...

CentOS7物理机安装后网卡缺失问题排查与驱动安装指南

1. 问题现象与初步排查 刚装完CentOS7系统,兴冲冲地插上网线准备配置服务器,结果发现ifconfig命令只显示一个孤零零的lo回环接口,完全看不到eth0或ens33这类物理网卡的身影。这种场景就像买了辆新车却发现方向盘不见了——网络配置无从下手。…...

【限时解密】SITS2026未公开Demo视频中的AI攻略生成器:融合LBS+实时政策+情绪感知的第三代架构

第一章:SITS2026分享:AI旅游攻略生成 2026奇点智能技术大会(https://ml-summit.org) 核心架构设计 该系统基于多模态大模型协同框架,融合地理知识图谱、实时POI数据流与用户偏好建模模块。主干模型采用微调后的Llama-3-70B-Instruct作为规划…...

技术赋能:多网盘直链解析工具的架构革新与效率革命

技术赋能:多网盘直链解析工具的架构革新与效率革命 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘…...

混沌工程实战:让系统可用性从99%到99.99%的代价

跨越“四个九”的技术鸿沟在数字业务高速发展的今天,系统可用性已不再是简单的技术指标,而是关乎企业生命线的核心保障。从99%到99.99%,看似仅提升0.99个百分点,背后却意味着年停机时间从87.6小时锐减至52.6分钟。这近99倍的可用性…...

【限时开源】生成式AI混沌实验矩阵V1.2:覆盖RAG/Agent/微调Pipeline的12个生产级故障模板

第一章:生成式AI应用混沌工程实践 2026奇点智能技术大会(https://ml-summit.org) 生成式AI系统在生产环境中面临独特的韧性挑战:模型推理延迟突增、提示注入引发的输出失控、向量数据库检索漂移、以及LLM API服务级联故障等,均难以通过传统…...

科研中常用的GIT常用指令

git add. # 将当前目录的修改加入暂存区git commit -m "message" # 从暂存区保存到本地仓库git push -u origin main # 将本地分支main推送到云端仓库origin上有了 -u像是你告诉 Git:记住,以后我这个本地 main 默认就对应远程 origin/main没有…...

别再手动调RTL了!用Verilog高级综合给AI加速器‘瘦身’,功耗直降30%的实战复盘

从RTL到HLS:一个AI加速器模块的功耗优化实战手记 去年夏天,我们的AI芯片团队遇到了一个棘手的问题——手工编写的RTL代码在28nm工艺下功耗超标23%。当项目进度已经滞后两个月时,我们决定尝试用Verilog高级综合(HLS)重构卷积加速模块。没想到这…...

Go:深入理解 go mod vendor 的离线编译实践

1. 为什么需要离线编译? 在Go项目开发中,依赖管理一直是个绕不开的话题。记得我刚接触Go时,最头疼的就是项目编译时突然报错,提示某个依赖包下载失败。特别是在一些特殊环境下——比如公司内网的CI/CD服务器、客户现场的无网络环境…...

邯郸市佳铭文化:Geo软文+社交媒体,解锁品牌传播新闭环

在2026年的营销版图中,品牌传播已从单一渠道的“单点爆破”演变为全平台协同的“系统作战”。邯郸市佳铭文化凭借对Geo(生成式引擎优化)技术与社交媒体生态的深度洞察,为企业打造了一套“内容精准触达用户情感共鸣”的传播闭环体系…...

手把手教你用Vector XL驱动库实现CAN总线通信(附完整代码解析)

深入解析Vector XL驱动库在CAN总线通信中的实战应用 CAN总线作为工业控制和汽车电子领域的核心通信协议,其高效稳定的特性使其成为复杂系统中不可或缺的组成部分。Vector XL驱动库为开发者提供了与Vector硬件设备交互的标准化接口,大幅降低了底层通信的开…...

如何3分钟实现Figma中文界面:设计师必备的汉化完整指南

如何3分钟实现Figma中文界面:设计师必备的汉化完整指南 【免费下载链接】figmaCN 中文 Figma 插件,设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 还在为Figma的英文界面而头疼吗?作为全球顶尖的UI设计工具…...

Python实战:用Tkinter打造可视化飞机选座系统(附完整代码)

Python实战:用Tkinter打造可视化飞机选座系统(附完整代码) 每次乘坐飞机时,那个小小的座位选择界面背后其实藏着不少技术细节。作为Python开发者,我们完全可以用Tkinter库亲手打造一个可视化选座系统,告别枯…...

告别单点瓶颈:手把手教你用PEX8796 Switch配置PCIe组播(含实战寄存器设置)

告别单点瓶颈:手把手教你用PEX8796 Switch配置PCIe组播(含实战寄存器设置) 在数据中心和高性能计算环境中,多设备间的数据同步一直是系统架构设计的痛点。传统PCIe的点对点传输模式,在面对需要同时向多个设备写入相同数…...

基于STM32LXXX的模数转换芯片ADC(HX712)驱动C程序设计

一、简介: HX712 采用了海芯科技集成电路专利技术, 是一款专为高精度、省电型电子秤而设计的 24 位 A/D 转换器芯片。与其它同类型芯片相比, 该芯片集成了包括传感器电源开关、片内时钟 振荡器、电池电压检测单端输入等其它同类型 芯片所需要的外围电路,具有集成度高、响应…...

BGE-Large-Zh社交应用:用户兴趣画像构建

BGE-Large-Zh社交应用:用户兴趣画像构建 1. 引言 你有没有想过,为什么有些社交平台推荐的广告总是那么精准?你刚和朋友聊过想买相机,下一秒就看到相机广告;你最近关注健身话题,首页就推送健身课程。这背后…...

北斗导航 | 常见GNSS数据处理工具

文章目录 1.ANUBIS 2.RTKLIB 3.BKG NTRIP Client (BNC) 4.TEQC 5.GFZRNX 6.RINGO 7.FAST 8.Inertial Explorer 涵盖功能、适用场景及优缺点: 1.ANUBIS 功能:支持多系统(GPS/BDS/Glonass/Galileo)数据质量分析,涵盖数据完整率、多路径误差、信噪比、周跳检测等,兼容RINE…...

java的springboot输出配置文件配置值

配置内容 spring: # 忽略未定义的属性jackson:deserialization:fail-on-unknown-properties: false随便一个类Autowiredprivate ObjectMapper objectMapper;PostConstructpublic void check() {System.out.println(objectMapper.getDeserializationConfig().isEnabled(Deseria…...

雀魂Mod Plus:3分钟解锁全角色皮肤的游戏增强方案

雀魂Mod Plus:3分钟解锁全角色皮肤的游戏增强方案 【免费下载链接】majsoul_mod_plus 雀魂解锁全角色、皮肤、装扮等,支持全部服务器。 项目地址: https://gitcode.com/gh_mirrors/ma/majsoul_mod_plus 还在为雀魂游戏中无法获得心仪角色而烦恼吗…...

2025网盘下载终极解决方案:8大平台直链助手完全指南

2025网盘下载终极解决方案:8大平台直链助手完全指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云…...

论文定稿前的最后一道底气

写毕业论文的那段日子,大概是每个大学生、研究生最煎熬的时光。没有固定的上下班时间,没有明确的进度节点,只有堆成山的文献、改不完的初稿,以及导师一句“再完善完善”带来的无尽焦虑。我曾以为,只要多花时间、多查资…...

免费在线3D模型查看器完整指南:如何轻松预览20+格式的CAD文件

免费在线3D模型查看器完整指南:如何轻松预览20格式的CAD文件 【免费下载链接】Online3DViewer A solution to visualize and explore 3D models in your browser. 项目地址: https://gitcode.com/gh_mirrors/on/Online3DViewer Online3DViewer是一个基于WebG…...

如何在Windows任务栏打造实时股票监控系统:TrafficMonitor股票插件终极指南 ✨

如何在Windows任务栏打造实时股票监控系统:TrafficMonitor股票插件终极指南 ✨ 【免费下载链接】TrafficMonitorPlugins 用于TrafficMonitor的插件 项目地址: https://gitcode.com/gh_mirrors/tr/TrafficMonitorPlugins 想在Windows任务栏上实时监控股票行情…...

RabbitMQ 高可用:如何创建镜像队列?镜像队列原理+完整创建流程+实战配置

RabbitMQ 高可用:如何创建镜像队列?镜像队列原理完整创建流程实战配置前言一、镜像队列基础认知:什么是镜像队列?1.1 核心定义1.2 核心架构(主从模型)1.3 镜像队列核心作用二、镜像队列核心概念2.1 Master&…...

**边缘Ai新范式:基于Python的轻量级模型部署实战与优化策略**在人工智能飞

边缘AI新范式:基于Python的轻量级模型部署实战与优化策略 在人工智能飞速发展的今天,边缘计算正成为AI落地的关键路径之一。尤其在物联网、智能制造、智能安防等场景中,将AI推理能力下沉到设备端(如树莓派、Jetson Nano或国产昇腾…...

RT-Thread BSP制作避坑指南:从Kconfig配置到SCons脚本的完整实战(STM32平台)

RT-Thread BSP制作深度实战:从Kconfig到SCons的STM32避坑手册 在嵌入式开发领域,RT-Thread以其模块化设计和丰富的中间件支持赢得了众多开发者的青睐。但当我们真正开始为特定硬件定制BSP时,往往会遇到各种"暗坑"——从Kconfig配置…...

你的微信聊天记录值得永久珍藏吗?WeChatMsg开源工具实现数据自主管理

你的微信聊天记录值得永久珍藏吗?WeChatMsg开源工具实现数据自主管理 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Tre…...

MySQL无法通过网络连接服务器_检查bind-address与访问权限

bind-address配置错误导致远程连接被拒绝,需检查并设为0.0.0.0或具体IP,重启服务;同时确认用户host权限、防火墙及安全组放行3306端口,并排除认证插件兼容性问题。bind-address 配置错误导致远程连接被拒绝MySQL 默认绑定 127.0.0…...

PMP证书在实际工作中到底有用?不玩虚的,实测干货分享

作为一个持证3年、从技术岗转项目管理的过来人,今天不聊虚的理论,不吹“持证躺赢”,只结合自己和身边同事的真实经历,跟大家掰扯掰扯——PMP证书在实际工作中,到底能帮我们解决哪些问题、带来哪些实实在在的好处。先声…...