李飞飞亲自撰文:大模型不存在主观感觉能力,多少亿参数都不行
近日,李飞飞连同斯坦福大学以人为本人工智能研究所 HAI 联合主任 John Etchemendy 教授联合撰写了一篇文章,文章对 AI 到底有没有感觉能力(sentient)进行了深入探讨。
「空间智能是人工智能拼图中的关键一环。」知名「AI 教母」李飞飞曾这样表示。
近段时间,李飞飞开始把目光瞄准到这一领域,并为此创建了一家初创公司。她曾表示,「大自然创造了一个以空间智能为动力的观察和行动的良性循环。」她所在的斯坦福大学实验室正在尝试教计算机「如何在三维世界中行动」,例如,使用大型语言模型让一个机械臂根据口头指令执行开门、做三明治等任务。
我们不难看出,李飞飞口中的空间智能也有大模型的参与。
如今,随着技术的发展,LLM 在多个方面表现出超人类智能。然而关于 LLM 的争议也在不断增加,其中,LLM 到底有没有感觉能力,大家意见不一而论。
近日,李飞飞连同斯坦福大学以人为本人工智能研究所 HAI 联合主任 John Etchemendy 教授联合撰写了一篇文章,文章对 AI 到底有没有感觉能力(sentient)进行了深入探讨。
本文中,我们把 sentient 一词翻译成感觉,因为 AI 领域感知一词通常对应 perception,也不适合翻译成意识。读者们有合适的翻译可以留言讨论。
文中驳斥了 LLM 有感觉的说法,李飞飞列举了大量示例来证明这一观点。
在提到超级计算机深蓝时,李飞飞表示,虽然这款下棋程序可以击败世界冠军,但如果房间突发意外情况如着火,深蓝不会有停止游戏的意识,而人类会有。
同样的,当人类产生饥饿说出「我饿了」时,人类和 LLM 背后所隐藏的行为链条是完全不同的。LLM 只是产生「我饿了」这个字符串的事实,它没有身体,甚至不可能有饥饿那种感觉。
更进一步的,李飞飞认为人类饥饿时,伴随一系列生理反应,如低血糖、肚子叫等,而 LLM 无法拥有这些状态的主观经验,即无法有感觉能力,只是在概率性地完成任务而已。
人类有物理躯体,可以感觉一切,但 LLM 没有,当 LLM 说出类似的「自己脚趾痛」时,大家都不会相信,因为它根本就没有脚趾,它只是一个编码在硅片上的数学模型。
李飞飞驳斥 LLM 具有感觉能力
通用人工智能(AGI)是用来描述一种至少与人类在各种方面表现出相同智能的人工智能体的术语,涵盖人类所展示(或能够展示)的所有智能方式。这是我们曾经称之为人工智能的概念,直到我们开始创建在有限领域表现出智能的程序和设备 —— 如下棋、语言翻译、清洁客厅等。
增加「G」这个字母的必要性来自于由人工智能驱动的系统的普及,但这些系统只专注于单一或极少数任务。
IBM 的深蓝是一款令人印象深刻的早期下棋程序,它可以击败世界冠军 Garry Kasparov,但如果房间着火了,它却不会有停止游戏的意识。
图为 Garry Kasparov 和深蓝团队的 Joe Hoane 在 1997 年纽约市的复赛场景,最终在六局复赛中击败了 Garry Kasparov,赢得了其中的两局并有三局打成平手。
现在,通用智能有点像一个神话,至少如果人们认为自己拥有它的话。
人类可以在动物界找到许多智能行为的例子,它们在类似任务上的表现远比人类本身表现更好。智能并非完全通用,但足以在大多数环境中完成人们想要完成的事情。
如果当人类感到饥饿时,可以找到附近的超市;当房间着火时,则会自主地寻找出口。
智能的基本特征之一是「感觉」,即拥有主观经验的能力 —— 比如感受饥饿、品尝苹果或看到红色是什么样的。
感觉是通往智能的关键步骤之一。
于 2022 年 11 月发布的 ChatGPT,标志着大型语言模型(LLMs)时代的开始。
这立即引发了一场激烈的争论,所有人都在讨论这些算法是否实际上具有感觉能力。以 LLM 为基础的人工智能具有感觉能力的可能性引发了媒体狂热,也深刻影响了全球一些政策制定的转向,以规范人工智能。
最突出的观点是,「有感觉的人工智能」的出现可能对人类非常危险,可能带来「灭绝级」的影响或至少是「存在危机」的。毕竟,一个有感觉的人工智能可能会发展出自己的希望和欲望,而不能保证它们不会与人们相冲突。
李飞飞和 Etchemendy 的主要观点是反驳「有感觉的人工智能」阵营最常提出的辩护,而该辩护基于 LLMs 可能已经有了「主观经验」的能力。
John Etchemendy 曾担任斯坦福大学语言与信息研究中心的主任、哲学系主任,以及人文与科学学院的高级副院长,并且是斯坦福人工智能研究所的联合主任。
为什么有些人认为 AI 已经获得了感觉能力
在过去的几个月里,他们俩与 AI 领域的许多同行进行了激烈的辩论和交谈,包括与一些最杰出的和具有开创性的 AI 科学家进行了一对一的深入交流。
关于 AI 是否已经获得了感觉能力的话题一直是一个突出的问题。其中少数人坚信 AI 已经具有了感觉能力。以下是其中一位最为积极支持者的论点要点,相当程度上代表了「有感觉的 AI」阵营的观点:
AI 是有感觉的,因为它能报告主观经验。主观经验是意识的标志,其特征在于能够认知自我所知或所感。例如,当你说『我在吃过一顿美味的饭后感到高兴』时,我作为一个人实际上没有直接证据感觉你的主观体验。但既然你这样表达了,我会默认相信你确实经历了这种主观体验,因此你是有意识的。这种逻辑也被用来推论 AI 的意识状态。
现在,让我们将同样的『规则』应用到 LLMs 上。就像任何人一样,我无法访问 LLMs 的内部状态。但我可以查询它的主观经验。我可以问『你感到饥饿吗?』它实际上可以告诉我是或否。此外,它还可以明确地与我分享它的『主观经验』,几乎涉及任何事情,从看到红色到吃完饭后感到幸福。因此,我没有理由不相信它是有意识的或不知道自己的主观经验,就像我没有理由不相信你是有意识的一样。在这两种情况下,我的证据完全相同。
为什么「AI 有感觉能力」是错误的
虽然乍看之下这个论点似乎有道理,但实际上是错误的。因为李飞飞和 Etchemendy 教授的证据在这两种情况下并不完全相同。甚至差距很大。
当你说「我饿了」时,我得出你正在经历饥饿的结论是基于一系列大量的情况。首先,是你的报告 —— 你说的话,可能还包括其他行为证据,比如你的肚子咕咕叫。其次,是没有相反证据的存在,比如如果你刚吃完五道菜的大餐就不太可能会说饿。最后,也是最重要的,是你拥有一个像我一样的物理身体,这个身体需要定期进食和饮水,遇冷会感到寒冷,遇热会感到炎热,等等。
现在将这与他们二人对 LLM 的证据进行比较。
唯一共同的是报告 —— 即 LLM 可以产生「我饿了」这个字符串的事实。但相似之处就到此为止了。事实上,LLM 没有身体,甚至不会有感到饥饿那种感觉。
如果 LLM 说:「我的左大脚趾很疼」,人们会得出它左大脚趾确实很疼的结论吗?答案是否定的,因为它根本就没有左大脚趾。
同样地,当它说它饿了时,人们实际上可以确定它并不饿,因为它没有感到饥饿所必须的生理结构。
当人类感到饥饿时,会感觉到一系列生理状态 —— 低血糖、空腹发出的咕咕声等 —— 而 LLM 根本没有这些,就像它没有嘴巴放食物进去,也没有胃去消化食物一样。
认为人们应该相信它说自己饿了的观点,就像是在说应该相信它说自己正在从月球的暗面跟使用者说话一样荒谬。
人们知道这不是真的,LLM 的主张也无法改变这个事实。
所有感觉 —— 饥饿、感到疼痛、看到红色、爱上某人 —— 都是由 LLM 根本没有的生理状态引起的。
因此,LLM 无法拥有这些状态的主观经验。
换句话说,它无法有感觉能力。
LLM 只是一个编码在硅片上的数学模型。
它不像人类那样是一个具有身体的存在。它没有需要进食、饮水、繁殖、经历情感、生病和最终死亡的「生命」。
当人类和 LLM 同样地说出「我饿了」时,背后所隐藏的行为链条是完全不同的。
理解人类生成词序列的方式与 LLM 生成相同词序列的方式之间的深刻差异至关重要。
当人们说「我饿了」时,是在报告感觉生理状态。
而当一个 LLM 生成序列「I am hungry」时,它只是生成当前提示中最可能的完成序列。它做的事情与在不同提示下生成「I am not hungry」或在另一个提示下生成「The moon is made of green cheese」时完全相同。
这些都不是它本就不存在的生理状态的报告,它们只是在概率性地完成而已。
很遗憾的是,具有感觉能力的人工智能时代还尚未到来。
两位作者认为研究者还没有实现有感觉的人工智能,而更大型的语言模型也不会使人们实现这一目标。
如果人类想在人工智能系统中重新创建这种现象,就需要更好地理解有感觉的生物系统中感觉是如何产生的。
人们不会在下一个 ChatGPT 的迭代中偶然发现感觉。
在李飞飞转发的 X(原推特)下面,大家讨论的也是非常激烈,有人表示:「当今的 LLM 有两种类型:一种是完全基于文本进行训练,另一种则是基于图像、文本甚至音频进行训练。第一种类型确实不具备所谓的感觉能力,但第二种类型具有物理直觉,因此可以说它具有感觉能力。」
而另一位网友则追随 Lecun 的脚步,表示:「一只喵星人的智能程度都远高于最大型的 LLM。」
相关文章:

李飞飞亲自撰文:大模型不存在主观感觉能力,多少亿参数都不行
近日,李飞飞连同斯坦福大学以人为本人工智能研究所 HAI 联合主任 John Etchemendy 教授联合撰写了一篇文章,文章对 AI 到底有没有感觉能力(sentient)进行了深入探讨。 「空间智能是人工智能拼图中的关键一环。」知名「AI 教母」李…...
超级好用的C++实用库之套接字
💡 需要该C实用库源码的大佬们,可搜索微信公众号“希望睿智”。添加关注后,输入消息“超级好用的C实用库”,即可获得源码的下载链接。 概述 C中的Socket编程是实现网络通信的基础,允许程序通过网络与其他程序交换数据。…...

C++ | Leetcode C++题解之第108题将有序数组转换为二叉搜索树
题目: 题解: class Solution { public:TreeNode* sortedArrayToBST(vector<int>& nums) {return helper(nums, 0, nums.size() - 1);}TreeNode* helper(vector<int>& nums, int left, int right) {if (left > right) {return nu…...
5月27日,每日信息差
第一、韩国宇宙航空厅于 5 月 27 日正式成立,旨在推动以民间为主的太空产业生态圈发展,助力韩国成为航天强国。首任厅长尹宁彬表示,该机构将在庆尚南道泗川市的临时大楼开展相关工作。 第二、京东集团宣布,自2024年7月1日起&…...

echart扩展插件词云echarts-wordcloud
echart扩展插件词云echarts-wordcloud 一、效果图二、主要代码 一、效果图 二、主要代码 // 安装插件 npm i echarts-wordcloud -Simport * as echarts from echarts; import echarts-wordcloud; //下载插件echarts-wordcloud import wordcloudBg from /components/wordcloudB…...
解决无法直接抓取链接地址
当我们在爬取一些文章列表的时候,可能无法从接口或者html界面上获取到文章的详细列表 这个时候我们可以通过模拟点击且重写window.open方法,将跳转的地址捕获,并且放到html中去。 这样我们就可以获取到某个文章的详细地址了 // 保存原始的 …...

java面对对象编程-多态
介绍 方法的多态 多态是在继承,重载,重写的基础上实现的 我们可以看看这个代码 package b;public class main_ {public static void main(String[] args) { // graduate granew graduate(); // gra.cry();//这个时候,子类的cry方法就重写…...

【Sql Server】随机查询一条表记录,并重重温回顾下自定义函数的封装和使用
大家好,我是全栈小5,欢迎来到《小5讲堂》。 这是《Sql Server》系列文章,每篇文章将以博主理解的角度展开讲解。 温馨提示:博主能力有限,理解水平有限,若有不对之处望指正! 目录 前言随机查询语…...

基于C#开发web网页管理系统模板流程-主界面管理员录入和编辑功能完善
前言 紧接上篇->基于C#开发web网页管理系统模板流程-登录界面和主界面_c#的网页编程-CSDN博客 已经完成了登录界面和主界面,本篇将完善主界面的管理员录入和编辑功能,事实上管理员录入和编辑的设计套路适用于所有静态表的录入和编辑 首先还是介绍一下…...

K8s证书过期处理
问题描述 本地有一个1master2worker的k8s集群,今天启动VMware虚拟机之后发现api-server没有起来,docker一直退出,这个集群是使用kubeadm安装的。 于是kubectl logs查看了日志,发现证书过期了 解决方案: 查看证书 #…...

刷题之路径总和Ⅲ(leetcode)
路径总和Ⅲ 这题和和《为K的数组》思路一致,也是用前缀表。 代码调试过,所以还加一部分用前序遍历数组和中序遍历数组构造二叉树的代码。 #include<vector> #include<unordered_map> #include<iostream> using namespace std; //Def…...
MongoDB 原子操作:确保数据一致性和完整性的关键
在 MongoDB 中,原子操作是指可以一次性、不可分割地执行的数据库操作。这些操作能够保证在多个并发操作中不会出现数据不一致或者丢失的情况,确保数据库的数据完整性和一致性。 基本语法 MongoDB 的原子操作通常与更新操作相关,其基本语法如…...
2024上半年软考高级系统架构设计师回顾
本博客地址:https://security.blog.csdn.net/article/details/139238685 2024年上半年软考在5月25-26日举行,趁着时间刚过去记忆还在,简单写一点总结。 关于考试形式:上机考试(以后也都是机考)࿰…...
SQL注入绕过技术深度解析与防御策略
引言 在Web安全领域,SQL注入攻击一直是一个棘手的问题。攻击者通过SQL注入手段获取敏感数据、执行恶意操作,甚至完全控制系统。尽管许多防御措施已被广泛采用,但攻击者仍不断开发新的绕过技术。本文将深度解析SQL注入的绕过技术,…...
Redis教程(十六):Redis的缓存穿透、缓存击穿、缓存雪崩
传送门:Redis教程汇总篇,让你从入门到精通 缓存穿透 描述 用户需要查询一个数据,例如要查一张ASSET_CODE 999999的卡片,查询redis中没有,就直接去请求数据库,数据库中也不存在对应的数据,返回…...
如何实现一个高效的单向链表逆序输出?
实现单向链表逆序输出的关键点有两个: 反转链表本身 遍历反转后的链表并输出首先,我们来看如何反转链表: class Node:def __init__(self, data):self.data dataself.next Nonedef reverse_list(head):"""反转单向链表"""prev Nonecurrent h…...
使用 Go 实现 HelloWorld 程序,并分析其结构
在学习任何新的编程语言时,编写一个 “Hello, World” 程序通常是最初的入门步骤。这不仅是一个传统,也是一种快速了解语言基本语法和运行机制的有效方法。对于 Go 语言,这个过程不仅可以帮助新手快速入门,还提供了一个窗口&#…...
机器学习:在Python中sklearn库的使用,纯干货!12个小时的整理!
无监督学习是在没有标签的数据上训练的。其主要目的可能包括聚类、降维、生成模型等。 以下是 6 个重要的无监督学习算法,这些算法都可以通过使用sklearn(Scikit-learn)库在Python中很好地处理: 目录 K-Means 聚类 层次聚类 …...
XSS 攻击
XSS 攻击简介 定义: XSS(跨站脚本攻击)是一种网络安全漏洞,攻击者通过在 Web 页面中注入恶意代码,利用用户的浏览器执行这些恶意脚本,从而实施攻击。 解决方案: 过滤用户输入: 对…...
.Net Core 中间件与过滤器
过滤器这个是.Net MVC旧有的功能,中间件这个概念是新出的, ASP.NET Core只是完成了HTTP请求调度、报文解析等必要的工作,像检查用户身份、设置缓存报文头等操作都是在中间件中完成,中间件就是ASP.NET Core的一个组件,…...
慢慢欣赏linux 之 last = switch_to(prev, next)分析
last switch_to(prev, next); 为什么需要定义last作为调用switch_to之前的prev的引用 原因如下: struct task_struct * switch_to(struct task_struct *prev,struct task_struct *next) {... ...return cpu_switch_to(prev, next);> .global cpu_switch_tocpu_…...

ubuntu 20.04挂载固态硬盘
我们有个工控机,其操作系统是ubuntu 20.04。可以接入一个固态硬盘。将固态硬盘插好后,就要进行挂载。在AI的指导下,过程并不顺利。记录如下: 1、检查硬盘是否被识别 安装好硬盘后,运行以下命令来检查Linux系统是否…...

spring中的@RabbitListener注解详解
基本用法主要属性1. queues / queueNames2. containerFactory3. id4. concurrency5. ackMode6. priority7. bindings 高级特性1. 消息转换器2. 手动确认3. 条件监听4. 错误处理 配置监听容器工厂注意事项完整示例循环依赖解决1. 使用 Setter 注入2. 使用 Lazy 注解3. 重构代码结…...
神经网络 隐藏层
神经网络中隐藏层的数量是一个超参数,其选择取决于任务复杂度、数据规模和计算资源。以下是常见的架构类型及其适用场景: 1. 单层隐藏层(浅神经网络) 结构:输入层 → 1 个隐藏层 → 输出层特点: 仅需调整…...

FPGA点亮ILI9488驱动的SPI+RGB接口LCD显示屏(一)
FPGA点亮ILI9488驱动的SPIRGB接口LCD显示屏 ILI9488 RGB接口初始化 目录 前言 一、ILI9488简介 二、3线SPI接口简介 三、配置寄存器介绍 四、手册和初始化verilog FPGA代码 总结 前言 ILI9488是一款广泛应用于嵌入式系统和电子设备的彩色TFT LCD显示控制器芯片。本文将介…...

uni-app学习笔记二十九--数据缓存
uni.setStorageSync(KEY,DATA) 将 data 存储在本地缓存中指定的 key 中,如果有多个key相同,下面的会覆盖掉原上面的该 key 对应的内容,这是一个同步接口。数据可以是字符串,可以是数组。 <script setup>uni.setStorageSyn…...
低代码平台前端页面表格字段绑定与后端数据传输交互主要有哪些方式?华为云Astro在这方面有哪些方式?
目录 🔧 一、低代码平台中常见的数据绑定与交互方式 1. 接口绑定(API 调用) 2. 数据源绑定(DataSource) 3. 变量中转(临时变量 / 页面状态) 4. 数据模型绑定(模型驱动) 🌐 二、华为云 Astro 轻应用的实现方式 ✅ 1. 数据源绑定(API服务+API网关) ✅ 2. 变…...

AUTOSAR实战教程--DoIP_02_诊断链路建立流程
第一步:DoIP实体车辆声明/诊断仪车辆识别请求 打开激活线以后,DoIP实体发的三帧车辆声明报文。其中包含了DoIP实体的诊断逻辑地址(可以类比DoCAN的物理请求/响应地址),对应车辆的VIN码(若已配置࿰…...

验证负载均衡与弹性伸缩
什么是弹性伸缩(Auto Scaling)? 弹性伸缩是指 云计算平台根据实时负载自动调整计算资源(如服务器实例、容器Pod)数量,以确保系统在高峰时保持稳定,在低谷时节省成本。 什么时候会触发弹性伸缩&…...

前后端分离开发 和 前端工程化
来源:黑马程序员JavaWeb开发教程,实现javaweb企业开发全流程(涵盖SpringMyBatisSpringMVCSpringBoot等)_哔哩哔哩_bilibili 前后端混合开发: 需要使用前端的技术栈开发前端的功能,又需要使用Java的技术栈…...