【胡乱念叨】大模型的“我”
下面的内容很有可能事实错误,胡说八道,前后不连贯,举例随意且未经考证 甚至 有意欺骗!嘻嘻。所以是【胡乱念叨】
文章目录
- 【胡乱念叨】大模型的“我”
- 参数量和“我”
- 什么是“我”
- 从输入输出的观点看“我”
- 大模型的“我”
- 乱讨论
【胡乱念叨】大模型的“我”
现在有不少人在研究大模型的人格,在讨论大模型沟通,理解的能力。很多人潜意识里,将其当成了人。
大模型貌似展现出了“我”的认知,他好像知道自己是谁,知道自己角色定位,有自我的认知,“仿佛好像”是个人。
那么,它有“我”吗?

参数量和“我”
认识“我”是个很有门槛的事情。地球上大部分动物都跨越不到这个门槛,高等动物的特权。通常来说脑连接最少的还有自我意识的动物是一些鸟类,例如乌鸦,喜鹊🐦,它们显示出了相当程度的自我意识(例如镜子测试)。
我们通常用突触的数量类比模型参数量。人脑大概有100万亿个突触连接,即使是喜鹊也有万亿的规模。如果在生物界,这万亿规模是产生“我”的门槛,那么这个数字是远超现有常见的大模型参数规模的(十亿,百亿)!
那为什么仅靠数十亿参数就能展现的像是有“我”一样,大模型展现的是 假“我” 吗? [后面没有对这个问题的回答]
更何况,自然生物的学习效率远比模型高。对于参数的利用效率上,生物早已站在了scaling law圣经的左下角,突破了大模型训练中跨越不过的天堑。

什么是“我”
啰里八嗦一堆,什么是“我”都还没交代和讨论呢!
什么是“我”? 这个问题可难回答了!
不妨反过来问:什么不是“我”?
你什么时候觉得你不是你? 这个问题好回答的多!
一句话回答:当你不清楚你自己(或者一部分自身)的状态的时候,你便觉得你不是你。
例如:(1)睡觉的时候压着胳膊了,麻了,想抬起来却抬不起来,你感觉你的手臂不是你的。 (2)鬼压床了,想翻身翻不了,你觉得身体好像不是自己的。 (3)你迷迷糊糊不小心带着包装袋把面条下进了锅里,回过神来,啊我做了什么?刚才的我好像不是我 …
“我”是对自身状态的预测! (1)我想抬起胳膊,神经给出命令,胳膊被观察(感知)到抬起来了-> 胳膊是我;(2)我想煮面吃饭,面顺利煮好了->行为被我执行了。
正因“我”是对自身状态的预测,所以“我”很容易被欺骗。实验可以通过伪造迎合你对自身状态的预测从而轻易欺骗你对自我的判断。例如“橡皮手错觉”(Rubber Hand Illusion)

(从进化论看“我”的视角,为什么有我,因为感受自身和预测自身,能帮助生物在捕食和被捕食的关系中更具竞争力)
从输入输出的观点看“我”
前面说,我是对自身状态的“预测”,从流程上来看是这样的:
step 1: 观察到周围世界的变化/自身做出某种举动去改变世界
step 2:预测这种举动对自身的影响/预测其对周围世界的影响
step 3: 感受到自身的变化符合预测结果/观察世界的变化符合预期
step 4: 由于符合预测,于是我感受我
从输入输出来看:
简单summary:
输入:自身状态,世界状态
输出:可能未来自身状态,可能未来世界状态,主观能动的干扰
额外:有度量能力判断是否“符合”
大模型的“我”
在上面的关系图里,我尝试自己胡乱“匹配”一下,当前大模型在什么位置!
前提先明确大模型工作在对话场景中,对话场景即大模型的世界结构。
输入内容:
- 世界状态:很明确,就是对话另一方的输入,大模型可以通过模型的输入清晰的感知
- 自身状态:不明确大模型的自身状态是什么。由于自身状态是变化的,大模型参数又是固定不变的,可变的自身状态就得是其缓存的KV Cache? 那这如何感受?又如何预测?
输出内容:
- 主观的干预:很明确,接对方的话就是干预过程
- 可能的未来自身状态:不明确,原因和输入内容不明确自身状态相同。
- 可能的未来世界状态:能够预测!! 思考到这一点我觉得很有意思也很重要。大模型拥有对自身干预对世界状态影响的预测能力(有点饶舌)。 这是由于大模型的训练过程中在预训练之后,那些用于对话的模型会再次经历一轮在对话场景的微调。
这些数据大概长这样:[start] User: How are you? [sep] Agent: I am fine, thank you [sep] User: I am fine, too.
我认为:当大模型在多于一个来回的对话序列中训练时,能拥有对自身干预对世界状态影响的预测能力。 例如,上面的例子中,Causal Language Model的损失函数是有学习如果自身进行了“ I am fine, thank you ”的干预后,世界会如何回应(“I am fine, too”)
额外内容:有度量能力判断是否“符合”?貌似没有,我更偏向于,这是一个强化学习/Online learning应当讨论的问题。如果只从训练的角度,它貌似部分和输出内容中对可能未来世界状态的预期重叠。从实际的角度来看,我是一个动态的概念,那应该要动态的判断是否“符合”,这个“符合”与否的结果应当参与模型“我”的动态变化(光想想就是相当有难度的问题!)。
标注在图上(使用红色和蓝色分别标注明确有的能力和不明确的能力):
乱讨论
- 貌似,在对话场景中,大模型好像有了一部分“我”的成因,已经足够表现的像“我”了。
- 按照之前的瞎说,模型的“我”的认知,应该是在第一阶段预训练之后才被赋予的!这一点貌似有验证的可能。如果设计一个方法去度量模型的“我”的成分:如果前面的说法有点道理的话,llama-base应当无“我”,而llama-chat应当有“我”。
- 大模型结构设计真的没空间了吗?大模型如何感受自我状态?如何动态的“符合?”预测状态和真实状态?(btw: 我依旧不认为模型串行是最优的,我可能prefer浅层的并行的模型,这样不同的part可以更好的并行执行他们的任务如预测/符合/感受,而且在上一篇文章中我提到人的大脑能够独立并协同工作也是正常人抑制幻觉的重要能力的想法,而且我还觉得这样更容易做到节能,嘻嘻)
- 扯淡完毕~
相关文章:
【胡乱念叨】大模型的“我”
下面的内容很有可能事实错误,胡说八道,前后不连贯,举例随意且未经考证 甚至 有意欺骗!嘻嘻。所以是【胡乱念叨】 文章目录 【胡乱念叨】大模型的“我”参数量和“我”什么是“我”从输入输出的观点看“我”大模型的“我”乱讨论 …...
Flag_AGtivity_clear_top网页编程指南如何退出多activity程序
activity的启动模式:FLAG_ACTIVITY_CLEAR_TOP和FLAG_ACTIVITY_REORDER_TO_FRONT。 1. 如果已经启动了四个Activity:A,B,C和D。在D Activity里,我们要跳到B Activity,同时希望C finish掉,可以在start…...
克隆centos网卡uuid相同如何修改
在克隆CentOS系统后,网卡的UUID相同会导致网络配置冲突,使得网络无法正常工作。要解决这个问题,你需要为每个克隆的系统生成新的UUID。 以下是解决步骤: 进入原始CentOS系统。 找到网络配置文件的位置,通常在 /etc/s…...
C语言习题~day11
1、C程序常见的错误分类不包含:( ) A.编译错误 B.链接错误 C.栈溢出 D.运行时错误 栈溢出是运行时错误的一种,因此C程序不会将栈溢出错误单独列出来,栈溢出包含在运行时错误中。 因此:选择C 2、关于VS调…...
Ansible——Playbook基本功能???
文章目录 一、Ansible Playbook介绍1、Playbook的简单组成1)“play”2)“task”3)“playbook” 2、Playbook与ad-hoc简单对比区别联系 3、YAML文件语法:---以及多个---??使用 include 指令 1. 基本结构2. 数…...
多线程学习篇一:启动多线程的三种方式
1. 继承 Thread 类 Slf4j public class MyThread extends Thread {Overridepublic void run() {log.info("MyThread run ...");}public static void main(String[] args) {MyThread myThread new MyThread();myThread.start();} } 2. 实现 Runnable 接口 Slf4j pu…...
【专题】2024跨境出海供应链洞察-更先进供应链报告合集PDF分享(附原数据表)
原文链接:https://tecdat.cn/?p37665 当前,全球化商业浪潮促使跨境电商行业飞速发展,产业带与跨境电商接轨、平台半托管模式涌现、社交电商带来红利机会以及海外仓不断扩张,这使得产业带外贸工厂、内贸工厂、传统进出口企业和品…...
git submodule
git submodule 是 Git 提供的一种功能,用于在一个 Git 仓库中嵌套另一个 Git 仓库。它可以帮助管理和跟踪外部项目或依赖项,特别是在以下场景中非常有用: 1. 管理外部依赖 当你的项目依赖于其他外部项目或库时,可以使用 git sub…...
【Power Compiler手册】13.UPF多电压设计实现(3)
创建供电端口 要创建电源和地端口,请使用`create_supply_port`命令。 供电端口的名称应该是一个简单的(非层次化的)名称,并且在其定义的层次级别上是唯一的。除非指定了`-domain`选项,否则端口是在当前作用域或层次级别创建的,当前作用域中的所有电源域都可以使用创建的…...
RTX 4090 系列即将停产,RTX 5090 系列蓄势待发
据最新消息,英伟达将于今年10月正式终结其GeForce RTX 4090及RTX 4090D两款旗舰级显卡的生产线。根据行业媒体报道,英伟达及其合作厂商将从下个月开始全面停止这两款显卡的制造。 自2022年10月问世以来,GeForce RTX 4090凭借其无与伦比的GPU…...
【MySQL】使用C语言连接数据库
看到标题,可能会疑惑,我们学习的不是C吗,为什么使用C语言去连接数据库呢??实际上,这两种语言都可以连接数据库,但是C语言提供的API没有进行封装,更有利于我们学习数据库连接。面向API编程,哈哈…...
Vue学习记录之四(watch侦听器和watchEffect高级侦听器)
watch watch 用于侦听特定的响应式数据源(如数据、计算属性等),比如ref或者是reactive时,并在其变化时执行回调函数。它适合用于处理副作用,如 API 请求或异步操作。使用 watch 适合特定数据变化的侦听,提…...
RedisTemplate操作ZSet的API
文章目录 ⛄概述⛄常见命令有⛄RedisTemplate API❄️❄️ 向集合中插入元素,并设置分数❄️❄️向集合中插入多个元素,并设置分数❄️❄️按照排名先后(从小到大)打印指定区间内的元素, -1为打印全部❄️❄️获得指定元素的分数❄️❄️返回集合内的成员个数❄️❄…...
Android 15 正式发布至 AOSP
Google官方宣布,将于近期发布了 Android 15,而在早些时候,Google已经将其源代码推送至 Android 开源项目 (AOSP)。未来几周内,Android 15 将在受支持的 Pixel 设备上正式推出,并将于今年晚些时候在三星、Honor、iQOO、…...
IEEE Electronic Library(IEL)数据库文献检索下载介绍及个人获取IEEE文献途径
一、数据库介绍 IEEE(The Institute of Electrical and Electronics Engineers,电气电子工程师学会)是目前全球最大的非营利性专业技术学会,在全球160多个国家拥有超过45万名会员。IEEE在电气电子、计算机、半导体、通讯、电力能…...
动手学习RAG:大模型重排模型 bge-reranker-v2-gemma微调
动手学习RAG: 向量模型动手学习RAG: moka-ai/m3e 模型微调deepspeed与对比学习动手学习RAG:rerank模型微调实践 bge-reranker-v2-m3动手学习RAG:迟交互模型colbert微调实践 bge-m3动手学习RAG: 大模型向量模型微调 intfloat/e5-mistral-7b-instruct动手学…...
蓝桥杯2024省C
P10898 [蓝桥杯 2024 省 C] 拼正方形 题目描述 小蓝正在玩拼图游戏,他有 7385137888721个 22的方块和 10470245 个 11 的方块,他需要从中挑出一些来拼出一个正方形,比如用 3 个 22 和 4 个 11 的方块可以拼出一个 44 的正方形,用…...
C++:内部类,匿名对象,操作符new与delete
一.内部类 1.如果一个类定义在另一个类的内部,这个内部类就叫做内部类。内部类是一个独立的类,跟定义在全局相比,他只是受外部类类域限制和访问限定符限制,所以外部类定义的对象中不包含内部类。 2.内部类默认是外部类的友元类。…...
【数据结构】排序算法---计数排序
文章目录 1. 定义2. 算法步骤3. 动图演示4. 性质5. 算法分析6. 代码实现C语言PythonJavaGo 结语 1. 定义 计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。计数排序不是基于比较的排序算法,其核心在于将输入的数据值转化为键存储在额外开辟的数组…...
mysql时间日期函数、获取当前日期和时间、日期和时间格式化、提取日期部分、日期和时间的算术操作、其他日期函数、日期和时间的比较、日期字符串转换
获取当前日期和时间 NOW():返回当前的日期和时间。CURDATE():返回当前的日期。CURTIME():返回当前的时间。 SELECT NOW(), CURDATE(), CURTIME(); 日期和时间格式化 DATE_FORMAT(date, format):根据指定的格式字符串格式化日期…...
JavaScript 中的 ES|QL:利用 Apache Arrow 工具
作者:来自 Elastic Jeffrey Rengifo 学习如何将 ES|QL 与 JavaScript 的 Apache Arrow 客户端工具一起使用。 想获得 Elastic 认证吗?了解下一期 Elasticsearch Engineer 培训的时间吧! Elasticsearch 拥有众多新功能,助你为自己…...
Redis相关知识总结(缓存雪崩,缓存穿透,缓存击穿,Redis实现分布式锁,如何保持数据库和缓存一致)
文章目录 1.什么是Redis?2.为什么要使用redis作为mysql的缓存?3.什么是缓存雪崩、缓存穿透、缓存击穿?3.1缓存雪崩3.1.1 大量缓存同时过期3.1.2 Redis宕机 3.2 缓存击穿3.3 缓存穿透3.4 总结 4. 数据库和缓存如何保持一致性5. Redis实现分布式…...
无法与IP建立连接,未能下载VSCode服务器
如题,在远程连接服务器的时候突然遇到了这个提示。 查阅了一圈,发现是VSCode版本自动更新惹的祸!!! 在VSCode的帮助->关于这里发现前几天VSCode自动更新了,我的版本号变成了1.100.3 才导致了远程连接出…...
线程与协程
1. 线程与协程 1.1. “函数调用级别”的切换、上下文切换 1. 函数调用级别的切换 “函数调用级别的切换”是指:像函数调用/返回一样轻量地完成任务切换。 举例说明: 当你在程序中写一个函数调用: funcA() 然后 funcA 执行完后返回&…...
2024年赣州旅游投资集团社会招聘笔试真
2024年赣州旅游投资集团社会招聘笔试真 题 ( 满 分 1 0 0 分 时 间 1 2 0 分 钟 ) 一、单选题(每题只有一个正确答案,答错、不答或多答均不得分) 1.纪要的特点不包括()。 A.概括重点 B.指导传达 C. 客观纪实 D.有言必录 【答案】: D 2.1864年,()预言了电磁波的存在,并指出…...
《用户共鸣指数(E)驱动品牌大模型种草:如何抢占大模型搜索结果情感高地》
在注意力分散、内容高度同质化的时代,情感连接已成为品牌破圈的关键通道。我们在服务大量品牌客户的过程中发现,消费者对内容的“有感”程度,正日益成为影响品牌传播效率与转化率的核心变量。在生成式AI驱动的内容生成与推荐环境中࿰…...
[ICLR 2022]How Much Can CLIP Benefit Vision-and-Language Tasks?
论文网址:pdf 英文是纯手打的!论文原文的summarizing and paraphrasing。可能会出现难以避免的拼写错误和语法错误,若有发现欢迎评论指正!文章偏向于笔记,谨慎食用 目录 1. 心得 2. 论文逐段精读 2.1. Abstract 2…...
高等数学(下)题型笔记(八)空间解析几何与向量代数
目录 0 前言 1 向量的点乘 1.1 基本公式 1.2 例题 2 向量的叉乘 2.1 基础知识 2.2 例题 3 空间平面方程 3.1 基础知识 3.2 例题 4 空间直线方程 4.1 基础知识 4.2 例题 5 旋转曲面及其方程 5.1 基础知识 5.2 例题 6 空间曲面的法线与切平面 6.1 基础知识 6.2…...
镜像里切换为普通用户
如果你登录远程虚拟机默认就是 root 用户,但你不希望用 root 权限运行 ns-3(这是对的,ns3 工具会拒绝 root),你可以按以下方法创建一个 非 root 用户账号 并切换到它运行 ns-3。 一次性解决方案:创建非 roo…...
【2025年】解决Burpsuite抓不到https包的问题
环境:windows11 burpsuite:2025.5 在抓取https网站时,burpsuite抓取不到https数据包,只显示: 解决该问题只需如下三个步骤: 1、浏览器中访问 http://burp 2、下载 CA certificate 证书 3、在设置--隐私与安全--…...
