【胡乱念叨】大模型的“我”
下面的内容很有可能事实错误,胡说八道,前后不连贯,举例随意且未经考证 甚至 有意欺骗!嘻嘻。所以是【胡乱念叨】
文章目录
- 【胡乱念叨】大模型的“我”
- 参数量和“我”
- 什么是“我”
- 从输入输出的观点看“我”
- 大模型的“我”
- 乱讨论
【胡乱念叨】大模型的“我”
现在有不少人在研究大模型的人格,在讨论大模型沟通,理解的能力。很多人潜意识里,将其当成了人。
大模型貌似展现出了“我”的认知,他好像知道自己是谁,知道自己角色定位,有自我的认知,“仿佛好像”是个人。
那么,它有“我”吗?
参数量和“我”
认识“我”是个很有门槛的事情。地球上大部分动物都跨越不到这个门槛,高等动物的特权。通常来说脑连接最少的还有自我意识的动物是一些鸟类,例如乌鸦,喜鹊🐦,它们显示出了相当程度的自我意识(例如镜子测试)。
我们通常用突触的数量类比模型参数量。人脑大概有100万亿个突触连接,即使是喜鹊也有万亿的规模。如果在生物界,这万亿规模是产生“我”的门槛,那么这个数字是远超现有常见的大模型参数规模的(十亿,百亿)!
那为什么仅靠数十亿参数就能展现的像是有“我”一样,大模型展现的是 假“我” 吗? [后面没有对这个问题的回答]
更何况,自然生物的学习效率远比模型高。对于参数的利用效率上,生物早已站在了scaling law圣经的左下角,突破了大模型训练中跨越不过的天堑。
什么是“我”
啰里八嗦一堆,什么是“我”都还没交代和讨论呢!
什么是“我”? 这个问题可难回答了!
不妨反过来问:什么不是“我”?
你什么时候觉得你不是你? 这个问题好回答的多!
一句话回答:当你不清楚你自己(或者一部分自身)的状态的时候,你便觉得你不是你。
例如:(1)睡觉的时候压着胳膊了,麻了,想抬起来却抬不起来,你感觉你的手臂不是你的。 (2)鬼压床了,想翻身翻不了,你觉得身体好像不是自己的。 (3)你迷迷糊糊不小心带着包装袋把面条下进了锅里,回过神来,啊我做了什么?刚才的我好像不是我 …
“我”是对自身状态的预测! (1)我想抬起胳膊,神经给出命令,胳膊被观察(感知)到抬起来了-> 胳膊是我;(2)我想煮面吃饭,面顺利煮好了->行为被我执行了。
正因“我”是对自身状态的预测,所以“我”很容易被欺骗。实验可以通过伪造迎合你对自身状态的预测从而轻易欺骗你对自我的判断。例如“橡皮手错觉”(Rubber Hand Illusion)
(从进化论看“我”的视角,为什么有我,因为感受自身和预测自身,能帮助生物在捕食和被捕食的关系中更具竞争力)
从输入输出的观点看“我”
前面说,我是对自身状态的“预测”,从流程上来看是这样的:
step 1: 观察到周围世界的变化/自身做出某种举动去改变世界
step 2:预测这种举动对自身的影响/预测其对周围世界的影响
step 3: 感受到自身的变化符合预测结果/观察世界的变化符合预期
step 4: 由于符合预测,于是我感受我
从输入输出来看:
简单summary:
输入:自身状态,世界状态
输出:可能未来自身状态,可能未来世界状态,主观能动的干扰
额外:有度量能力判断是否“符合”
大模型的“我”
在上面的关系图里,我尝试自己胡乱“匹配”一下,当前大模型在什么位置!
前提先明确大模型工作在对话场景中,对话场景即大模型的世界结构。
输入内容:
- 世界状态:很明确,就是对话另一方的输入,大模型可以通过模型的输入清晰的感知
- 自身状态:不明确大模型的自身状态是什么。由于自身状态是变化的,大模型参数又是固定不变的,可变的自身状态就得是其缓存的KV Cache? 那这如何感受?又如何预测?
输出内容:
- 主观的干预:很明确,接对方的话就是干预过程
- 可能的未来自身状态:不明确,原因和输入内容不明确自身状态相同。
- 可能的未来世界状态:能够预测!! 思考到这一点我觉得很有意思也很重要。大模型拥有对自身干预对世界状态影响的预测能力(有点饶舌)。 这是由于大模型的训练过程中在预训练之后,那些用于对话的模型会再次经历一轮在对话场景的微调。
这些数据大概长这样:[start] User: How are you? [sep] Agent: I am fine, thank you [sep] User: I am fine, too.
我认为:当大模型在多于一个来回的对话序列中训练时,能拥有对自身干预对世界状态影响的预测能力。 例如,上面的例子中,Causal Language Model的损失函数是有学习如果自身进行了“ I am fine, thank you ”的干预后,世界会如何回应(“I am fine, too”)
额外内容:有度量能力判断是否“符合”?貌似没有,我更偏向于,这是一个强化学习/Online learning应当讨论的问题。如果只从训练的角度,它貌似部分和输出内容中对可能未来世界状态的预期重叠。从实际的角度来看,我是一个动态的概念,那应该要动态的判断是否“符合”,这个“符合”与否的结果应当参与模型“我”的动态变化(光想想就是相当有难度的问题!)。
标注在图上(使用红色和蓝色分别标注明确有的能力和不明确的能力):
乱讨论
- 貌似,在对话场景中,大模型好像有了一部分“我”的成因,已经足够表现的像“我”了。
- 按照之前的瞎说,模型的“我”的认知,应该是在第一阶段预训练之后才被赋予的!这一点貌似有验证的可能。如果设计一个方法去度量模型的“我”的成分:如果前面的说法有点道理的话,llama-base应当无“我”,而llama-chat应当有“我”。
- 大模型结构设计真的没空间了吗?大模型如何感受自我状态?如何动态的“符合?”预测状态和真实状态?(btw: 我依旧不认为模型串行是最优的,我可能prefer浅层的并行的模型,这样不同的part可以更好的并行执行他们的任务如预测/符合/感受,而且在上一篇文章中我提到人的大脑能够独立并协同工作也是正常人抑制幻觉的重要能力的想法,而且我还觉得这样更容易做到节能,嘻嘻)
- 扯淡完毕~
相关文章:

【胡乱念叨】大模型的“我”
下面的内容很有可能事实错误,胡说八道,前后不连贯,举例随意且未经考证 甚至 有意欺骗!嘻嘻。所以是【胡乱念叨】 文章目录 【胡乱念叨】大模型的“我”参数量和“我”什么是“我”从输入输出的观点看“我”大模型的“我”乱讨论 …...

Flag_AGtivity_clear_top网页编程指南如何退出多activity程序
activity的启动模式:FLAG_ACTIVITY_CLEAR_TOP和FLAG_ACTIVITY_REORDER_TO_FRONT。 1. 如果已经启动了四个Activity:A,B,C和D。在D Activity里,我们要跳到B Activity,同时希望C finish掉,可以在start…...
克隆centos网卡uuid相同如何修改
在克隆CentOS系统后,网卡的UUID相同会导致网络配置冲突,使得网络无法正常工作。要解决这个问题,你需要为每个克隆的系统生成新的UUID。 以下是解决步骤: 进入原始CentOS系统。 找到网络配置文件的位置,通常在 /etc/s…...

C语言习题~day11
1、C程序常见的错误分类不包含:( ) A.编译错误 B.链接错误 C.栈溢出 D.运行时错误 栈溢出是运行时错误的一种,因此C程序不会将栈溢出错误单独列出来,栈溢出包含在运行时错误中。 因此:选择C 2、关于VS调…...

Ansible——Playbook基本功能???
文章目录 一、Ansible Playbook介绍1、Playbook的简单组成1)“play”2)“task”3)“playbook” 2、Playbook与ad-hoc简单对比区别联系 3、YAML文件语法:---以及多个---??使用 include 指令 1. 基本结构2. 数…...

多线程学习篇一:启动多线程的三种方式
1. 继承 Thread 类 Slf4j public class MyThread extends Thread {Overridepublic void run() {log.info("MyThread run ...");}public static void main(String[] args) {MyThread myThread new MyThread();myThread.start();} } 2. 实现 Runnable 接口 Slf4j pu…...

【专题】2024跨境出海供应链洞察-更先进供应链报告合集PDF分享(附原数据表)
原文链接:https://tecdat.cn/?p37665 当前,全球化商业浪潮促使跨境电商行业飞速发展,产业带与跨境电商接轨、平台半托管模式涌现、社交电商带来红利机会以及海外仓不断扩张,这使得产业带外贸工厂、内贸工厂、传统进出口企业和品…...
git submodule
git submodule 是 Git 提供的一种功能,用于在一个 Git 仓库中嵌套另一个 Git 仓库。它可以帮助管理和跟踪外部项目或依赖项,特别是在以下场景中非常有用: 1. 管理外部依赖 当你的项目依赖于其他外部项目或库时,可以使用 git sub…...
【Power Compiler手册】13.UPF多电压设计实现(3)
创建供电端口 要创建电源和地端口,请使用`create_supply_port`命令。 供电端口的名称应该是一个简单的(非层次化的)名称,并且在其定义的层次级别上是唯一的。除非指定了`-domain`选项,否则端口是在当前作用域或层次级别创建的,当前作用域中的所有电源域都可以使用创建的…...
RTX 4090 系列即将停产,RTX 5090 系列蓄势待发
据最新消息,英伟达将于今年10月正式终结其GeForce RTX 4090及RTX 4090D两款旗舰级显卡的生产线。根据行业媒体报道,英伟达及其合作厂商将从下个月开始全面停止这两款显卡的制造。 自2022年10月问世以来,GeForce RTX 4090凭借其无与伦比的GPU…...
【MySQL】使用C语言连接数据库
看到标题,可能会疑惑,我们学习的不是C吗,为什么使用C语言去连接数据库呢??实际上,这两种语言都可以连接数据库,但是C语言提供的API没有进行封装,更有利于我们学习数据库连接。面向API编程,哈哈…...
Vue学习记录之四(watch侦听器和watchEffect高级侦听器)
watch watch 用于侦听特定的响应式数据源(如数据、计算属性等),比如ref或者是reactive时,并在其变化时执行回调函数。它适合用于处理副作用,如 API 请求或异步操作。使用 watch 适合特定数据变化的侦听,提…...

RedisTemplate操作ZSet的API
文章目录 ⛄概述⛄常见命令有⛄RedisTemplate API❄️❄️ 向集合中插入元素,并设置分数❄️❄️向集合中插入多个元素,并设置分数❄️❄️按照排名先后(从小到大)打印指定区间内的元素, -1为打印全部❄️❄️获得指定元素的分数❄️❄️返回集合内的成员个数❄️❄…...

Android 15 正式发布至 AOSP
Google官方宣布,将于近期发布了 Android 15,而在早些时候,Google已经将其源代码推送至 Android 开源项目 (AOSP)。未来几周内,Android 15 将在受支持的 Pixel 设备上正式推出,并将于今年晚些时候在三星、Honor、iQOO、…...

IEEE Electronic Library(IEL)数据库文献检索下载介绍及个人获取IEEE文献途径
一、数据库介绍 IEEE(The Institute of Electrical and Electronics Engineers,电气电子工程师学会)是目前全球最大的非营利性专业技术学会,在全球160多个国家拥有超过45万名会员。IEEE在电气电子、计算机、半导体、通讯、电力能…...

动手学习RAG:大模型重排模型 bge-reranker-v2-gemma微调
动手学习RAG: 向量模型动手学习RAG: moka-ai/m3e 模型微调deepspeed与对比学习动手学习RAG:rerank模型微调实践 bge-reranker-v2-m3动手学习RAG:迟交互模型colbert微调实践 bge-m3动手学习RAG: 大模型向量模型微调 intfloat/e5-mistral-7b-instruct动手学…...
蓝桥杯2024省C
P10898 [蓝桥杯 2024 省 C] 拼正方形 题目描述 小蓝正在玩拼图游戏,他有 7385137888721个 22的方块和 10470245 个 11 的方块,他需要从中挑出一些来拼出一个正方形,比如用 3 个 22 和 4 个 11 的方块可以拼出一个 44 的正方形,用…...

C++:内部类,匿名对象,操作符new与delete
一.内部类 1.如果一个类定义在另一个类的内部,这个内部类就叫做内部类。内部类是一个独立的类,跟定义在全局相比,他只是受外部类类域限制和访问限定符限制,所以外部类定义的对象中不包含内部类。 2.内部类默认是外部类的友元类。…...

【数据结构】排序算法---计数排序
文章目录 1. 定义2. 算法步骤3. 动图演示4. 性质5. 算法分析6. 代码实现C语言PythonJavaGo 结语 1. 定义 计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。计数排序不是基于比较的排序算法,其核心在于将输入的数据值转化为键存储在额外开辟的数组…...
mysql时间日期函数、获取当前日期和时间、日期和时间格式化、提取日期部分、日期和时间的算术操作、其他日期函数、日期和时间的比较、日期字符串转换
获取当前日期和时间 NOW():返回当前的日期和时间。CURDATE():返回当前的日期。CURTIME():返回当前的时间。 SELECT NOW(), CURDATE(), CURTIME(); 日期和时间格式化 DATE_FORMAT(date, format):根据指定的格式字符串格式化日期…...

2.Vue编写一个app
1.src中重要的组成 1.1main.ts // 引入createApp用于创建应用 import { createApp } from "vue"; // 引用App根组件 import App from ./App.vue;createApp(App).mount(#app)1.2 App.vue 其中要写三种标签 <template> <!--html--> </template>…...

Cinnamon修改面板小工具图标
Cinnamon开始菜单-CSDN博客 设置模块都是做好的,比GNOME简单得多! 在 applet.js 里增加 const Settings imports.ui.settings;this.settings new Settings.AppletSettings(this, HTYMenusonichy, instance_id); this.settings.bind(menu-icon, menu…...

智能仓储的未来:自动化、AI与数据分析如何重塑物流中心
当仓库学会“思考”,物流的终极形态正在诞生 想象这样的场景: 凌晨3点,某物流中心灯火通明却空无一人。AGV机器人集群根据实时订单动态规划路径;AI视觉系统在0.1秒内扫描包裹信息;数字孪生平台正模拟次日峰值流量压力…...
什么?连接服务器也能可视化显示界面?:基于X11 Forwarding + CentOS + MobaXterm实战指南
文章目录 什么是X11?环境准备实战步骤1️⃣ 服务器端配置(CentOS)2️⃣ 客户端配置(MobaXterm)3️⃣ 验证X11 Forwarding4️⃣ 运行自定义GUI程序(Python示例)5️⃣ 成功效果
在WSL2的Ubuntu镜像中安装Docker
Docker官网链接: https://docs.docker.com/engine/install/ubuntu/ 1、运行以下命令卸载所有冲突的软件包: for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done2、设置Docker…...

蓝桥杯3498 01串的熵
问题描述 对于一个长度为 23333333的 01 串, 如果其信息熵为 11625907.5798, 且 0 出现次数比 1 少, 那么这个 01 串中 0 出现了多少次? #include<iostream> #include<cmath> using namespace std;int n 23333333;int main() {//枚举 0 出现的次数//因…...
Angular微前端架构:Module Federation + ngx-build-plus (Webpack)
以下是一个完整的 Angular 微前端示例,其中使用的是 Module Federation 和 npx-build-plus 实现了主应用(Shell)与子应用(Remote)的集成。 🛠️ 项目结构 angular-mf/ ├── shell-app/ # 主应用&…...

【7色560页】职场可视化逻辑图高级数据分析PPT模版
7种色调职场工作汇报PPT,橙蓝、黑红、红蓝、蓝橙灰、浅蓝、浅绿、深蓝七种色调模版 【7色560页】职场可视化逻辑图高级数据分析PPT模版:职场可视化逻辑图分析PPT模版https://pan.quark.cn/s/78aeabbd92d1...

【Redis】笔记|第8节|大厂高并发缓存架构实战与优化
缓存架构 代码结构 代码详情 功能点: 多级缓存,先查本地缓存,再查Redis,最后才查数据库热点数据重建逻辑使用分布式锁,二次查询更新缓存采用读写锁提升性能采用Redis的发布订阅机制通知所有实例更新本地缓存适用读多…...

Golang——9、反射和文件操作
反射和文件操作 1、反射1.1、reflect.TypeOf()获取任意值的类型对象1.2、reflect.ValueOf()1.3、结构体反射 2、文件操作2.1、os.Open()打开文件2.2、方式一:使用Read()读取文件2.3、方式二:bufio读取文件2.4、方式三:os.ReadFile读取2.5、写…...