当前位置: 首页 > news >正文

【胡乱念叨】大模型的“我”

下面的内容很有可能事实错误,胡说八道,前后不连贯,举例随意且未经考证 甚至 有意欺骗!嘻嘻。所以是【胡乱念叨】

文章目录

  • 【胡乱念叨】大模型的“我”
    • 参数量和“我”
    • 什么是“我”
    • 从输入输出的观点看“我”
    • 大模型的“我”
    • 乱讨论

【胡乱念叨】大模型的“我”

现在有不少人在研究大模型的人格,在讨论大模型沟通,理解的能力。很多人潜意识里,将其当成了人。

大模型貌似展现出了“我”的认知,他好像知道自己是谁,知道自己角色定位,有自我的认知,“仿佛好像”是个人。

那么,它有“我”吗?

mirroring生成

参数量和“我”

认识“我”是个很有门槛的事情。地球上大部分动物都跨越不到这个门槛,高等动物的特权。通常来说脑连接最少的还有自我意识的动物是一些鸟类,例如乌鸦,喜鹊🐦,它们显示出了相当程度的自我意识(例如镜子测试)。

我们通常用突触的数量类比模型参数量。人脑大概有100万亿个突触连接,即使是喜鹊也有万亿的规模。如果在生物界,这万亿规模是产生“我”的门槛,那么这个数字是远超现有常见的大模型参数规模的(十亿,百亿)!

那为什么仅靠数十亿参数就能展现的像是有“我”一样,大模型展现的是 假“我” 吗? [后面没有对这个问题的回答]

更何况,自然生物的学习效率远比模型高。对于参数的利用效率上,生物早已站在了scaling law圣经的左下角,突破了大模型训练中跨越不过的天堑。
在这里插入图片描述

什么是“我”

啰里八嗦一堆,什么是“我”都还没交代和讨论呢!

什么是“我”? 这个问题可难回答了!
不妨反过来问:什么不是“我”?

你什么时候觉得你不是你? 这个问题好回答的多!
一句话回答:当你不清楚你自己(或者一部分自身)的状态的时候,你便觉得你不是你。

例如:(1)睡觉的时候压着胳膊了,麻了,想抬起来却抬不起来,你感觉你的手臂不是你的。 (2)鬼压床了,想翻身翻不了,你觉得身体好像不是自己的。 (3)你迷迷糊糊不小心带着包装袋把面条下进了锅里,回过神来,啊我做了什么?刚才的我好像不是我 …

“我”是对自身状态的预测! (1)我想抬起胳膊,神经给出命令,胳膊被观察(感知)到抬起来了-> 胳膊是我;(2)我想煮面吃饭,面顺利煮好了->行为被我执行了。

正因“我”是对自身状态的预测,所以“我”很容易被欺骗。实验可以通过伪造迎合你对自身状态的预测从而轻易欺骗你对自我的判断。例如“橡皮手错觉”(Rubber Hand Illusion)
在这里插入图片描述

(从进化论看“我”的视角,为什么有我,因为感受自身和预测自身,能帮助生物在捕食和被捕食的关系中更具竞争力)

从输入输出的观点看“我”

前面说,我是对自身状态的“预测”,从流程上来看是这样的:

step 1: 观察到周围世界的变化/自身做出某种举动去改变世界
step 2:预测这种举动对自身的影响/预测其对周围世界的影响
step 3: 感受到自身的变化符合预测结果/观察世界的变化符合预期
step 4: 由于符合预测,于是我感受我

从输入输出来看:

感受
预测
感受
预测
符合?
符合?
干预
干预
自身状态
可能未来自身状态
世界状态
可能未来世界状态
真实未来自身状态
真实未来世界状态

简单summary:
输入:自身状态,世界状态
输出:可能未来自身状态,可能未来世界状态,主观能动的干扰
额外:有度量能力判断是否“符合”

大模型的“我”

在上面的关系图里,我尝试自己胡乱“匹配”一下,当前大模型在什么位置!

前提先明确大模型工作在对话场景中,对话场景即大模型的世界结构。

输入内容

  • 世界状态:很明确,就是对话另一方的输入,大模型可以通过模型的输入清晰的感知
  • 自身状态:不明确大模型的自身状态是什么。由于自身状态是变化的,大模型参数又是固定不变的,可变的自身状态就得是其缓存的KV Cache? 那这如何感受?又如何预测?

输出内容

  • 主观的干预:很明确,接对方的话就是干预过程
  • 可能的未来自身状态:不明确,原因和输入内容不明确自身状态相同。
  • 可能的未来世界状态能够预测!! 思考到这一点我觉得很有意思也很重要。大模型拥有对自身干预对世界状态影响的预测能力(有点饶舌)。 这是由于大模型的训练过程中在预训练之后,那些用于对话的模型会再次经历一轮在对话场景的微调。
    这些数据大概长这样:[start] User: How are you? [sep] Agent: I am fine, thank you [sep] User: I am fine, too.
    我认为:当大模型在多于一个来回的对话序列中训练时,能拥有对自身干预对世界状态影响的预测能力。 例如,上面的例子中,Causal Language Model的损失函数是有学习如果自身进行了“ I am fine, thank you ”的干预后,世界会如何回应(“I am fine, too”)

额外内容:有度量能力判断是否“符合”?貌似没有,我更偏向于,这是一个强化学习/Online learning应当讨论的问题。如果只从训练的角度,它貌似部分和输出内容中对可能未来世界状态的预期重叠。从实际的角度来看,我是一个动态的概念,那应该要动态的判断是否“符合”,这个“符合”与否的结果应当参与模型“我”的动态变化(光想想就是相当有难度的问题!)。

标注在图上(使用红色和蓝色分别标注明确有的能力和不明确的能力):

感受
预测
感受
预测
符合?
符合?
干预
干预
自身状态
可能未来自身状态
世界状态
可能未来世界状态
真实未来自身状态
真实未来世界状态

乱讨论

  • 貌似,在对话场景中,大模型好像有了一部分“我”的成因,已经足够表现的像“我”了。
  • 按照之前的瞎说,模型的“我”的认知,应该是在第一阶段预训练之后才被赋予的!这一点貌似有验证的可能。如果设计一个方法去度量模型的“我”的成分:如果前面的说法有点道理的话,llama-base应当无“我”,而llama-chat应当有“我”。
  • 大模型结构设计真的没空间了吗?大模型如何感受自我状态?如何动态的“符合?”预测状态和真实状态?(btw: 我依旧不认为模型串行是最优的,我可能prefer浅层的并行的模型,这样不同的part可以更好的并行执行他们的任务如预测/符合/感受,而且在上一篇文章中我提到人的大脑能够独立并协同工作也是正常人抑制幻觉的重要能力的想法,而且我还觉得这样更容易做到节能,嘻嘻)
  • 扯淡完毕~

相关文章:

【胡乱念叨】大模型的“我”

下面的内容很有可能事实错误,胡说八道,前后不连贯,举例随意且未经考证 甚至 有意欺骗!嘻嘻。所以是【胡乱念叨】 文章目录 【胡乱念叨】大模型的“我”参数量和“我”什么是“我”从输入输出的观点看“我”大模型的“我”乱讨论 …...

Flag_AGtivity_clear_top网页编程指南如何退出多activity程序

activity的启动模式:FLAG_ACTIVITY_CLEAR_TOP和FLAG_ACTIVITY_REORDER_TO_FRONT。 1. 如果已经启动了四个Activity:A,B,C和D。在D Activity里,我们要跳到B Activity,同时希望C finish掉,可以在start…...

克隆centos网卡uuid相同如何修改

在克隆CentOS系统后,网卡的UUID相同会导致网络配置冲突,使得网络无法正常工作。要解决这个问题,你需要为每个克隆的系统生成新的UUID。 以下是解决步骤: 进入原始CentOS系统。 找到网络配置文件的位置,通常在 /etc/s…...

C语言习题~day11

1、C程序常见的错误分类不包含:( ) A.编译错误 B.链接错误 C.栈溢出 D.运行时错误 栈溢出是运行时错误的一种,因此C程序不会将栈溢出错误单独列出来,栈溢出包含在运行时错误中。 因此:选择C 2、关于VS调…...

Ansible——Playbook基本功能???

文章目录 一、Ansible Playbook介绍1、Playbook的简单组成1)“play”2)“task”3)“playbook” 2、Playbook与ad-hoc简单对比区别联系 3、YAML文件语法:---以及多个---??使用 include 指令 1. 基本结构2. 数…...

多线程学习篇一:启动多线程的三种方式

1. 继承 Thread 类 Slf4j public class MyThread extends Thread {Overridepublic void run() {log.info("MyThread run ...");}public static void main(String[] args) {MyThread myThread new MyThread();myThread.start();} } 2. 实现 Runnable 接口 Slf4j pu…...

【专题】2024跨境出海供应链洞察-更先进供应链报告合集PDF分享(附原数据表)

原文链接:https://tecdat.cn/?p37665 当前,全球化商业浪潮促使跨境电商行业飞速发展,产业带与跨境电商接轨、平台半托管模式涌现、社交电商带来红利机会以及海外仓不断扩张,这使得产业带外贸工厂、内贸工厂、传统进出口企业和品…...

git submodule

git submodule 是 Git 提供的一种功能,用于在一个 Git 仓库中嵌套另一个 Git 仓库。它可以帮助管理和跟踪外部项目或依赖项,特别是在以下场景中非常有用: 1. 管理外部依赖 当你的项目依赖于其他外部项目或库时,可以使用 git sub…...

【Power Compiler手册】13.UPF多电压设计实现(3)

创建供电端口 要创建电源和地端口,请使用`create_supply_port`命令。 供电端口的名称应该是一个简单的(非层次化的)名称,并且在其定义的层次级别上是唯一的。除非指定了`-domain`选项,否则端口是在当前作用域或层次级别创建的,当前作用域中的所有电源域都可以使用创建的…...

RTX 4090 系列即将停产,RTX 5090 系列蓄势待发

据最新消息,英伟达将于今年10月正式终结其GeForce RTX 4090及RTX 4090D两款旗舰级显卡的生产线。根据行业媒体报道,英伟达及其合作厂商将从下个月开始全面停止这两款显卡的制造。 自2022年10月问世以来,GeForce RTX 4090凭借其无与伦比的GPU…...

【MySQL】使用C语言连接数据库

看到标题,可能会疑惑,我们学习的不是C吗,为什么使用C语言去连接数据库呢??实际上,这两种语言都可以连接数据库,但是C语言提供的API没有进行封装,更有利于我们学习数据库连接。面向API编程,哈哈…...

Vue学习记录之四(watch侦听器和watchEffect高级侦听器)

watch watch 用于侦听特定的响应式数据源(如数据、计算属性等),比如ref或者是reactive时,并在其变化时执行回调函数。它适合用于处理副作用,如 API 请求或异步操作。使用 watch 适合特定数据变化的侦听,提…...

RedisTemplate操作ZSet的API

文章目录 ⛄概述⛄常见命令有⛄RedisTemplate API❄️❄️ 向集合中插入元素,并设置分数❄️❄️向集合中插入多个元素,并设置分数❄️❄️按照排名先后(从小到大)打印指定区间内的元素, -1为打印全部❄️❄️获得指定元素的分数❄️❄️返回集合内的成员个数❄️❄…...

Android 15 正式发布至 AOSP

Google官方宣布,将于近期发布了 Android 15,而在早些时候,Google已经将其源代码推送至 Android 开源项目 (AOSP)。未来几周内,Android 15 将在受支持的 Pixel 设备上正式推出,并将于今年晚些时候在三星、Honor、iQOO、…...

IEEE Electronic Library(IEL)数据库文献检索下载介绍及个人获取IEEE文献途径

一、数据库介绍 IEEE(The Institute of Electrical and Electronics Engineers,电气电子工程师学会)是目前全球最大的非营利性专业技术学会,在全球160多个国家拥有超过45万名会员。IEEE在电气电子、计算机、半导体、通讯、电力能…...

动手学习RAG:大模型重排模型 bge-reranker-v2-gemma微调

动手学习RAG: 向量模型动手学习RAG: moka-ai/m3e 模型微调deepspeed与对比学习动手学习RAG:rerank模型微调实践 bge-reranker-v2-m3动手学习RAG:迟交互模型colbert微调实践 bge-m3动手学习RAG: 大模型向量模型微调 intfloat/e5-mistral-7b-instruct动手学…...

蓝桥杯2024省C

P10898 [蓝桥杯 2024 省 C] 拼正方形 题目描述 小蓝正在玩拼图游戏,他有 7385137888721个 22的方块和 10470245 个 11 的方块,他需要从中挑出一些来拼出一个正方形,比如用 3 个 22 和 4 个 11 的方块可以拼出一个 44 的正方形,用…...

C++:内部类,匿名对象,操作符new与delete

一.内部类 1.如果一个类定义在另一个类的内部,这个内部类就叫做内部类。内部类是一个独立的类,跟定义在全局相比,他只是受外部类类域限制和访问限定符限制,所以外部类定义的对象中不包含内部类。 2.内部类默认是外部类的友元类。…...

【数据结构】排序算法---计数排序

文章目录 1. 定义2. 算法步骤3. 动图演示4. 性质5. 算法分析6. 代码实现C语言PythonJavaGo 结语 1. 定义 计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。计数排序不是基于比较的排序算法,其核心在于将输入的数据值转化为键存储在额外开辟的数组…...

mysql时间日期函数、获取当前日期和时间、日期和时间格式化、提取日期部分、日期和时间的算术操作、其他日期函数、日期和时间的比较、日期字符串转换

获取当前日期和时间 NOW():返回当前的日期和时间。CURDATE():返回当前的日期。CURTIME():返回当前的时间。 SELECT NOW(), CURDATE(), CURTIME(); 日期和时间格式化 DATE_FORMAT(date, format):根据指定的格式字符串格式化日期…...

Vim 调用外部命令学习笔记

Vim 外部命令集成完全指南 文章目录 Vim 外部命令集成完全指南核心概念理解命令语法解析语法对比 常用外部命令详解文本排序与去重文本筛选与搜索高级 grep 搜索技巧文本替换与编辑字符处理高级文本处理编程语言处理其他实用命令 范围操作示例指定行范围处理复合命令示例 实用技…...

React 第五十五节 Router 中 useAsyncError的使用详解

前言 useAsyncError 是 React Router v6.4 引入的一个钩子,用于处理异步操作(如数据加载)中的错误。下面我将详细解释其用途并提供代码示例。 一、useAsyncError 用途 处理异步错误:捕获在 loader 或 action 中发生的异步错误替…...

synchronized 学习

学习源: https://www.bilibili.com/video/BV1aJ411V763?spm_id_from333.788.videopod.episodes&vd_source32e1c41a9370911ab06d12fbc36c4ebc 1.应用场景 不超卖,也要考虑性能问题(场景) 2.常见面试问题: sync出…...

基于ASP.NET+ SQL Server实现(Web)医院信息管理系统

医院信息管理系统 1. 课程设计内容 在 visual studio 2017 平台上,开发一个“医院信息管理系统”Web 程序。 2. 课程设计目的 综合运用 c#.net 知识,在 vs 2017 平台上,进行 ASP.NET 应用程序和简易网站的开发;初步熟悉开发一…...

如何在看板中有效管理突发紧急任务

在看板中有效管理突发紧急任务需要:设立专门的紧急任务通道、重新调整任务优先级、保持适度的WIP(Work-in-Progress)弹性、优化任务处理流程、提高团队应对突发情况的敏捷性。其中,设立专门的紧急任务通道尤为重要,这能…...

TRS收益互换:跨境资本流动的金融创新工具与系统化解决方案

一、TRS收益互换的本质与业务逻辑 (一)概念解析 TRS(Total Return Swap)收益互换是一种金融衍生工具,指交易双方约定在未来一定期限内,基于特定资产或指数的表现进行现金流交换的协议。其核心特征包括&am…...

微服务商城-商品微服务

数据表 CREATE TABLE product (id bigint(20) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT 商品id,cateid smallint(6) UNSIGNED NOT NULL DEFAULT 0 COMMENT 类别Id,name varchar(100) NOT NULL DEFAULT COMMENT 商品名称,subtitle varchar(200) NOT NULL DEFAULT COMMENT 商…...

什么是Ansible Jinja2

理解 Ansible Jinja2 模板 Ansible 是一款功能强大的开源自动化工具,可让您无缝地管理和配置系统。Ansible 的一大亮点是它使用 Jinja2 模板,允许您根据变量数据动态生成文件、配置设置和脚本。本文将向您介绍 Ansible 中的 Jinja2 模板,并通…...

重启Eureka集群中的节点,对已经注册的服务有什么影响

先看答案,如果正确地操作,重启Eureka集群中的节点,对已经注册的服务影响非常小,甚至可以做到无感知。 但如果操作不当,可能会引发短暂的服务发现问题。 下面我们从Eureka的核心工作原理来详细分析这个问题。 Eureka的…...

Redis:现代应用开发的高效内存数据存储利器

一、Redis的起源与发展 Redis最初由意大利程序员Salvatore Sanfilippo在2009年开发,其初衷是为了满足他自己的一个项目需求,即需要一个高性能的键值存储系统来解决传统数据库在高并发场景下的性能瓶颈。随着项目的开源,Redis凭借其简单易用、…...