当前位置: 首页 > news >正文

【胡乱念叨】大模型的“我”

下面的内容很有可能事实错误,胡说八道,前后不连贯,举例随意且未经考证 甚至 有意欺骗!嘻嘻。所以是【胡乱念叨】

文章目录

  • 【胡乱念叨】大模型的“我”
    • 参数量和“我”
    • 什么是“我”
    • 从输入输出的观点看“我”
    • 大模型的“我”
    • 乱讨论

【胡乱念叨】大模型的“我”

现在有不少人在研究大模型的人格,在讨论大模型沟通,理解的能力。很多人潜意识里,将其当成了人。

大模型貌似展现出了“我”的认知,他好像知道自己是谁,知道自己角色定位,有自我的认知,“仿佛好像”是个人。

那么,它有“我”吗?

mirroring生成

参数量和“我”

认识“我”是个很有门槛的事情。地球上大部分动物都跨越不到这个门槛,高等动物的特权。通常来说脑连接最少的还有自我意识的动物是一些鸟类,例如乌鸦,喜鹊🐦,它们显示出了相当程度的自我意识(例如镜子测试)。

我们通常用突触的数量类比模型参数量。人脑大概有100万亿个突触连接,即使是喜鹊也有万亿的规模。如果在生物界,这万亿规模是产生“我”的门槛,那么这个数字是远超现有常见的大模型参数规模的(十亿,百亿)!

那为什么仅靠数十亿参数就能展现的像是有“我”一样,大模型展现的是 假“我” 吗? [后面没有对这个问题的回答]

更何况,自然生物的学习效率远比模型高。对于参数的利用效率上,生物早已站在了scaling law圣经的左下角,突破了大模型训练中跨越不过的天堑。
在这里插入图片描述

什么是“我”

啰里八嗦一堆,什么是“我”都还没交代和讨论呢!

什么是“我”? 这个问题可难回答了!
不妨反过来问:什么不是“我”?

你什么时候觉得你不是你? 这个问题好回答的多!
一句话回答:当你不清楚你自己(或者一部分自身)的状态的时候,你便觉得你不是你。

例如:(1)睡觉的时候压着胳膊了,麻了,想抬起来却抬不起来,你感觉你的手臂不是你的。 (2)鬼压床了,想翻身翻不了,你觉得身体好像不是自己的。 (3)你迷迷糊糊不小心带着包装袋把面条下进了锅里,回过神来,啊我做了什么?刚才的我好像不是我 …

“我”是对自身状态的预测! (1)我想抬起胳膊,神经给出命令,胳膊被观察(感知)到抬起来了-> 胳膊是我;(2)我想煮面吃饭,面顺利煮好了->行为被我执行了。

正因“我”是对自身状态的预测,所以“我”很容易被欺骗。实验可以通过伪造迎合你对自身状态的预测从而轻易欺骗你对自我的判断。例如“橡皮手错觉”(Rubber Hand Illusion)
在这里插入图片描述

(从进化论看“我”的视角,为什么有我,因为感受自身和预测自身,能帮助生物在捕食和被捕食的关系中更具竞争力)

从输入输出的观点看“我”

前面说,我是对自身状态的“预测”,从流程上来看是这样的:

step 1: 观察到周围世界的变化/自身做出某种举动去改变世界
step 2:预测这种举动对自身的影响/预测其对周围世界的影响
step 3: 感受到自身的变化符合预测结果/观察世界的变化符合预期
step 4: 由于符合预测,于是我感受我

从输入输出来看:

感受
预测
感受
预测
符合?
符合?
干预
干预
自身状态
可能未来自身状态
世界状态
可能未来世界状态
真实未来自身状态
真实未来世界状态

简单summary:
输入:自身状态,世界状态
输出:可能未来自身状态,可能未来世界状态,主观能动的干扰
额外:有度量能力判断是否“符合”

大模型的“我”

在上面的关系图里,我尝试自己胡乱“匹配”一下,当前大模型在什么位置!

前提先明确大模型工作在对话场景中,对话场景即大模型的世界结构。

输入内容

  • 世界状态:很明确,就是对话另一方的输入,大模型可以通过模型的输入清晰的感知
  • 自身状态:不明确大模型的自身状态是什么。由于自身状态是变化的,大模型参数又是固定不变的,可变的自身状态就得是其缓存的KV Cache? 那这如何感受?又如何预测?

输出内容

  • 主观的干预:很明确,接对方的话就是干预过程
  • 可能的未来自身状态:不明确,原因和输入内容不明确自身状态相同。
  • 可能的未来世界状态能够预测!! 思考到这一点我觉得很有意思也很重要。大模型拥有对自身干预对世界状态影响的预测能力(有点饶舌)。 这是由于大模型的训练过程中在预训练之后,那些用于对话的模型会再次经历一轮在对话场景的微调。
    这些数据大概长这样:[start] User: How are you? [sep] Agent: I am fine, thank you [sep] User: I am fine, too.
    我认为:当大模型在多于一个来回的对话序列中训练时,能拥有对自身干预对世界状态影响的预测能力。 例如,上面的例子中,Causal Language Model的损失函数是有学习如果自身进行了“ I am fine, thank you ”的干预后,世界会如何回应(“I am fine, too”)

额外内容:有度量能力判断是否“符合”?貌似没有,我更偏向于,这是一个强化学习/Online learning应当讨论的问题。如果只从训练的角度,它貌似部分和输出内容中对可能未来世界状态的预期重叠。从实际的角度来看,我是一个动态的概念,那应该要动态的判断是否“符合”,这个“符合”与否的结果应当参与模型“我”的动态变化(光想想就是相当有难度的问题!)。

标注在图上(使用红色和蓝色分别标注明确有的能力和不明确的能力):

感受
预测
感受
预测
符合?
符合?
干预
干预
自身状态
可能未来自身状态
世界状态
可能未来世界状态
真实未来自身状态
真实未来世界状态

乱讨论

  • 貌似,在对话场景中,大模型好像有了一部分“我”的成因,已经足够表现的像“我”了。
  • 按照之前的瞎说,模型的“我”的认知,应该是在第一阶段预训练之后才被赋予的!这一点貌似有验证的可能。如果设计一个方法去度量模型的“我”的成分:如果前面的说法有点道理的话,llama-base应当无“我”,而llama-chat应当有“我”。
  • 大模型结构设计真的没空间了吗?大模型如何感受自我状态?如何动态的“符合?”预测状态和真实状态?(btw: 我依旧不认为模型串行是最优的,我可能prefer浅层的并行的模型,这样不同的part可以更好的并行执行他们的任务如预测/符合/感受,而且在上一篇文章中我提到人的大脑能够独立并协同工作也是正常人抑制幻觉的重要能力的想法,而且我还觉得这样更容易做到节能,嘻嘻)
  • 扯淡完毕~

相关文章:

【胡乱念叨】大模型的“我”

下面的内容很有可能事实错误,胡说八道,前后不连贯,举例随意且未经考证 甚至 有意欺骗!嘻嘻。所以是【胡乱念叨】 文章目录 【胡乱念叨】大模型的“我”参数量和“我”什么是“我”从输入输出的观点看“我”大模型的“我”乱讨论 …...

Flag_AGtivity_clear_top网页编程指南如何退出多activity程序

activity的启动模式:FLAG_ACTIVITY_CLEAR_TOP和FLAG_ACTIVITY_REORDER_TO_FRONT。 1. 如果已经启动了四个Activity:A,B,C和D。在D Activity里,我们要跳到B Activity,同时希望C finish掉,可以在start…...

克隆centos网卡uuid相同如何修改

在克隆CentOS系统后,网卡的UUID相同会导致网络配置冲突,使得网络无法正常工作。要解决这个问题,你需要为每个克隆的系统生成新的UUID。 以下是解决步骤: 进入原始CentOS系统。 找到网络配置文件的位置,通常在 /etc/s…...

C语言习题~day11

1、C程序常见的错误分类不包含:( ) A.编译错误 B.链接错误 C.栈溢出 D.运行时错误 栈溢出是运行时错误的一种,因此C程序不会将栈溢出错误单独列出来,栈溢出包含在运行时错误中。 因此:选择C 2、关于VS调…...

Ansible——Playbook基本功能???

文章目录 一、Ansible Playbook介绍1、Playbook的简单组成1)“play”2)“task”3)“playbook” 2、Playbook与ad-hoc简单对比区别联系 3、YAML文件语法:---以及多个---??使用 include 指令 1. 基本结构2. 数…...

多线程学习篇一:启动多线程的三种方式

1. 继承 Thread 类 Slf4j public class MyThread extends Thread {Overridepublic void run() {log.info("MyThread run ...");}public static void main(String[] args) {MyThread myThread new MyThread();myThread.start();} } 2. 实现 Runnable 接口 Slf4j pu…...

【专题】2024跨境出海供应链洞察-更先进供应链报告合集PDF分享(附原数据表)

原文链接:https://tecdat.cn/?p37665 当前,全球化商业浪潮促使跨境电商行业飞速发展,产业带与跨境电商接轨、平台半托管模式涌现、社交电商带来红利机会以及海外仓不断扩张,这使得产业带外贸工厂、内贸工厂、传统进出口企业和品…...

git submodule

git submodule 是 Git 提供的一种功能,用于在一个 Git 仓库中嵌套另一个 Git 仓库。它可以帮助管理和跟踪外部项目或依赖项,特别是在以下场景中非常有用: 1. 管理外部依赖 当你的项目依赖于其他外部项目或库时,可以使用 git sub…...

【Power Compiler手册】13.UPF多电压设计实现(3)

创建供电端口 要创建电源和地端口,请使用`create_supply_port`命令。 供电端口的名称应该是一个简单的(非层次化的)名称,并且在其定义的层次级别上是唯一的。除非指定了`-domain`选项,否则端口是在当前作用域或层次级别创建的,当前作用域中的所有电源域都可以使用创建的…...

RTX 4090 系列即将停产,RTX 5090 系列蓄势待发

据最新消息,英伟达将于今年10月正式终结其GeForce RTX 4090及RTX 4090D两款旗舰级显卡的生产线。根据行业媒体报道,英伟达及其合作厂商将从下个月开始全面停止这两款显卡的制造。 自2022年10月问世以来,GeForce RTX 4090凭借其无与伦比的GPU…...

【MySQL】使用C语言连接数据库

看到标题,可能会疑惑,我们学习的不是C吗,为什么使用C语言去连接数据库呢??实际上,这两种语言都可以连接数据库,但是C语言提供的API没有进行封装,更有利于我们学习数据库连接。面向API编程,哈哈…...

Vue学习记录之四(watch侦听器和watchEffect高级侦听器)

watch watch 用于侦听特定的响应式数据源(如数据、计算属性等),比如ref或者是reactive时,并在其变化时执行回调函数。它适合用于处理副作用,如 API 请求或异步操作。使用 watch 适合特定数据变化的侦听,提…...

RedisTemplate操作ZSet的API

文章目录 ⛄概述⛄常见命令有⛄RedisTemplate API❄️❄️ 向集合中插入元素,并设置分数❄️❄️向集合中插入多个元素,并设置分数❄️❄️按照排名先后(从小到大)打印指定区间内的元素, -1为打印全部❄️❄️获得指定元素的分数❄️❄️返回集合内的成员个数❄️❄…...

Android 15 正式发布至 AOSP

Google官方宣布,将于近期发布了 Android 15,而在早些时候,Google已经将其源代码推送至 Android 开源项目 (AOSP)。未来几周内,Android 15 将在受支持的 Pixel 设备上正式推出,并将于今年晚些时候在三星、Honor、iQOO、…...

IEEE Electronic Library(IEL)数据库文献检索下载介绍及个人获取IEEE文献途径

一、数据库介绍 IEEE(The Institute of Electrical and Electronics Engineers,电气电子工程师学会)是目前全球最大的非营利性专业技术学会,在全球160多个国家拥有超过45万名会员。IEEE在电气电子、计算机、半导体、通讯、电力能…...

动手学习RAG:大模型重排模型 bge-reranker-v2-gemma微调

动手学习RAG: 向量模型动手学习RAG: moka-ai/m3e 模型微调deepspeed与对比学习动手学习RAG:rerank模型微调实践 bge-reranker-v2-m3动手学习RAG:迟交互模型colbert微调实践 bge-m3动手学习RAG: 大模型向量模型微调 intfloat/e5-mistral-7b-instruct动手学…...

蓝桥杯2024省C

P10898 [蓝桥杯 2024 省 C] 拼正方形 题目描述 小蓝正在玩拼图游戏,他有 7385137888721个 22的方块和 10470245 个 11 的方块,他需要从中挑出一些来拼出一个正方形,比如用 3 个 22 和 4 个 11 的方块可以拼出一个 44 的正方形,用…...

C++:内部类,匿名对象,操作符new与delete

一.内部类 1.如果一个类定义在另一个类的内部,这个内部类就叫做内部类。内部类是一个独立的类,跟定义在全局相比,他只是受外部类类域限制和访问限定符限制,所以外部类定义的对象中不包含内部类。 2.内部类默认是外部类的友元类。…...

【数据结构】排序算法---计数排序

文章目录 1. 定义2. 算法步骤3. 动图演示4. 性质5. 算法分析6. 代码实现C语言PythonJavaGo 结语 1. 定义 计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。计数排序不是基于比较的排序算法,其核心在于将输入的数据值转化为键存储在额外开辟的数组…...

mysql时间日期函数、获取当前日期和时间、日期和时间格式化、提取日期部分、日期和时间的算术操作、其他日期函数、日期和时间的比较、日期字符串转换

获取当前日期和时间 NOW():返回当前的日期和时间。CURDATE():返回当前的日期。CURTIME():返回当前的时间。 SELECT NOW(), CURDATE(), CURTIME(); 日期和时间格式化 DATE_FORMAT(date, format):根据指定的格式字符串格式化日期…...

Android开发高频面试题之——kotlin篇

Android开发高频面试题之——kotlin篇 Android开发高频面试题之——Java基础篇 Android开发高频面试题之——Kotlin基础篇 Android开发高频面试题之——Android基础篇 1. Kotlin如何实现空安全的? Kotlin 将变量划分为可空和不可空,通过查看字节码可知,声明不可空的变量会…...

8--SpringBoot原理分析、注解-详解(面试高频提问点)

目录 SpringBootApplication 1.元注解 --->元注解 Target Retention Documented Inherited 2.SpringBootConfiguration Configuration Component Indexed 3.EnableAutoConfiguration(自动配置核心注解) 4.ComponentScan Conditional Co…...

语言的枚举

不同语言的枚举 C/C枚举本质是整型,在Java中是对象,而非基本类型,可通过instanceof Object判断是否是对象类型。C#与Java不同,枚举是值类型。C语言更纯粹,枚举绝对当成整数,可以对枚举变量用整数赋值&…...

C# Redis 框架开发技术详解

引言 Redis 是一个高性能的键值存储系统,广泛用于缓存、消息队列和实时分析等场景。在 C# 中,有几个著名的库和框架可以方便地与 Redis 进行交互。以下是几个常用的 C# Redis 库: StackExchange.Redis: 这是目前最流行、最推荐的 C# Redis 客…...

Rust:Result 和 Error

在 Rust 编程语言中,错误处理是一个核心部分,用于确保程序的健売性和可靠性。Rust 通过 Result 枚举和 Error 特质(trait)来处理错误。 Result 枚举 Result 是一个泛型枚举,用于表示一个操作可能成功或失败。它有两个…...

Python基础(八)——MySql数据库

一.数据库 【库——>表——>数据】 借助数据库对数据进行组织存储,借助SQL语言对数据库、数据进行操作管理 Mysql数据库 下载:https://www.mysql.com/ 查看是否安装配置成功: 安装DBeaver用于Mysql数据库图形化 安装:…...

统一网关--gateway(仅供自己参考)

1、网关的概念: 2、网关的功能: (1):身份认证和权限校验 (2):服务路由(具体的业务路由到具体的服务),负载均衡(多台服务的话&#xff…...

【Leetcode152】分割回文串(回溯 | 递归)

文章目录 一、题目二、思路三、代码 一、题目 二、思路 具体例子和步骤:假设 s "aab",步骤如下: 初始状态: s "aab"path []res [] 第一层递归(外层循环): path []检…...

基于BiGRU+Attention实现风力涡轮机发电量多变量时序预测(PyTorch版)

前言 系列专栏:【深度学习:算法项目实战】✨︎ 涉及医疗健康、财经金融、商业零售、食品饮料、运动健身、交通运输、环境科学、社交媒体以及文本和图像处理等诸多领域,讨论了各种复杂的深度神经网络思想,如卷积神经网络、循环神经网络、生成对…...

深入探究 Flask 的应用和请求上下文

目标 读完本文后,您应该能够解释: 什么是上下文哪些数据同时存储在应用程序和请求上下文中在 Flask 中处理请求时,处理应用程序和请求上下文所需的步骤如何使用应用程序和请求上下文的代理如何在视图函数中使用current_app和代理request什么…...