当前位置: 首页 > news >正文

论文阅读:基于生物神经元的模拟游戏世界感知与学习

论文内容概述

AI要90分钟学会的游戏,人脑细胞竟在5分钟搞定了。Cell在2022年的研究中,使用80万体外神经元细胞(DishBrain)竟然学会玩70年代经典街机游戏Pong!
神经元乒乓球实验

论文链接:In vitro neurons learn and exhibit sentience when embodied in a simulated game-world (基于生物神经元的模拟游戏世界感知学习)

虽然现在人工智能发展迅速,但是人工神经网络依然难以高效地完成许多复杂任务,而这些复杂任务往往在生物神经网络上表现优异。如果我们将生物神经网络整合到数字计算机系统中,或许可以解决当前人工神经网络面临的一些困境。

在这篇文章中,作者开发了DishBrain(盘中大脑),这是一种在结构化环境中利用神经元固有的自适应计算能力的系统。该系统使用生物神经网络(神经元为人类神经元或老鼠神经元)以高密度多电极阵列为信息交流媒介与计算机系统相结合,然后计算机系统输出模拟游戏世界的相关信号,通过电生理刺激和记录给DishBrain进行信号交互以模仿街机游戏“Pong”。

应用自由能原理的主动推理理论,作者发现,在实时游戏五分钟内出现了明显的学习现象,这是在对照条件下未观察到的。进一步的实验表明,闭环结构化反馈在引发长期学习中起着重要作用。DishBrain显示出在稀疏的感官信息反馈下,出现了以目标导向方式自组织活动的能力(称之为人工生物智能),未来的应用可能进一步揭示与智能密切的细胞关联。

准确来说,DishBrain(盘中大脑)是一个实时合成生物智能平台,演示了生物神经元通过调整放电活动来进行学习。在提供的模拟游戏世界中,当提供简单的电信号输入电信号反馈时,它有能力学习执行特定目标任务。

  • 随着实验的进行,如果没有提供电信号反馈,将观察不到明显的表现改善;如果完整提供电信号反馈,将看到因为学习而得到的表现改善。
  • 观察到的人类神经元和老鼠神经元均有学习能力,并且人类神经元的学习能力高于老鼠神经元。
  • 实验过程中观察到神经元放电活动一直在变化,一开始的游戏表现可能不太好,但随着实验的进行会越来越好。

基本原理介绍

合成生物智能SBI(Synthetic Biological Intelligence):合成生物学与人工智能交叉领域,是未来脑科学发展一个可能大热的风口,这篇论文属于SBI领域。

生物神经网络BNN(Biological Neuronal Network):生物神经网络基于动物神经元发展,人工神经网络基于神经元数学模型发展,两者原理上存在较大差异。

生物智能主要分两方面:体内生物智能体外生物智能。像脑机接口等等更多像体内生物智能,生物神经网络主要存活在生物体内;而合成生物智能更多探索体外生物智能,比如这篇文章就是体外培养生物神经网络来与计算机系统结合。

自由能原理(Free Energy Principle, FEP)是由卡尔·弗里斯顿(Karl Friston)提出的理论框架,它试图解释生物系统是如何维持其内部稳态并预测外部环境的。该理论的核心思想是,生物系统通过最小化其预测误差(即观察到的与预期的状态之间的差异)来降低自由能,从而保持生存和繁衍。

自由能的概述

自由能原理认为,所有生命系统都在不断地试图降低它们的自由能,以保持一种低熵状态,即维持内部稳态。自由能可以被视为一个代理,用来衡量一个系统与它期望状态之间的不匹配程度。当系统能够准确预测其环境时,自由能就会降低。如果系统不能准确预测,则需要通过学习或改变行为来减小预测误差,从而降低自由能。

主动推理理论

主动推理(Active Inference)是自由能原理的一个重要组成部分,它关注的是生物系统如何通过行为来影响其周围环境,以最小化预测误差。主动推理理论认为,生物系统不仅被动地适应环境,而且还通过积极的行为来塑造环境,以使自身预测更加准确。

主动推理观点

  1. 预测编码:生物系统通过构建关于世界的内部模型来进行预测,并根据这些预测采取行动。
  2. 最小化预测误差:生物系统通过感知输入和主动行为来最小化预测误差,即观察到的状态与预测状态之间的差异。
  3. 感知行为的一致性:感知和行为被视为同一过程的不同方面,都是为了最小化自由能。
  4. 行为选择:行为的选择是基于对未来状态的预测来最小化未来自由能的期望值。

主动推理应用

主动推理理论已被应用于多个领域,包括认知科学、心理学、神经科学以及人工智能。它为理解生物系统如何进行决策、规划行为以及如何与环境互动提供了理论基础。

  • 感知行为一致性:当你伸手去拿一个杯子时,你的大脑会根据过去的经历预测杯子的位置和重量。如果预测与实际感受不符(比如杯子比预期轻),你会调整握力以减少预测误差。
  • 决策制定:在面对不确定情境时,生物体会基于其内部模型对未来状态进行预测,并选择能够最大化降低未来自由能的行为路径。

实验整体设计

神经细胞获取

要想有一个生物神经网络(BNN)芯片,第一步就是获取很多的神经细胞,论文里主要使用两类神经细胞,即人类神经细胞和老鼠神经细胞,那么要怎么获得呢?

如果想要获取的是人类的神经元细胞,那么需要从干细胞开始培养,然后刺激干细胞分化成神经细胞,干细胞分化成神经细胞之后数量就会稳定了,后续实验过程只需要给人类神经细胞提供营养即可,整个神经细胞的制备周期是30天。

如果使用老鼠的神经细胞,那就比较简单了,没有道德问题,可以直接培养老鼠胚胎,然后把脑子摘出来,然后直接用就完事了,基本不需要培养,制备周期也短了很多。


左图为人类神经细胞HCC,右图为老鼠神经细胞MCC。

智能芯片生态

有了神经细胞之后,下一步就是把神经细胞放到芯片上培养,继续给神经细胞提供养分。

可以看到,该智能系统有两个子系统:细胞芯片系统HD-MEA Chip计算机系统Pong,两者通过物理线路进行信息传输。

信息交互过程

先给出细胞芯片子系统的平面图:

在图片中,神经细胞是均匀分布在芯片上面的,蓝点代表电极,用于神经细胞与计算机之间交换信息。明显图中存在上半,左下,右下三块电极区域,上半电极区域是感知区,用于接收屏幕信息输出(由此得到小球和平板的位置状态);左下和右下电极区域是运动区,用于输出平板移动信息,具体设置如下:

action1为向上运动,action为向下运动,左下电极区域得到一组向上运动和向下运动的信号,右下电极区域得到另一组向上运动和向下运动的信号,两组数据求平均得到最终的运动控制信号。

实验过程分析

学习方法的原理特别简单,就是不停的让这个生物芯片玩Pong这个游戏,并且在玩的好的时候奖励它,玩的不好(没接住球)的时候惩罚他。

当BNN犯了一个错误的时候,比如没有接到球的时候,就给他一些无法预测的电信号惩罚他(可能是随机生成);而当BNN接住了球的时候,那应该奖励他,就给他一些可以预测的电信号(可能是固定模式)。

相关参考资料

https://www.cell.com/neuron/pdfExtended/S0896-6273(22)00806-6
https://zhuanlan.zhihu.com/p/648547119
https://baijiahao.baidu.com/s?id=1746550954055561171&wfr=spider&for=pc

相关文章:

论文阅读:基于生物神经元的模拟游戏世界感知与学习

论文内容概述 AI要90分钟学会的游戏,人脑细胞竟在5分钟搞定了。Cell在2022年的研究中,使用80万体外神经元细胞(DishBrain)竟然学会玩70年代经典街机游戏Pong! 论文链接:In vitro neurons learn and exhibit sentience when emb…...

理解最先进模型的起点GPT-2 源码 配置的解释

理解最先进模型的起点GPT-2 源码 配置的解释 flyfish 为训练GPT模型设置和管理配置参数、日志记录以及实验的可重复性 理解最先进模型的起点GPT-2 理论知识 理解最先进模型的起点GPT-2 源码 注释 模型部分(from mingpt.model) utils.py import os import sys import json im…...

C++11 可变参数模板

C11的新特性可变参数模板能够创建可以接受可变参数的函数模板和类模板,相比C98/03,类模版和函数模版中只能含固定数量的模版参数,可变模版参数无疑是一个巨大的改进。然而由于可变模版参数比较抽象,使用起来需要一定的技巧&#x…...

项目实战——外挂开发(30小时精通C++和外挂实战)

项目实战——外挂开发(30小时精通C和外挂实战) 外挂开发1-监控游戏外挂开发2-秒杀僵尸外挂开发3-阳光地址分析外挂开发4-模拟阳光外挂开发5-无限阳光 外挂开发1-监控游戏 外挂的本质 有两种方式 1,修改内存中的数据 2,更改内存中…...

【人工智能专栏】Constructive损失解析

Constructive Loss 相比较于 MSE Loss \text{MSE Loss} MSE Loss 和 MAE Loss \text{MAE Loss} MAE Loss 直接将结果与目标数值比较的做法,使用 Constru...

PHP经销商订货管理系统小程序源码

经销商订货管理系统:重塑供应链效率的利器 🚀 开篇:解锁供应链管理的新纪元 在竞争激烈的商业环境中,经销商作为供应链的关键一环,其订货效率直接影响到整个供应链的流畅度和响应速度。传统的订货方式往往繁琐、易出…...

【网络世界】HTTPS协议

目录 🌈前言🌈 📁 HTTP缺陷 📁 HTTPS 📂 概念 📂 加密 📂 加密方式 📁 中间人攻击 📁 CA机构和证书 📂 数据摘要(数据指纹) &…...

根据空域图信息构造飞机航线图以及飞行轨迹模拟matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.本算法原理 4.1 航路网络建模 4.2 航线图构建 4.3 飞行轨迹模拟的具体步骤 5.完整程序 1.程序功能描述 空域图是指航空领域中的一种图形表示方式,它涵盖了空中交通管理所需要的各种信息&a…...

llama-factory 系列教程 (五),SFT 微调后的模型,结合langchain进行推理

背景 微调了一个 glm4-9B的大模型。微调后得到Lora权重,部署成vllm 的API,然后通过langchain接入完成相关任务的推理。 关于SFT 微调模型的部分就不做介绍了,大家可以参考前面的文章,将自己的数据集 在 Llamafactory 的 dataset…...

hive 中编写生成连续月sql

记录一下 sql 编写生成从一个确定的起始月份到当前月份的连续月份序列 SELECT substr(add_months(table1.start_dt,table2.pos),1,4) AS INDICT_YEAR,substr(add_months(table1.start_dt,table2.pos),1,7) AS INDICT_MON FROM (SELECT 2024-01-01 AS start_dt,substr(CURRE…...

前端开发实用的网站合集

文章目录 一、技能提升篇vueuseJavaScript中文网JavaScript.infoRxJsWeb安全学习书栈网码农之家 二、UI篇iconfont:阿里巴巴矢量图标库IconPark3dicons美叶UndrawError 404摹克 三、CSS篇You-need-to-know-cssCSS TricksAnimate.cssCSS ScanCSS Filter 四、颜色篇中…...

蓄势赋能 数智化转型掌舵人百望云杨正道荣膺“先锋人物”

2024年,在数据与智能的双涡轮驱动下,我们迎来了一个以智能科技为核心的新质生产力大爆发时代。在数智化浪潮的推动下,全球企业正站在转型升级的十字路口。在这个充满变革的时代,企业转型升级的道路充满挑战,但也孕育着…...

(七)前端javascript中的函数式编程技巧2

函数式编程范式的技巧 迭代算法-可以替代for in let count 10;while (count--) {console.log(count); }斐波拉契的实现 function fabci(n) {console.log("🚀 ~ fabci ~ n:", n);if (n 1 || n 2) {return 1;}return fabci(n - 1) fabci(n - 2);}cons…...

LeetCode热题 翻转二叉树、二叉树最大深度、二叉树中序遍历

目录 一、翻转二叉树 1.1 题目链接 1.2 题目描述 1.3 解题思路 二、二叉树最大深度 2.1 题目链接 2.2 题目描述 2.3 解题思路 三、二叉树中序遍历 3.1 题目链接 3.2 题目描述 3.3 解题思路 一、翻转二叉树 1.1 题目链接 翻转二叉树 1.2 题目描述 1.3 解题思路 根…...

DNS查询服务器的基本流程以及https的加密过程

DNS查询服务器的基本流程,能画出图更好,并说明为什么DNS查询为什么不直接从单一服务器查询ip,而是要经过多次查询,多次查询不会增加开销么(即DNS多级查询的优点)? 用户发起请求:用户…...

后台管理系统(springboot+vue3+mysql)

系列文章目录 1.SpringBoot整合RabbitMQ并实现消息发送与接收 2. 解析JSON格式参数 & 修改对象的key 3. VUE整合Echarts实现简单的数据可视化 4. List<HashMap<String,String>>实现自定义字符串排序(key排序、Val…...

Android经典面试题之Kotlin中 if 和 let的区别

本文首发于公众号“AntDream”,欢迎微信搜索“AntDream”或扫描文章底部二维码关注,和我一起每天进步一点点 在Kotlin中,if和let虽然有时候用来处理相似的情景,但它们实际上是用于不同的场景并具有不同的性质。下面我们来详细对比…...

python inf是什么意思

INF / inf:这个值表示“无穷大 (infinity 的缩写)”,即超出了计算机可以表示的浮点数的范围(或者说超过了 double 类型的值)。例如,当用 0 除一个整数时便会得到一个1.#INF / inf值;相应的,如果…...

Cursor搭配cmake实现C++程序的编译、运行和调试

Cursor搭配cmake实现C程序的编译、运行和调试 Cursor是一个开源的AI编程编辑器,开源地址https://github.com/getcursor/cursor ,它其实是一个集成了Chat-GPT的VS Code。 关于VS Code和VS的对比可以参考这篇文章VS Code 和 Visual Studio 哪个更好&…...

C#-了解ORM框架SqlSugar并快速使用(附工具)

目录 一、配置 二、操作步骤 1、根据配置映射数据库对象 2、实体配置 3、创建表 4、增删改查 增加数据 删除数据 更新数据 查询数据 5、导航增删改查 增加数据 删除数据 更新数据 查询数据 6、雪花ID 三、工具 SqlLite可视化工具 MySQL安装包 MySQL可视化…...

调用支付宝接口响应40004 SYSTEM_ERROR问题排查

在对接支付宝API的时候,遇到了一些问题,记录一下排查过程。 Body:{"datadigital_fincloud_generalsaas_face_certify_initialize_response":{"msg":"Business Failed","code":"40004","sub_msg…...

连锁超市冷库节能解决方案:如何实现超市降本增效

在连锁超市冷库运营中,高能耗、设备损耗快、人工管理低效等问题长期困扰企业。御控冷库节能解决方案通过智能控制化霜、按需化霜、实时监控、故障诊断、自动预警、远程控制开关六大核心技术,实现年省电费15%-60%,且不改动原有装备、安装快捷、…...

五年级数学知识边界总结思考-下册

目录 一、背景二、过程1.观察物体小学五年级下册“观察物体”知识点详解:由来、作用与意义**一、知识点核心内容****二、知识点的由来:从生活实践到数学抽象****三、知识的作用:解决实际问题的工具****四、学习的意义:培养核心素养…...

江苏艾立泰跨国资源接力:废料变黄金的绿色供应链革命

在华东塑料包装行业面临限塑令深度调整的背景下,江苏艾立泰以一场跨国资源接力的创新实践,重新定义了绿色供应链的边界。 跨国回收网络:废料变黄金的全球棋局 艾立泰在欧洲、东南亚建立再生塑料回收点,将海外废弃包装箱通过标准…...

Cloudflare 从 Nginx 到 Pingora:性能、效率与安全的全面升级

在互联网的快速发展中,高性能、高效率和高安全性的网络服务成为了各大互联网基础设施提供商的核心追求。Cloudflare 作为全球领先的互联网安全和基础设施公司,近期做出了一个重大技术决策:弃用长期使用的 Nginx,转而采用其内部开发…...

让AI看见世界:MCP协议与服务器的工作原理

让AI看见世界:MCP协议与服务器的工作原理 MCP(Model Context Protocol)是一种创新的通信协议,旨在让大型语言模型能够安全、高效地与外部资源进行交互。在AI技术快速发展的今天,MCP正成为连接AI与现实世界的重要桥梁。…...

MySQL中【正则表达式】用法

MySQL 中正则表达式通过 REGEXP 或 RLIKE 操作符实现(两者等价),用于在 WHERE 子句中进行复杂的字符串模式匹配。以下是核心用法和示例: 一、基础语法 SELECT column_name FROM table_name WHERE column_name REGEXP pattern; …...

聊一聊接口测试的意义有哪些?

目录 一、隔离性 & 早期测试 二、保障系统集成质量 三、验证业务逻辑的核心层 四、提升测试效率与覆盖度 五、系统稳定性的守护者 六、驱动团队协作与契约管理 七、性能与扩展性的前置评估 八、持续交付的核心支撑 接口测试的意义可以从四个维度展开,首…...

DeepSeek 技术赋能无人农场协同作业:用 AI 重构农田管理 “神经网”

目录 一、引言二、DeepSeek 技术大揭秘2.1 核心架构解析2.2 关键技术剖析 三、智能农业无人农场协同作业现状3.1 发展现状概述3.2 协同作业模式介绍 四、DeepSeek 的 “农场奇妙游”4.1 数据处理与分析4.2 作物生长监测与预测4.3 病虫害防治4.4 农机协同作业调度 五、实际案例大…...

人机融合智能 | “人智交互”跨学科新领域

本文系统地提出基于“以人为中心AI(HCAI)”理念的人-人工智能交互(人智交互)这一跨学科新领域及框架,定义人智交互领域的理念、基本理论和关键问题、方法、开发流程和参与团队等,阐述提出人智交互新领域的意义。然后,提出人智交互研究的三种新范式取向以及它们的意义。最后,总结…...