当前位置: 首页 > news >正文

论文阅读:基于生物神经元的模拟游戏世界感知与学习

论文内容概述

AI要90分钟学会的游戏,人脑细胞竟在5分钟搞定了。Cell在2022年的研究中,使用80万体外神经元细胞(DishBrain)竟然学会玩70年代经典街机游戏Pong!
神经元乒乓球实验

论文链接:In vitro neurons learn and exhibit sentience when embodied in a simulated game-world (基于生物神经元的模拟游戏世界感知学习)

虽然现在人工智能发展迅速,但是人工神经网络依然难以高效地完成许多复杂任务,而这些复杂任务往往在生物神经网络上表现优异。如果我们将生物神经网络整合到数字计算机系统中,或许可以解决当前人工神经网络面临的一些困境。

在这篇文章中,作者开发了DishBrain(盘中大脑),这是一种在结构化环境中利用神经元固有的自适应计算能力的系统。该系统使用生物神经网络(神经元为人类神经元或老鼠神经元)以高密度多电极阵列为信息交流媒介与计算机系统相结合,然后计算机系统输出模拟游戏世界的相关信号,通过电生理刺激和记录给DishBrain进行信号交互以模仿街机游戏“Pong”。

应用自由能原理的主动推理理论,作者发现,在实时游戏五分钟内出现了明显的学习现象,这是在对照条件下未观察到的。进一步的实验表明,闭环结构化反馈在引发长期学习中起着重要作用。DishBrain显示出在稀疏的感官信息反馈下,出现了以目标导向方式自组织活动的能力(称之为人工生物智能),未来的应用可能进一步揭示与智能密切的细胞关联。

准确来说,DishBrain(盘中大脑)是一个实时合成生物智能平台,演示了生物神经元通过调整放电活动来进行学习。在提供的模拟游戏世界中,当提供简单的电信号输入电信号反馈时,它有能力学习执行特定目标任务。

  • 随着实验的进行,如果没有提供电信号反馈,将观察不到明显的表现改善;如果完整提供电信号反馈,将看到因为学习而得到的表现改善。
  • 观察到的人类神经元和老鼠神经元均有学习能力,并且人类神经元的学习能力高于老鼠神经元。
  • 实验过程中观察到神经元放电活动一直在变化,一开始的游戏表现可能不太好,但随着实验的进行会越来越好。

基本原理介绍

合成生物智能SBI(Synthetic Biological Intelligence):合成生物学与人工智能交叉领域,是未来脑科学发展一个可能大热的风口,这篇论文属于SBI领域。

生物神经网络BNN(Biological Neuronal Network):生物神经网络基于动物神经元发展,人工神经网络基于神经元数学模型发展,两者原理上存在较大差异。

生物智能主要分两方面:体内生物智能体外生物智能。像脑机接口等等更多像体内生物智能,生物神经网络主要存活在生物体内;而合成生物智能更多探索体外生物智能,比如这篇文章就是体外培养生物神经网络来与计算机系统结合。

自由能原理(Free Energy Principle, FEP)是由卡尔·弗里斯顿(Karl Friston)提出的理论框架,它试图解释生物系统是如何维持其内部稳态并预测外部环境的。该理论的核心思想是,生物系统通过最小化其预测误差(即观察到的与预期的状态之间的差异)来降低自由能,从而保持生存和繁衍。

自由能的概述

自由能原理认为,所有生命系统都在不断地试图降低它们的自由能,以保持一种低熵状态,即维持内部稳态。自由能可以被视为一个代理,用来衡量一个系统与它期望状态之间的不匹配程度。当系统能够准确预测其环境时,自由能就会降低。如果系统不能准确预测,则需要通过学习或改变行为来减小预测误差,从而降低自由能。

主动推理理论

主动推理(Active Inference)是自由能原理的一个重要组成部分,它关注的是生物系统如何通过行为来影响其周围环境,以最小化预测误差。主动推理理论认为,生物系统不仅被动地适应环境,而且还通过积极的行为来塑造环境,以使自身预测更加准确。

主动推理观点

  1. 预测编码:生物系统通过构建关于世界的内部模型来进行预测,并根据这些预测采取行动。
  2. 最小化预测误差:生物系统通过感知输入和主动行为来最小化预测误差,即观察到的状态与预测状态之间的差异。
  3. 感知行为的一致性:感知和行为被视为同一过程的不同方面,都是为了最小化自由能。
  4. 行为选择:行为的选择是基于对未来状态的预测来最小化未来自由能的期望值。

主动推理应用

主动推理理论已被应用于多个领域,包括认知科学、心理学、神经科学以及人工智能。它为理解生物系统如何进行决策、规划行为以及如何与环境互动提供了理论基础。

  • 感知行为一致性:当你伸手去拿一个杯子时,你的大脑会根据过去的经历预测杯子的位置和重量。如果预测与实际感受不符(比如杯子比预期轻),你会调整握力以减少预测误差。
  • 决策制定:在面对不确定情境时,生物体会基于其内部模型对未来状态进行预测,并选择能够最大化降低未来自由能的行为路径。

实验整体设计

神经细胞获取

要想有一个生物神经网络(BNN)芯片,第一步就是获取很多的神经细胞,论文里主要使用两类神经细胞,即人类神经细胞和老鼠神经细胞,那么要怎么获得呢?

如果想要获取的是人类的神经元细胞,那么需要从干细胞开始培养,然后刺激干细胞分化成神经细胞,干细胞分化成神经细胞之后数量就会稳定了,后续实验过程只需要给人类神经细胞提供营养即可,整个神经细胞的制备周期是30天。

如果使用老鼠的神经细胞,那就比较简单了,没有道德问题,可以直接培养老鼠胚胎,然后把脑子摘出来,然后直接用就完事了,基本不需要培养,制备周期也短了很多。


左图为人类神经细胞HCC,右图为老鼠神经细胞MCC。

智能芯片生态

有了神经细胞之后,下一步就是把神经细胞放到芯片上培养,继续给神经细胞提供养分。

可以看到,该智能系统有两个子系统:细胞芯片系统HD-MEA Chip计算机系统Pong,两者通过物理线路进行信息传输。

信息交互过程

先给出细胞芯片子系统的平面图:

在图片中,神经细胞是均匀分布在芯片上面的,蓝点代表电极,用于神经细胞与计算机之间交换信息。明显图中存在上半,左下,右下三块电极区域,上半电极区域是感知区,用于接收屏幕信息输出(由此得到小球和平板的位置状态);左下和右下电极区域是运动区,用于输出平板移动信息,具体设置如下:

action1为向上运动,action为向下运动,左下电极区域得到一组向上运动和向下运动的信号,右下电极区域得到另一组向上运动和向下运动的信号,两组数据求平均得到最终的运动控制信号。

实验过程分析

学习方法的原理特别简单,就是不停的让这个生物芯片玩Pong这个游戏,并且在玩的好的时候奖励它,玩的不好(没接住球)的时候惩罚他。

当BNN犯了一个错误的时候,比如没有接到球的时候,就给他一些无法预测的电信号惩罚他(可能是随机生成);而当BNN接住了球的时候,那应该奖励他,就给他一些可以预测的电信号(可能是固定模式)。

相关参考资料

https://www.cell.com/neuron/pdfExtended/S0896-6273(22)00806-6
https://zhuanlan.zhihu.com/p/648547119
https://baijiahao.baidu.com/s?id=1746550954055561171&wfr=spider&for=pc

相关文章:

论文阅读:基于生物神经元的模拟游戏世界感知与学习

论文内容概述 AI要90分钟学会的游戏,人脑细胞竟在5分钟搞定了。Cell在2022年的研究中,使用80万体外神经元细胞(DishBrain)竟然学会玩70年代经典街机游戏Pong! 论文链接:In vitro neurons learn and exhibit sentience when emb…...

理解最先进模型的起点GPT-2 源码 配置的解释

理解最先进模型的起点GPT-2 源码 配置的解释 flyfish 为训练GPT模型设置和管理配置参数、日志记录以及实验的可重复性 理解最先进模型的起点GPT-2 理论知识 理解最先进模型的起点GPT-2 源码 注释 模型部分(from mingpt.model) utils.py import os import sys import json im…...

C++11 可变参数模板

C11的新特性可变参数模板能够创建可以接受可变参数的函数模板和类模板,相比C98/03,类模版和函数模版中只能含固定数量的模版参数,可变模版参数无疑是一个巨大的改进。然而由于可变模版参数比较抽象,使用起来需要一定的技巧&#x…...

项目实战——外挂开发(30小时精通C++和外挂实战)

项目实战——外挂开发(30小时精通C和外挂实战) 外挂开发1-监控游戏外挂开发2-秒杀僵尸外挂开发3-阳光地址分析外挂开发4-模拟阳光外挂开发5-无限阳光 外挂开发1-监控游戏 外挂的本质 有两种方式 1,修改内存中的数据 2,更改内存中…...

【人工智能专栏】Constructive损失解析

Constructive Loss 相比较于 MSE Loss \text{MSE Loss} MSE Loss 和 MAE Loss \text{MAE Loss} MAE Loss 直接将结果与目标数值比较的做法,使用 Constru...

PHP经销商订货管理系统小程序源码

经销商订货管理系统:重塑供应链效率的利器 🚀 开篇:解锁供应链管理的新纪元 在竞争激烈的商业环境中,经销商作为供应链的关键一环,其订货效率直接影响到整个供应链的流畅度和响应速度。传统的订货方式往往繁琐、易出…...

【网络世界】HTTPS协议

目录 🌈前言🌈 📁 HTTP缺陷 📁 HTTPS 📂 概念 📂 加密 📂 加密方式 📁 中间人攻击 📁 CA机构和证书 📂 数据摘要(数据指纹) &…...

根据空域图信息构造飞机航线图以及飞行轨迹模拟matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.本算法原理 4.1 航路网络建模 4.2 航线图构建 4.3 飞行轨迹模拟的具体步骤 5.完整程序 1.程序功能描述 空域图是指航空领域中的一种图形表示方式,它涵盖了空中交通管理所需要的各种信息&a…...

llama-factory 系列教程 (五),SFT 微调后的模型,结合langchain进行推理

背景 微调了一个 glm4-9B的大模型。微调后得到Lora权重,部署成vllm 的API,然后通过langchain接入完成相关任务的推理。 关于SFT 微调模型的部分就不做介绍了,大家可以参考前面的文章,将自己的数据集 在 Llamafactory 的 dataset…...

hive 中编写生成连续月sql

记录一下 sql 编写生成从一个确定的起始月份到当前月份的连续月份序列 SELECT substr(add_months(table1.start_dt,table2.pos),1,4) AS INDICT_YEAR,substr(add_months(table1.start_dt,table2.pos),1,7) AS INDICT_MON FROM (SELECT 2024-01-01 AS start_dt,substr(CURRE…...

前端开发实用的网站合集

文章目录 一、技能提升篇vueuseJavaScript中文网JavaScript.infoRxJsWeb安全学习书栈网码农之家 二、UI篇iconfont:阿里巴巴矢量图标库IconPark3dicons美叶UndrawError 404摹克 三、CSS篇You-need-to-know-cssCSS TricksAnimate.cssCSS ScanCSS Filter 四、颜色篇中…...

蓄势赋能 数智化转型掌舵人百望云杨正道荣膺“先锋人物”

2024年,在数据与智能的双涡轮驱动下,我们迎来了一个以智能科技为核心的新质生产力大爆发时代。在数智化浪潮的推动下,全球企业正站在转型升级的十字路口。在这个充满变革的时代,企业转型升级的道路充满挑战,但也孕育着…...

(七)前端javascript中的函数式编程技巧2

函数式编程范式的技巧 迭代算法-可以替代for in let count 10;while (count--) {console.log(count); }斐波拉契的实现 function fabci(n) {console.log("🚀 ~ fabci ~ n:", n);if (n 1 || n 2) {return 1;}return fabci(n - 1) fabci(n - 2);}cons…...

LeetCode热题 翻转二叉树、二叉树最大深度、二叉树中序遍历

目录 一、翻转二叉树 1.1 题目链接 1.2 题目描述 1.3 解题思路 二、二叉树最大深度 2.1 题目链接 2.2 题目描述 2.3 解题思路 三、二叉树中序遍历 3.1 题目链接 3.2 题目描述 3.3 解题思路 一、翻转二叉树 1.1 题目链接 翻转二叉树 1.2 题目描述 1.3 解题思路 根…...

DNS查询服务器的基本流程以及https的加密过程

DNS查询服务器的基本流程,能画出图更好,并说明为什么DNS查询为什么不直接从单一服务器查询ip,而是要经过多次查询,多次查询不会增加开销么(即DNS多级查询的优点)? 用户发起请求:用户…...

后台管理系统(springboot+vue3+mysql)

系列文章目录 1.SpringBoot整合RabbitMQ并实现消息发送与接收 2. 解析JSON格式参数 & 修改对象的key 3. VUE整合Echarts实现简单的数据可视化 4. List<HashMap<String,String>>实现自定义字符串排序(key排序、Val…...

Android经典面试题之Kotlin中 if 和 let的区别

本文首发于公众号“AntDream”,欢迎微信搜索“AntDream”或扫描文章底部二维码关注,和我一起每天进步一点点 在Kotlin中,if和let虽然有时候用来处理相似的情景,但它们实际上是用于不同的场景并具有不同的性质。下面我们来详细对比…...

python inf是什么意思

INF / inf:这个值表示“无穷大 (infinity 的缩写)”,即超出了计算机可以表示的浮点数的范围(或者说超过了 double 类型的值)。例如,当用 0 除一个整数时便会得到一个1.#INF / inf值;相应的,如果…...

Cursor搭配cmake实现C++程序的编译、运行和调试

Cursor搭配cmake实现C程序的编译、运行和调试 Cursor是一个开源的AI编程编辑器,开源地址https://github.com/getcursor/cursor ,它其实是一个集成了Chat-GPT的VS Code。 关于VS Code和VS的对比可以参考这篇文章VS Code 和 Visual Studio 哪个更好&…...

C#-了解ORM框架SqlSugar并快速使用(附工具)

目录 一、配置 二、操作步骤 1、根据配置映射数据库对象 2、实体配置 3、创建表 4、增删改查 增加数据 删除数据 更新数据 查询数据 5、导航增删改查 增加数据 删除数据 更新数据 查询数据 6、雪花ID 三、工具 SqlLite可视化工具 MySQL安装包 MySQL可视化…...

【杂谈】-递归进化:人工智能的自我改进与监管挑战

递归进化:人工智能的自我改进与监管挑战 文章目录 递归进化:人工智能的自我改进与监管挑战1、自我改进型人工智能的崛起2、人工智能如何挑战人类监管?3、确保人工智能受控的策略4、人类在人工智能发展中的角色5、平衡自主性与控制力6、总结与…...

R语言AI模型部署方案:精准离线运行详解

R语言AI模型部署方案:精准离线运行详解 一、项目概述 本文将构建一个完整的R语言AI部署解决方案,实现鸢尾花分类模型的训练、保存、离线部署和预测功能。核心特点: 100%离线运行能力自包含环境依赖生产级错误处理跨平台兼容性模型版本管理# 文件结构说明 Iris_AI_Deployme…...

多场景 OkHttpClient 管理器 - Android 网络通信解决方案

下面是一个完整的 Android 实现&#xff0c;展示如何创建和管理多个 OkHttpClient 实例&#xff0c;分别用于长连接、普通 HTTP 请求和文件下载场景。 <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas…...

基于uniapp+WebSocket实现聊天对话、消息监听、消息推送、聊天室等功能,多端兼容

基于 ​UniApp + WebSocket​实现多端兼容的实时通讯系统,涵盖WebSocket连接建立、消息收发机制、多端兼容性配置、消息实时监听等功能,适配​微信小程序、H5、Android、iOS等终端 目录 技术选型分析WebSocket协议优势UniApp跨平台特性WebSocket 基础实现连接管理消息收发连接…...

UE5 学习系列(三)创建和移动物体

这篇博客是该系列的第三篇&#xff0c;是在之前两篇博客的基础上展开&#xff0c;主要介绍如何在操作界面中创建和拖动物体&#xff0c;这篇博客跟随的视频链接如下&#xff1a; B 站视频&#xff1a;s03-创建和移动物体 如果你不打算开之前的博客并且对UE5 比较熟的话按照以…...

在 Nginx Stream 层“改写”MQTT ngx_stream_mqtt_filter_module

1、为什么要修改 CONNECT 报文&#xff1f; 多租户隔离&#xff1a;自动为接入设备追加租户前缀&#xff0c;后端按 ClientID 拆分队列。零代码鉴权&#xff1a;将入站用户名替换为 OAuth Access-Token&#xff0c;后端 Broker 统一校验。灰度发布&#xff1a;根据 IP/地理位写…...

2023赣州旅游投资集团

单选题 1.“不登高山&#xff0c;不知天之高也&#xff1b;不临深溪&#xff0c;不知地之厚也。”这句话说明_____。 A、人的意识具有创造性 B、人的认识是独立于实践之外的 C、实践在认识过程中具有决定作用 D、人的一切知识都是从直接经验中获得的 参考答案: C 本题解…...

【从零学习JVM|第三篇】类的生命周期(高频面试题)

前言&#xff1a; 在Java编程中&#xff0c;类的生命周期是指类从被加载到内存中开始&#xff0c;到被卸载出内存为止的整个过程。了解类的生命周期对于理解Java程序的运行机制以及性能优化非常重要。本文会深入探寻类的生命周期&#xff0c;让读者对此有深刻印象。 目录 ​…...

宇树科技,改名了!

提到国内具身智能和机器人领域的代表企业&#xff0c;那宇树科技&#xff08;Unitree&#xff09;必须名列其榜。 最近&#xff0c;宇树科技的一项新变动消息在业界引发了不少关注和讨论&#xff0c;即&#xff1a; 宇树向其合作伙伴发布了一封公司名称变更函称&#xff0c;因…...

Golang——9、反射和文件操作

反射和文件操作 1、反射1.1、reflect.TypeOf()获取任意值的类型对象1.2、reflect.ValueOf()1.3、结构体反射 2、文件操作2.1、os.Open()打开文件2.2、方式一&#xff1a;使用Read()读取文件2.3、方式二&#xff1a;bufio读取文件2.4、方式三&#xff1a;os.ReadFile读取2.5、写…...