当前位置: 首页 > news >正文

人究其一生只是在通用智能模型基础上作微调和对齐

Yann LeCun 在 WGS 上说:

目前的LLM不可能走到AGI,原因很简单,现在训练这些LLM所使用的数据量为10万亿个令牌,也就是130亿个词,如果你计算人类阅读这些数据需要多长时间,一个人每天阅读8小时,需要15万年才能读完。

但如果看一个4岁的孩子,已经清醒了总共16,000个小时,但如果你计算进入视觉皮层的数据量,大约每秒20兆字节,那么4年输入的数据量,将是目前最大的LLM的50倍。

因此仅通过在文本上训练AI,永远无法达到人类水平智能。

文本是一个非常贫瘠的信息来源,带宽非常低,只反映了人类知识的很小一部分。人类的大部分知识来自于我们与真实世界、与他人以及其他世界实体的互动,而不是来自语言。

在AI取得真正的进步之前,我们需要一些突破。这个突破将从哪里来?可能是科学层面,不会仅仅通过扩展现有的架构规模并在更多数据上训练它们就能实现。

首先,随着我们增加LLM的数据量,性能正在趋于饱和,我们没有更多的数据,已经用完了互联网上的所有公开数据,所以这行不通(不认可合成数据?)。

婴儿大约只需要九个月就能学会直觉物理学,即物体如果没有支撑物就会因为重力而掉落,他们使用的是哪种学习方式,这仍然是一个谜,我们正在努力解决这个问题,但还需要一段时间。”

铅笔楼:打个可能不太恰当的比方,婴儿的大脑更像是预训练模型,人类亿万年的进化史给每个人提供了通用智能模型,每一个人究其一生只是在通用智能模型的基础之上作微调和对齐。

相关文章:

人究其一生只是在通用智能模型基础上作微调和对齐

Yann LeCun 在 WGS 上说: 目前的LLM不可能走到AGI,原因很简单,现在训练这些LLM所使用的数据量为10万亿个令牌,也就是130亿个词,如果你计算人类阅读这些数据需要多长时间,一个人每天阅读8小时,需…...

DS:二叉树的链式结构及实现

创作不易,友友们给个三连吧!! 一、前言 前期我们解释过二叉树的顺序结构(堆)为什么比较适用于完全二叉树,因为如果用数组来实现非完全二叉树,那么数组的中间部分就可能会存在大量的空间浪费。 …...

PhP+vue企业原材料采购系统_cxg0o

伴随着我国社会的发展,人民生活质量日益提高。互联网逐步进入千家万户,改变传统的管理方式,原材料采购系统以互联网为基础,利用php技术,结合vue框架和MySQL数据库开发设计一套原材料采购系统,提高工作效率的…...

C++线程池

原因 如果线程的数量很多,频繁的创建和销毁线程会降低系统的效率。线程池可以使线程复用。 using typedef 内联函数和宏定义区别: 内联函数代替部分#define宏定义;代替普通函数,提高程序效率...

SpringCloud-Hystrix:服务熔断与服务降级

8. Hystrix:服务熔断 分布式系统面临的问题 复杂分布式体系结构中的应用程序有数十个依赖关系,每个依赖关系在某些时候将不可避免失败! 8.1 服务雪崩 多个微服务之间调用的时候,假设微服务A调用微服务B和微服务C,微服…...

浅谈Linux环境

冯诺依曼体系结构: 绝大多数的计算机都遵守冯诺依曼体系结构 在冯诺依曼体系结构下各个硬件相互配合处理数据并反馈结果给用户 其中控制器和运算器统称为中央处理器(CPU),是计算机硬件中最核心的部分,像人类的大脑操控…...

Spring 用法学习总结(一)之基于 XML 注入属性

百度网盘: 👉 Spring学习书籍链接 Spring学习 1 Spring框架概述2 Spring容器3 基于XML方式创建对象4 基于XML方式注入属性4.1 通过set方法注入属性4.2 通过构造器注入属性4.3 使用p命名空间注入属性4.4 注入bean与自动装配4.5 注入集合4.6 注入外部属性…...

免费软件推荐-开源免费批量离线图文识别(OCR)

近期要批量处理图片转电子化,为了解决这个世纪难题,试了很多软件(华为手机自带OCR识别、 PandaOCR、天若OCR、Free OCR)等软件,还是选择了这一款,方便简单 一、什么是OCR? 光学字符识别(Opt…...

2 scala集合-元组和列表

1 元组 元组也是可以存放不同数据类型的元素,并且最重要的是,元组中的元素是不可变的。 例如,定义一个元组,包含字符串 hello,数字 20。如果试图把数字 20 修改为 1,则会报错。 scala> var a ("…...

Spring Boot开启SSL/Https进行交互。

为2个springboot工程开启进行SSL进行交互的认证步骤 //哪个犬玩意举报我侵权的? 一、认证步骤 1、 为服务器生成证书 keytool -genkey -v -alias testServer -keyalg RSA -keystore E:\ssl\testServer.p12 -validity 36500 2、 为客户端生成证书 keytool -genkey -v -alias…...

88.Go设计优雅的错误处理

文章目录 导言一、Go 的约定二、简单错误创建1、 errors.New()2、fmt.Errorf() 三、哨兵错误四、对错误进行编程1、优雅的错误处理设计2、与错误有关的的API 五、总结 导言 在 75.错误码设计、实现统一异常处理和封装统一返回结果 中,我们介绍了错误码的设计&#…...

Python4Delphi: Delphi 程序使用 Python 抓取网页

想用程序去抓取一个网页的内容,Delphi 有自己的 HTTP 库。比如 Indy 的 TIdHTTP,或者 TNetHTTPClient。 这里测试一下使用 Python 的 HTTP 库抓取网页,然后把抓取的内容给 Delphi 的程序。 Delphi 程序,界面上拖控件如下&#x…...

编辑器Zed

什么是Zed 官网:https://zed.dev/ Zed 是 Atom 编辑器原作者主导的新项目 —— 一款支持多人协作的代码编辑器,底层采用 Rust,且默认支持 Rust,还自带了 rust-analyzer,主打 “高性能”,颜值也十分在线&a…...

Java的接口

目录 1.接口的概念 2.语法规则 3.接口的使用 4.接口的特性 总结: 5.实现多个接口 6.接口间的继承 1.接口的概念 接口就是公共的行为规范标准,大家在实现时,只要符合规范标准,就可以通用。 在Java中,接口可以看成…...

【计算机网络】计算机软件工程人工智能研究生复试资料整理

1、JAVA 2、计算机网络 3、计算机体系结构 4、数据库 5、计算机租场原理 6、软件工程 7、大数据 8、英文 自我介绍 2. 计算机网络 1. TCP如何解决丢包和乱序? 序列号:TCP所传送的每段数据都有标有序列号,避免乱序问题发送端确认应答、超时重传:解决丢包问题滑动窗口:避免…...

【Network Management】AUTOSAR架构下CanNm User Data详解

目录 前言 正文 1.CanNm user data概念 2.CanNm user data配置 2.1CDD方式访问CanNm user data...

量子算法入门——2.线性代数与复数

参考资料: 【【零基础入门量子计算-第03讲】线性代数初步与复数】 来自b站up:溴锑锑跃迁 建议关注他的更多高质量文章:CSDN:【溴锑锑跃迁】 0. 前言 强烈建议搭配b站原视频进行观看,这只是我当时看的笔记&#xff0c…...

分别通过select、多进程、多线程实现一个并发服务器

多进程 #include<myhead.h>#define PORT 8888 //端口号 #define IP "192.168.114.74" //IP地址//定义函数处理客户端信息 int deal_cli_msg(int newfd, struct sockaddr_in cin) {//5、收发数据使用newfd完成通信char buf[128] "&qu…...

如何在 emacs 上开始使用 Tree-Sitter (archlinux)

文章目录 如何在emacs上开始使用Tree-Sitter&#xff08;archlinux&#xff09; 如何在emacs上开始使用Tree-Sitter&#xff08;archlinux&#xff09; 在archlinux上使用比windows上不知道要方便多少倍&#xff01; $ sudo pacman -S emacs $ sudo pacman -S tree-sitter这里…...

FL Studio2024最新中文版有哪些其新功能特点?

除了之前提到的特点外&#xff0c;FL Studio 21还有以下一些值得注意的特点&#xff1a; 高效的音频处理&#xff1a;FL Studio 21具备高效的音频处理能力&#xff0c;能够实时处理多轨道音频&#xff0c;提供低延迟的音频播放和录制&#xff0c;确保音乐制作过程中的流畅性和实…...

智能家居集成终极指南:海尔设备互联互通的完整解决方案

智能家居集成终极指南&#xff1a;海尔设备互联互通的完整解决方案 【免费下载链接】haier 项目地址: https://gitcode.com/gh_mirrors/ha/haier 在智能家居快速发展的今天&#xff0c;设备互联互通已成为提升用户体验的关键。本文将详细介绍如何通过开源项目实现海尔智…...

用Isaac Sim的Action Graph给ROS2机器人发布激光雷达数据:一个完整的传感器仿真流程

用Isaac Sim的Action Graph实现ROS2激光雷达数据仿真&#xff1a;从传感器配置到RViz可视化的全流程指南 在机器人开发和自动驾驶系统测试中&#xff0c;高保真的传感器仿真能够显著降低硬件成本和迭代周期。NVIDIA Isaac Sim作为一款强大的机器人仿真平台&#xff0c;与ROS2生…...

Phi-3-mini-128k-instruct开源镜像:个人学习研究专用+严禁非法用途声明

Phi-3-mini-128k-instruct开源镜像&#xff1a;个人学习研究专用严禁非法用途声明 1. 模型简介 Phi-3-Mini-128K-Instruct是一个38亿参数的轻量级开放模型&#xff0c;属于Phi-3系列的最新成员。这个模型经过精心训练&#xff0c;特别适合需要高质量文本生成和推理能力的应用…...

GLM-OCR在办公场景的应用:快速将合同、票据图片转为可编辑文本

GLM-OCR在办公场景的应用&#xff1a;快速将合同、票据图片转为可编辑文本 1. 引言 每天面对堆积如山的纸质合同和发票&#xff0c;财务和法务同事最头疼的是什么&#xff1f;是手动录入时眼花缭乱的数字&#xff0c;还是反复核对时的精神紧绷&#xff1f;我曾见过一位财务专…...

Python 3.14 JIT vs PyPy 8.3 vs GraalPython:金融风控场景下GC暂停时间对比实测(数据全部脱敏)

第一章&#xff1a;Python 3.14 JIT vs PyPy 8.3 vs GraalPython&#xff1a;金融风控场景下GC暂停时间对比实测&#xff08;数据全部脱敏&#xff09;为评估新一代Python运行时在低延迟金融风控场景中的实际表现&#xff0c;我们在统一硬件环境&#xff08;Intel Xeon Platinu…...

WarcraftHelper:魔兽争霸3现代系统兼容性优化终极指南 [特殊字符]

WarcraftHelper&#xff1a;魔兽争霸3现代系统兼容性优化终极指南 &#x1f3ae; 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为魔兽争霸3在现…...

攻克Windows安装难题:AtlasOS全方位解决2502/2503错误的技术方案

攻克Windows安装难题&#xff1a;AtlasOS全方位解决2502/2503错误的技术方案 【免费下载链接】Atlas &#x1f680; An open and lightweight modification to Windows, designed to optimize performance, privacy and security. 项目地址: https://gitcode.com/GitHub_Tren…...

Go Context 取消信号机制剖析

Go Context 取消信号机制剖析 在Go语言中&#xff0c;Context是控制并发任务生命周期的重要工具&#xff0c;其取消信号机制尤其关键。通过Context&#xff0c;开发者可以优雅地终止协程、释放资源&#xff0c;避免资源泄漏和无效计算。本文将深入剖析Go Context的取消信号机制…...

7个关键步骤:使用LMMS开源数字音频工作站完成专业音乐制作

7个关键步骤&#xff1a;使用LMMS开源数字音频工作站完成专业音乐制作 【免费下载链接】lmms Cross-platform music production software 项目地址: https://gitcode.com/gh_mirrors/lm/lmms LMMS&#xff08;Linux MultiMedia Studio&#xff09;是一款跨平台的开源数字…...

文墨共鸣模型作为Claude Code的替代或补充:代码生成与解释能力对比

文墨共鸣模型作为Claude Code的替代或补充&#xff1a;代码生成与解释能力对比 最近和几个做开发的朋友聊天&#xff0c;大家不约而同地提到了一个话题&#xff1a;现在AI写代码的工具这么多&#xff0c;到底哪个更靠谱&#xff1f;有人习惯用GitHub Copilot&#xff0c;有人偏…...