当前位置: 首页 > news >正文

百度文心一言正式亮相

OpenAI 刚发布了 GPT-4,百度预热已久的人工智能生成式对话产品也终于亮相了。昨天下午,文心一言 (ERNIE Bot)—— 百度全新一代知识增强大语言模型、文心大模型家族的新成员,正式在百度总部 “挥手点江山” 会议室里发布。

发布会一开场,百度 CEO 李彦宏先给大家打了一剂预防针:

从某种意义上说百度为此(发布文心一言)已经准备了多年,我们十几年前就开始投入 AI 研究,2019 年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。

但也不能说我们完全 ready 了,文心一言要对标 ChatGPT、甚至是对标 GPT-4 的门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。我自己测试感觉还是有很多不完美的地方。

李彦宏指出:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

文心一言,能做什么?

文心一言作为国内几个大厂中诞生出的首个生成式 AI 产品,到底能实现什么样的功能呢?百度 CEO 李彦宏也没有藏着掖着,在发布会一开始就展现了文心一言的 5 个使用场景,并且针对这些使用场景一一进行了功能展示。

  • 文学创作;

  • 商业文案的创作;

  • 数理逻辑的推算;

  • 中文的理解;

  • 多模态生成;

目前用户在体验 ChatGPT 这样的生成式 AI 时会发现一个问题,那就是即便有事实依据,AI 依然会一本正经地胡说八道(例如前段时间 Google Bard 出现的失误),如果用户没有经过验证,轻信了 AI 生成的内容,反而会铸成大错。那么面对这样的问题,文心一言能否轻松应对呢?

场景一:在第一个场景对话中,文心一言准确地提供了《三体》作者、核心内容、电视剧演职人员、甚至是演员本人的共同点与差异信息,在保证事实性问题不出错的情况下,亦展现了在续写内容方面的创作能力。

场景二:针对商业文案创作,现场则是演示三轮对话,涉及了给公司起个名字、写 Slogan,以及写篇新闻稿。从现场的演示来看,文心一言非常了解国人的喜好,以及中文字词中所蕴含的深意。以给科技服务公司取名字这个环节为例,给出的答案完全符合国人对于这类公司取名的畅想,客户通过名称一眼就能知道公司类型甚至是业务方向。

场景三:在数理逻辑推演环节,则是演示了一个家喻户晓的鸡兔同笼问题,但百度为了展示文心一言的能力,偷偷设置了一个 “陷阱”,给出了一个完全无解的题目。不过这并没有难倒文心一言,它立刻发现题目出错,后来经过修改,文心一言准确地回答出问题,并给出了简单的解题思路。

场景四:在发布会期间,百度 CEO 李彦宏也大方承认,目前文心一言虽然也支持英文问答,但实力依然有限。而主打的中文理解,无论是成语「洛阳纸贵」的含义,还是成语背后隐含的经济原理,甚至是对 “藏头诗” 这个词的理解,以及最后生成的诗句,在这一轮则是展现的淋漓尽致。

场景五:多模态生成是前几天 GPT-4 发布时着重增强的一大特性,当时 OpenAI 展示了从草图生成代码的能力。文心一言在这个环节也是 Show 了一把多模态生成,除了之前几个场景中所展示的文字对话能力,在场景五中还展示出了图像、视频和语音(方言)生成方面的能力,目前火热的 ChatGPT 还无法实现后面列举出的这几个功能。

与 Bing Chat 和 ChatGPT 的对比

相比 ChatGPT 和 Bing Chat,“文心一言” 最大的不同点在于多模态生成,即可以通过语言生成海报、语音甚至视频内容。发布会演示中,李彦宏展示了使用文心一言生成活动海报、方言语音,并根据提问内容生成与活动相关的视频。不过生成视频的成本较高,现阶段尚未对所有用户开放。

图片、视频的生成能力确实让我们眼前一亮,李彦宏也表示,多模态生成式 AI 是一个明确的发展趋势。

演示过程中,李彦宏多次强调百度在中文语言的处理上,处于独一无二的位置。

下面的例子展示了用发布会中演示的内容去询问 ChatGPT(3.5 版)以及 Bing Chat 的回答。

首先是关于《三体》的提问,Bing Chat 和文心一言均能正确回答作者是谁、来自哪里的问题,而 ChatGPT 则把刘慈欣的籍贯错标成了山东。

Bing Chat 的回答还显示其信息来源是百度百科。

而在关于 2023 年初上演的《三体》电视剧版演员的问题中,信息库停留在 2021 年的 ChatGPT 再次犯错,表示《三体》电视剧暂未开拍,而 Bing Chat 则在豆瓣中找到了答案。

在商业文案创作方面,三者均可以给出它们的看法,ChatGPT 还贴心地附上了英文名。

而 Bing Chat 则在第一次询问时识别错了问题含义,没有提供准确的公司名,而是提供了如何起一个公司名的解决方案。

虽然在此前的使用中,不论是 ChatGPT 还是 Bing Chat,它们在做数学题时并不能让我们完全放心。不过百度发布会中提到的鸡兔同笼问题并没有难倒二者,均准确地做出了解答。

可以看到,Bing Chat 的解读像是一位循循善诱的老师,而文心一言的回答则有点像课后的参考答案。

来到中文理解方面,文心一言的优势就体现出来了。

在询问「当时洛阳的纸到底有多贵」时,ChatGPT 误以为询问的是唐代的物价,因此返回的信息是洛阳的纸一点都不贵,Bing Chat 识别上没有问题,但也没有给出准确数据。

而文心一言给出两三千文的价格,至少与搜索得到的数据是一致的。

相信你也注意到了,且不说写的内容如何,ChatGPT 和 Bing Chat 都没有理解什么是藏头诗,相比下来,百度文心一言的表现确实出色。

由此可见,文心一言在中文领域的表现确实要优于 ChatGPT、Bing Chat。不过,李彦宏在发布会中也提到,虽然中文方面优势明显,但文心一言针对英文语种、代码场景的训练还不够多,表现也不够好,相信接下来百度会迅速提升。

技术架构 & 特性

百度首席技术官王海峰在发布会上详解了文心一言背后的文心大模型及技术特性。

百度在人工智能四层架构中有全栈布局:包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用;文心一言则位于模型层。

王海峰表示,文心一言能迅速推出主要是基于百度十一年来的积累,且四层之间形成了层到层的反馈、端到端的优化。尤其是框架层的飞桨和模型层的文心大模型之间的协同优化,在开发文心一言的过程中起到了至关重要的作用。

根据介绍,文心一言是新一代知识增强大语言模型,基于 ERNIE 及 PLATO 系列模型研发;采用了六项核心技术,包括:监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是同类大型语言模型普遍具备的能力,ERNIE 和 PLATO 中已经有应用和积累,在一言中又有了进一步强化和打磨;后三项则是百度已有特色技术的再创新。

文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及 5500 亿事实的知识图谱等。但王海峰也坦言,目前大模型的训练还不够充分。将来随着真实用户的反馈越来越多,文心一言的效果和能力都会逐渐提升。

体验途径

百度已公布文心一言的邀请测试方案。

3 月 16 日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户

企业客户则可以使用百度智能云开放的「文心一言」 API 接口
(https://cloud.baidu.com/survey_summit/wenxin.html?track=C896034 ),尚未获取 API 的企业可在百度智能云平台进行预约。

相关文章:

百度文心一言正式亮相

OpenAI 刚发布了 GPT-4,百度预热已久的人工智能生成式对话产品也终于亮相了。昨天下午,文心一言 (ERNIE Bot)—— 百度全新一代知识增强大语言模型、文心大模型家族的新成员,正式在百度总部 “挥手点江山” 会议室里发布。 发布会一开场&…...

使用Android架构模板

使用Android架构模板 项目介绍 为了方便开发者引入最新的Android架构组建进行开发,Google官方给我们引入了一个架构模板,方便我们快速进入开发。 github地址: https://github.com/android/architecture-templates 该模板遵循官方架构指南 …...

2023年天津市逆向re2.exe解析-比较难(超详细)

2023年天津市逆向re2.exe解析(较难) 1.拖进IDA里进行分析2.动态调试3.编写EXP脚本获取FLAG4.获得FLAG1.拖进IDA里进行分析 进入主程序查看伪代码 发现一个循环,根据行为初步判定为遍历输入的字符并对其ascii^7进行加密 初步判断sub_1400ab4ec为比较输入和flag的函数 跟进u…...

springboot: mybatis动态拼接sql查询条件

目录 需求01: 根据不同类型 查询不同的订单名, 1. 书写订单 类型转换方法 2. 使用方式: 3.. 构建条件构造器并进行查询, 传递查询参数 4. Mapper 写法 5. 最核心位置 xml位置 6. sql执行效果: 需求01: 根据不同类型 查询不同的订单名, 条件也是不同的, 需要复用sql…...

最优化算法 - 动态规划算法

动态规划算法简介 动态规划(Dynamic programming)是一种在数学、管理科学、计算机科学、经济学和生物信息学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。 动态规划常常适用于有重叠子问题和最优子结构性质的问题…...

springCloud学习【3】之Docker(1)

文章目录一 Docker环境准备1.1 应用部署的环境问题1.2 Docker简介1.3 Docker解决操作系统环境差异1.4 Docker和虚拟机的区别1.5 Docker架构1.5.1 镜像和容器1.5.2 DockerHub1.5.3 Docker架构1.5.4 Docker工作流1.6 Docker的安装和启动1.7 安装步骤1.8 启动Docker1.9 配置镜像加…...

难以置信,已经有人用 ChatGPT 做 Excel 报表了?

要问2023年初科技领域什么最火,那自然是 ChatGPT。 ChatGPT 由人工智能研究实验室 OpenAI 于2022年11月30日推出。上线短短5天,用户数量已突破100万,在今年2月份,用户数量已经突破1亿。 ChatGPT 是一个超级智能聊天机器人&#…...

中断相关操作函数HAL_NVIC_SetPriority()、HAL_NVIC_EnableIRQ()

文章目录HAL_NVIC_SetPriority():设置中断优先级HAL_NVIC_EnableIRQ():使能中断结束HAL_NVIC_SetPriority():设置中断优先级 HAL_NVIC_SetPriority()函数是一个用于设置中断优先级的函数,其定义如下: void HAL_NVIC_…...

企业增长秘诀丨设立优质的帮助中心,加深用户产品使用深度,促进产品转化

客户的留存问题一直备受企业关注,留存率的高低反应了产品的真实状况,将直接影响企业后期的发展规划。下文将为大家剖析下产品中客户的转化流程,以及如何提高产品的使用深处与复购率。 产品中,从客户生命周期角度,可分…...

3.OSPF与BGP的联动

14.3实验3&#xff1a;OSPF与BGP联动配置 实验目的实验拓扑实验步骤 配置IP地址 AR1的配置 <Huawei>system-view Enter system view, return user view with CtrlZ. [Huawei]undo info-center enable Info: Information center is disabled. [Huawei]sysname AR1 …...

机器学习算法——决策树详解

文章目录前言&#xff1a;决策树的定义熵和信息熵的相关概念信息熵的简单理解经典的决策树算法ID3算法划分选择或划分标准——信息增益ID3算法的优缺点C4.5算法信息增益率划分选择或划分标准——Gini系数&#xff08;CART算法&#xff09;Gini系数计算举例CART算法的优缺点其他…...

配置Jenkins

目录 一.前言 1.1简介 1.2工作步骤图 二.配置jenkins部署项目 2.1项目新建 2.2jenkinsfile文件如下 三.jenkins工作台配置 3.1.点击新建item进入新建页面,输入任务名称,选择pipeline 3.2.选择第二个配置 3.4将ideal中jenkinsfile文件的路径粘入脚本路径中 3.5启动项目…...

【STL三】序列容器——array容器

【STL三】序列容器——array一、array简介二、头文件三、模板类四、成员函数1、迭代器2、元素访问3、容量4、操作五、demo1、容量&#xff08;不使用迭代器&#xff09;2、使用迭代器3、元素访问 at()、front()、back()、data()一、array简介 array 容器是 C 11 标准中新增的序…...

【STL四】序列容器——vector容器

【STL容器】序列容器——vector容器一、简介二、头文件三、模板类四、成员函数1、迭代器2、元素访问3、容量4、修改操作五、demo1、容量reserve、capacity、shrink_to_fit2、修改操作pop_back()、push_back3、修改操作insert()4、修改操作emplace()5、修改操作erase()、swap()、…...

4年功能测试,我一进阶python接口自动化测试,跳槽拿了20k......

目录&#xff1a;导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09;前言 很多人在这求职市场…...

基于Pytorch的可视化工具

深度学习网络通常具有很深的层次结构&#xff0c;而且层与层之间通常会有并联、串联等连接方式。当使用PyTorch建立一个深度学习网络并输出文本向读者展示网络的连接方式是非常低效的&#xff0c;所以需要有效的工具将建立的深度学习网络结构有层次化的展示&#xff0c;这就需要…...

XCPC第十一站,带你学会图论基本算法

我们约定&#xff1a;以下n表示点的数目&#xff0c;m表示边的数目。 引子1——邻接表存储图的方法&#xff08;&#xff09;&#xff08;暂时不考虑重边和自环&#xff09; 现在我们有n个点&#xff08;编号为1~n&#xff09;和m条边&#xff0c;要用数组存储它们&#xff0c…...

【MySQL】1 MySQL的下载、安装与配置|提供安装包

欢迎来到爱书不爱输的程序猿的博客, 本博客致力于知识分享&#xff0c;与更多的人进行学习交流 目前,已开了以下专栏,欢迎关注与指导 1️⃣Java基础知识系统学习(持续更文中…) 2️⃣UML(已更完) 3️⃣MySQL(持续更文中…) MYSQL的下载、安装与配置1.下载MySQL5.71.1安装包的获…...

Redis 事务

目录Redis 事务一、Redis事务的概念&#xff1a;二、redis事务提出的逻辑&#xff1a;三、redis事务的基本操作四、事务的执行流程五、redis锁六、redis分布式锁Redis 事务 一、Redis事务的概念&#xff1a; Redis 事务的本质是一组命令的集合。事务支持一次执行多个命令&…...

【linux】:进程控制

文章目录 前言一、什么是写时拷贝二、进程控制 1.进程终止2.进程等待三丶进程程序替换总结前言 了解上一篇文章中的进程地址空间后&#xff0c;我们再来说说进程控制的概念&#xff0c;进程控制我们需要搞清楚三个问题&#xff1a;如何进程终止&#xff0c;如何解决僵尸进程问…...

uniapp 对接腾讯云IM群组成员管理(增删改查)

UniApp 实战&#xff1a;腾讯云IM群组成员管理&#xff08;增删改查&#xff09; 一、前言 在社交类App开发中&#xff0c;群组成员管理是核心功能之一。本文将基于UniApp框架&#xff0c;结合腾讯云IM SDK&#xff0c;详细讲解如何实现群组成员的增删改查全流程。 权限校验…...

系统设计 --- MongoDB亿级数据查询优化策略

系统设计 --- MongoDB亿级数据查询分表策略 背景Solution --- 分表 背景 使用audit log实现Audi Trail功能 Audit Trail范围: 六个月数据量: 每秒5-7条audi log&#xff0c;共计7千万 – 1亿条数据需要实现全文检索按照时间倒序因为license问题&#xff0c;不能使用ELK只能使用…...

2023赣州旅游投资集团

单选题 1.“不登高山&#xff0c;不知天之高也&#xff1b;不临深溪&#xff0c;不知地之厚也。”这句话说明_____。 A、人的意识具有创造性 B、人的认识是独立于实践之外的 C、实践在认识过程中具有决定作用 D、人的一切知识都是从直接经验中获得的 参考答案: C 本题解…...

Redis的发布订阅模式与专业的 MQ(如 Kafka, RabbitMQ)相比,优缺点是什么?适用于哪些场景?

Redis 的发布订阅&#xff08;Pub/Sub&#xff09;模式与专业的 MQ&#xff08;Message Queue&#xff09;如 Kafka、RabbitMQ 进行比较&#xff0c;核心的权衡点在于&#xff1a;简单与速度 vs. 可靠与功能。 下面我们详细展开对比。 Redis Pub/Sub 的核心特点 它是一个发后…...

基于Java Swing的电子通讯录设计与实现:附系统托盘功能代码详解

JAVASQL电子通讯录带系统托盘 一、系统概述 本电子通讯录系统采用Java Swing开发桌面应用&#xff0c;结合SQLite数据库实现联系人管理功能&#xff0c;并集成系统托盘功能提升用户体验。系统支持联系人的增删改查、分组管理、搜索过滤等功能&#xff0c;同时可以最小化到系统…...

在Mathematica中实现Newton-Raphson迭代的收敛时间算法(一般三次多项式)

考察一般的三次多项式&#xff0c;以r为参数&#xff1a; p[z_, r_] : z^3 (r - 1) z - r; roots[r_] : z /. Solve[p[z, r] 0, z]&#xff1b; 此多项式的根为&#xff1a; 尽管看起来这个多项式是特殊的&#xff0c;其实一般的三次多项式都是可以通过线性变换化为这个形式…...

关于easyexcel动态下拉选问题处理

前些日子突然碰到一个问题&#xff0c;说是客户的导入文件模版想支持部分导入内容的下拉选&#xff0c;于是我就找了easyexcel官网寻找解决方案&#xff0c;并没有找到合适的方案&#xff0c;没办法只能自己动手并分享出来&#xff0c;针对Java生成Excel下拉菜单时因选项过多导…...

在 Spring Boot 项目里,MYSQL中json类型字段使用

前言&#xff1a; 因为程序特殊需求导致&#xff0c;需要mysql数据库存储json类型数据&#xff0c;因此记录一下使用流程 1.java实体中新增字段 private List<User> users 2.增加mybatis-plus注解 TableField(typeHandler FastjsonTypeHandler.class) private Lis…...

Chrome 浏览器前端与客户端双向通信实战

Chrome 前端&#xff08;即页面 JS / Web UI&#xff09;与客户端&#xff08;C 后端&#xff09;的交互机制&#xff0c;是 Chromium 架构中非常核心的一环。下面我将按常见场景&#xff0c;从通道、流程、技术栈几个角度做一套完整的分析&#xff0c;特别适合你这种在分析和改…...

Qt 事件处理中 return 的深入解析

Qt 事件处理中 return 的深入解析 在 Qt 事件处理中&#xff0c;return 语句的使用是另一个关键概念&#xff0c;它与 event->accept()/event->ignore() 密切相关但作用不同。让我们详细分析一下它们之间的关系和工作原理。 核心区别&#xff1a;不同层级的事件处理 方…...