当前位置: 首页 > news >正文

百度文心一言正式亮相

OpenAI 刚发布了 GPT-4,百度预热已久的人工智能生成式对话产品也终于亮相了。昨天下午,文心一言 (ERNIE Bot)—— 百度全新一代知识增强大语言模型、文心大模型家族的新成员,正式在百度总部 “挥手点江山” 会议室里发布。

发布会一开场,百度 CEO 李彦宏先给大家打了一剂预防针:

从某种意义上说百度为此(发布文心一言)已经准备了多年,我们十几年前就开始投入 AI 研究,2019 年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。

但也不能说我们完全 ready 了,文心一言要对标 ChatGPT、甚至是对标 GPT-4 的门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。我自己测试感觉还是有很多不完美的地方。

李彦宏指出:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

文心一言,能做什么?

文心一言作为国内几个大厂中诞生出的首个生成式 AI 产品,到底能实现什么样的功能呢?百度 CEO 李彦宏也没有藏着掖着,在发布会一开始就展现了文心一言的 5 个使用场景,并且针对这些使用场景一一进行了功能展示。

  • 文学创作;

  • 商业文案的创作;

  • 数理逻辑的推算;

  • 中文的理解;

  • 多模态生成;

目前用户在体验 ChatGPT 这样的生成式 AI 时会发现一个问题,那就是即便有事实依据,AI 依然会一本正经地胡说八道(例如前段时间 Google Bard 出现的失误),如果用户没有经过验证,轻信了 AI 生成的内容,反而会铸成大错。那么面对这样的问题,文心一言能否轻松应对呢?

场景一:在第一个场景对话中,文心一言准确地提供了《三体》作者、核心内容、电视剧演职人员、甚至是演员本人的共同点与差异信息,在保证事实性问题不出错的情况下,亦展现了在续写内容方面的创作能力。

场景二:针对商业文案创作,现场则是演示三轮对话,涉及了给公司起个名字、写 Slogan,以及写篇新闻稿。从现场的演示来看,文心一言非常了解国人的喜好,以及中文字词中所蕴含的深意。以给科技服务公司取名字这个环节为例,给出的答案完全符合国人对于这类公司取名的畅想,客户通过名称一眼就能知道公司类型甚至是业务方向。

场景三:在数理逻辑推演环节,则是演示了一个家喻户晓的鸡兔同笼问题,但百度为了展示文心一言的能力,偷偷设置了一个 “陷阱”,给出了一个完全无解的题目。不过这并没有难倒文心一言,它立刻发现题目出错,后来经过修改,文心一言准确地回答出问题,并给出了简单的解题思路。

场景四:在发布会期间,百度 CEO 李彦宏也大方承认,目前文心一言虽然也支持英文问答,但实力依然有限。而主打的中文理解,无论是成语「洛阳纸贵」的含义,还是成语背后隐含的经济原理,甚至是对 “藏头诗” 这个词的理解,以及最后生成的诗句,在这一轮则是展现的淋漓尽致。

场景五:多模态生成是前几天 GPT-4 发布时着重增强的一大特性,当时 OpenAI 展示了从草图生成代码的能力。文心一言在这个环节也是 Show 了一把多模态生成,除了之前几个场景中所展示的文字对话能力,在场景五中还展示出了图像、视频和语音(方言)生成方面的能力,目前火热的 ChatGPT 还无法实现后面列举出的这几个功能。

与 Bing Chat 和 ChatGPT 的对比

相比 ChatGPT 和 Bing Chat,“文心一言” 最大的不同点在于多模态生成,即可以通过语言生成海报、语音甚至视频内容。发布会演示中,李彦宏展示了使用文心一言生成活动海报、方言语音,并根据提问内容生成与活动相关的视频。不过生成视频的成本较高,现阶段尚未对所有用户开放。

图片、视频的生成能力确实让我们眼前一亮,李彦宏也表示,多模态生成式 AI 是一个明确的发展趋势。

演示过程中,李彦宏多次强调百度在中文语言的处理上,处于独一无二的位置。

下面的例子展示了用发布会中演示的内容去询问 ChatGPT(3.5 版)以及 Bing Chat 的回答。

首先是关于《三体》的提问,Bing Chat 和文心一言均能正确回答作者是谁、来自哪里的问题,而 ChatGPT 则把刘慈欣的籍贯错标成了山东。

Bing Chat 的回答还显示其信息来源是百度百科。

而在关于 2023 年初上演的《三体》电视剧版演员的问题中,信息库停留在 2021 年的 ChatGPT 再次犯错,表示《三体》电视剧暂未开拍,而 Bing Chat 则在豆瓣中找到了答案。

在商业文案创作方面,三者均可以给出它们的看法,ChatGPT 还贴心地附上了英文名。

而 Bing Chat 则在第一次询问时识别错了问题含义,没有提供准确的公司名,而是提供了如何起一个公司名的解决方案。

虽然在此前的使用中,不论是 ChatGPT 还是 Bing Chat,它们在做数学题时并不能让我们完全放心。不过百度发布会中提到的鸡兔同笼问题并没有难倒二者,均准确地做出了解答。

可以看到,Bing Chat 的解读像是一位循循善诱的老师,而文心一言的回答则有点像课后的参考答案。

来到中文理解方面,文心一言的优势就体现出来了。

在询问「当时洛阳的纸到底有多贵」时,ChatGPT 误以为询问的是唐代的物价,因此返回的信息是洛阳的纸一点都不贵,Bing Chat 识别上没有问题,但也没有给出准确数据。

而文心一言给出两三千文的价格,至少与搜索得到的数据是一致的。

相信你也注意到了,且不说写的内容如何,ChatGPT 和 Bing Chat 都没有理解什么是藏头诗,相比下来,百度文心一言的表现确实出色。

由此可见,文心一言在中文领域的表现确实要优于 ChatGPT、Bing Chat。不过,李彦宏在发布会中也提到,虽然中文方面优势明显,但文心一言针对英文语种、代码场景的训练还不够多,表现也不够好,相信接下来百度会迅速提升。

技术架构 & 特性

百度首席技术官王海峰在发布会上详解了文心一言背后的文心大模型及技术特性。

百度在人工智能四层架构中有全栈布局:包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用;文心一言则位于模型层。

王海峰表示,文心一言能迅速推出主要是基于百度十一年来的积累,且四层之间形成了层到层的反馈、端到端的优化。尤其是框架层的飞桨和模型层的文心大模型之间的协同优化,在开发文心一言的过程中起到了至关重要的作用。

根据介绍,文心一言是新一代知识增强大语言模型,基于 ERNIE 及 PLATO 系列模型研发;采用了六项核心技术,包括:监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是同类大型语言模型普遍具备的能力,ERNIE 和 PLATO 中已经有应用和积累,在一言中又有了进一步强化和打磨;后三项则是百度已有特色技术的再创新。

文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及 5500 亿事实的知识图谱等。但王海峰也坦言,目前大模型的训练还不够充分。将来随着真实用户的反馈越来越多,文心一言的效果和能力都会逐渐提升。

体验途径

百度已公布文心一言的邀请测试方案。

3 月 16 日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户

企业客户则可以使用百度智能云开放的「文心一言」 API 接口
(https://cloud.baidu.com/survey_summit/wenxin.html?track=C896034 ),尚未获取 API 的企业可在百度智能云平台进行预约。

相关文章:

百度文心一言正式亮相

OpenAI 刚发布了 GPT-4,百度预热已久的人工智能生成式对话产品也终于亮相了。昨天下午,文心一言 (ERNIE Bot)—— 百度全新一代知识增强大语言模型、文心大模型家族的新成员,正式在百度总部 “挥手点江山” 会议室里发布。 发布会一开场&…...

使用Android架构模板

使用Android架构模板 项目介绍 为了方便开发者引入最新的Android架构组建进行开发,Google官方给我们引入了一个架构模板,方便我们快速进入开发。 github地址: https://github.com/android/architecture-templates 该模板遵循官方架构指南 …...

2023年天津市逆向re2.exe解析-比较难(超详细)

2023年天津市逆向re2.exe解析(较难) 1.拖进IDA里进行分析2.动态调试3.编写EXP脚本获取FLAG4.获得FLAG1.拖进IDA里进行分析 进入主程序查看伪代码 发现一个循环,根据行为初步判定为遍历输入的字符并对其ascii^7进行加密 初步判断sub_1400ab4ec为比较输入和flag的函数 跟进u…...

springboot: mybatis动态拼接sql查询条件

目录 需求01: 根据不同类型 查询不同的订单名, 1. 书写订单 类型转换方法 2. 使用方式: 3.. 构建条件构造器并进行查询, 传递查询参数 4. Mapper 写法 5. 最核心位置 xml位置 6. sql执行效果: 需求01: 根据不同类型 查询不同的订单名, 条件也是不同的, 需要复用sql…...

最优化算法 - 动态规划算法

动态规划算法简介 动态规划(Dynamic programming)是一种在数学、管理科学、计算机科学、经济学和生物信息学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。 动态规划常常适用于有重叠子问题和最优子结构性质的问题…...

springCloud学习【3】之Docker(1)

文章目录一 Docker环境准备1.1 应用部署的环境问题1.2 Docker简介1.3 Docker解决操作系统环境差异1.4 Docker和虚拟机的区别1.5 Docker架构1.5.1 镜像和容器1.5.2 DockerHub1.5.3 Docker架构1.5.4 Docker工作流1.6 Docker的安装和启动1.7 安装步骤1.8 启动Docker1.9 配置镜像加…...

难以置信,已经有人用 ChatGPT 做 Excel 报表了?

要问2023年初科技领域什么最火,那自然是 ChatGPT。 ChatGPT 由人工智能研究实验室 OpenAI 于2022年11月30日推出。上线短短5天,用户数量已突破100万,在今年2月份,用户数量已经突破1亿。 ChatGPT 是一个超级智能聊天机器人&#…...

中断相关操作函数HAL_NVIC_SetPriority()、HAL_NVIC_EnableIRQ()

文章目录HAL_NVIC_SetPriority():设置中断优先级HAL_NVIC_EnableIRQ():使能中断结束HAL_NVIC_SetPriority():设置中断优先级 HAL_NVIC_SetPriority()函数是一个用于设置中断优先级的函数,其定义如下: void HAL_NVIC_…...

企业增长秘诀丨设立优质的帮助中心,加深用户产品使用深度,促进产品转化

客户的留存问题一直备受企业关注,留存率的高低反应了产品的真实状况,将直接影响企业后期的发展规划。下文将为大家剖析下产品中客户的转化流程,以及如何提高产品的使用深处与复购率。 产品中,从客户生命周期角度,可分…...

3.OSPF与BGP的联动

14.3实验3&#xff1a;OSPF与BGP联动配置 实验目的实验拓扑实验步骤 配置IP地址 AR1的配置 <Huawei>system-view Enter system view, return user view with CtrlZ. [Huawei]undo info-center enable Info: Information center is disabled. [Huawei]sysname AR1 …...

机器学习算法——决策树详解

文章目录前言&#xff1a;决策树的定义熵和信息熵的相关概念信息熵的简单理解经典的决策树算法ID3算法划分选择或划分标准——信息增益ID3算法的优缺点C4.5算法信息增益率划分选择或划分标准——Gini系数&#xff08;CART算法&#xff09;Gini系数计算举例CART算法的优缺点其他…...

配置Jenkins

目录 一.前言 1.1简介 1.2工作步骤图 二.配置jenkins部署项目 2.1项目新建 2.2jenkinsfile文件如下 三.jenkins工作台配置 3.1.点击新建item进入新建页面,输入任务名称,选择pipeline 3.2.选择第二个配置 3.4将ideal中jenkinsfile文件的路径粘入脚本路径中 3.5启动项目…...

【STL三】序列容器——array容器

【STL三】序列容器——array一、array简介二、头文件三、模板类四、成员函数1、迭代器2、元素访问3、容量4、操作五、demo1、容量&#xff08;不使用迭代器&#xff09;2、使用迭代器3、元素访问 at()、front()、back()、data()一、array简介 array 容器是 C 11 标准中新增的序…...

【STL四】序列容器——vector容器

【STL容器】序列容器——vector容器一、简介二、头文件三、模板类四、成员函数1、迭代器2、元素访问3、容量4、修改操作五、demo1、容量reserve、capacity、shrink_to_fit2、修改操作pop_back()、push_back3、修改操作insert()4、修改操作emplace()5、修改操作erase()、swap()、…...

4年功能测试,我一进阶python接口自动化测试,跳槽拿了20k......

目录&#xff1a;导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09;前言 很多人在这求职市场…...

基于Pytorch的可视化工具

深度学习网络通常具有很深的层次结构&#xff0c;而且层与层之间通常会有并联、串联等连接方式。当使用PyTorch建立一个深度学习网络并输出文本向读者展示网络的连接方式是非常低效的&#xff0c;所以需要有效的工具将建立的深度学习网络结构有层次化的展示&#xff0c;这就需要…...

XCPC第十一站,带你学会图论基本算法

我们约定&#xff1a;以下n表示点的数目&#xff0c;m表示边的数目。 引子1——邻接表存储图的方法&#xff08;&#xff09;&#xff08;暂时不考虑重边和自环&#xff09; 现在我们有n个点&#xff08;编号为1~n&#xff09;和m条边&#xff0c;要用数组存储它们&#xff0c…...

【MySQL】1 MySQL的下载、安装与配置|提供安装包

欢迎来到爱书不爱输的程序猿的博客, 本博客致力于知识分享&#xff0c;与更多的人进行学习交流 目前,已开了以下专栏,欢迎关注与指导 1️⃣Java基础知识系统学习(持续更文中…) 2️⃣UML(已更完) 3️⃣MySQL(持续更文中…) MYSQL的下载、安装与配置1.下载MySQL5.71.1安装包的获…...

Redis 事务

目录Redis 事务一、Redis事务的概念&#xff1a;二、redis事务提出的逻辑&#xff1a;三、redis事务的基本操作四、事务的执行流程五、redis锁六、redis分布式锁Redis 事务 一、Redis事务的概念&#xff1a; Redis 事务的本质是一组命令的集合。事务支持一次执行多个命令&…...

【linux】:进程控制

文章目录 前言一、什么是写时拷贝二、进程控制 1.进程终止2.进程等待三丶进程程序替换总结前言 了解上一篇文章中的进程地址空间后&#xff0c;我们再来说说进程控制的概念&#xff0c;进程控制我们需要搞清楚三个问题&#xff1a;如何进程终止&#xff0c;如何解决僵尸进程问…...

KubeSphere 容器平台高可用:环境搭建与可视化操作指南

Linux_k8s篇 欢迎来到Linux的世界&#xff0c;看笔记好好学多敲多打&#xff0c;每个人都是大神&#xff01; 题目&#xff1a;KubeSphere 容器平台高可用&#xff1a;环境搭建与可视化操作指南 版本号: 1.0,0 作者: 老王要学习 日期: 2025.06.05 适用环境: Ubuntu22 文档说…...

网络六边形受到攻击

大家读完觉得有帮助记得关注和点赞&#xff01;&#xff01;&#xff01; 抽象 现代智能交通系统 &#xff08;ITS&#xff09; 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 &#xff08;…...

19c补丁后oracle属主变化,导致不能识别磁盘组

补丁后服务器重启&#xff0c;数据库再次无法启动 ORA01017: invalid username/password; logon denied Oracle 19c 在打上 19.23 或以上补丁版本后&#xff0c;存在与用户组权限相关的问题。具体表现为&#xff0c;Oracle 实例的运行用户&#xff08;oracle&#xff09;和集…...

基于距离变化能量开销动态调整的WSN低功耗拓扑控制开销算法matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.算法仿真参数 5.算法理论概述 6.参考文献 7.完整程序 1.程序功能描述 通过动态调整节点通信的能量开销&#xff0c;平衡网络负载&#xff0c;延长WSN生命周期。具体通过建立基于距离的能量消耗模型&am…...

React Native在HarmonyOS 5.0阅读类应用开发中的实践

一、技术选型背景 随着HarmonyOS 5.0对Web兼容层的增强&#xff0c;React Native作为跨平台框架可通过重新编译ArkTS组件实现85%以上的代码复用率。阅读类应用具有UI复杂度低、数据流清晰的特点。 二、核心实现方案 1. 环境配置 &#xff08;1&#xff09;使用React Native…...

P3 QT项目----记事本(3.8)

3.8 记事本项目总结 项目源码 1.main.cpp #include "widget.h" #include <QApplication> int main(int argc, char *argv[]) {QApplication a(argc, argv);Widget w;w.show();return a.exec(); } 2.widget.cpp #include "widget.h" #include &q…...

Java 加密常用的各种算法及其选择

在数字化时代&#xff0c;数据安全至关重要&#xff0c;Java 作为广泛应用的编程语言&#xff0c;提供了丰富的加密算法来保障数据的保密性、完整性和真实性。了解这些常用加密算法及其适用场景&#xff0c;有助于开发者在不同的业务需求中做出正确的选择。​ 一、对称加密算法…...

学习STC51单片机32(芯片为STC89C52RCRC)OLED显示屏2

每日一言 今天的每一份坚持&#xff0c;都是在为未来积攒底气。 案例&#xff1a;OLED显示一个A 这边观察到一个点&#xff0c;怎么雪花了就是都是乱七八糟的占满了屏幕。。 解释 &#xff1a; 如果代码里信号切换太快&#xff08;比如 SDA 刚变&#xff0c;SCL 立刻变&#…...

SAP学习笔记 - 开发26 - 前端Fiori开发 OData V2 和 V4 的差异 (Deepseek整理)

上一章用到了V2 的概念&#xff0c;其实 Fiori当中还有 V4&#xff0c;咱们这一章来总结一下 V2 和 V4。 SAP学习笔记 - 开发25 - 前端Fiori开发 Remote OData Service(使用远端Odata服务)&#xff0c;代理中间件&#xff08;ui5-middleware-simpleproxy&#xff09;-CSDN博客…...

以光量子为例,详解量子获取方式

光量子技术获取量子比特可在室温下进行。该方式有望通过与名为硅光子学&#xff08;silicon photonics&#xff09;的光波导&#xff08;optical waveguide&#xff09;芯片制造技术和光纤等光通信技术相结合来实现量子计算机。量子力学中&#xff0c;光既是波又是粒子。光子本…...