生成式 AI:百度“文心一言”对标 ChatGPT?什么技术趋势促使 ChatGPT 火爆全网?
文章目录
- 前言
- 一、生成式 AI 的发展和现状
- 1.1、什么是生成式 AI?
- 1.2、生成式 AI 的发展趋势
- 1.3、AI 生成内容的业务场景和分类
- 二、生成式 AI 从分析领域到创作领域
- 2.1、 降低内容创作门槛,增加 UGC 用户群体
- 2.2、提升创作及反馈效率,铺垫线上实时互动
- 2.3、基于海量数据激发创意认知、提升内容生产多样性
- 2.4、模态元素二次拆解组合,改变内容生产逻辑及形式
- 2.5、AI 系统或数据库联动,实现高度个性化/高频优化
- 三、生成式 AI 改变内容创作和分发范式
- 3.1、当前与未来设计工作流程对比
- 3.2、AI 文生图存在最大的问题是什么?
- 3.3、AI 从底层改变了哪些游戏规则?
- 四、为何生成式 AI 迅速爆发和突破?
- 4.1、大模型突破瓶颈
- 4.2、多模态融合打破边界
- 五、生成式 AI 技术趋势分析
- 六、生成式 AI 无法产生创意的基本元素
- 总结
前言
2023 年 3 月 27 日,百度文心一言正式发布,李彦宏开场即言,百度是首个做出可以对标 ChatGPT 的产品的大厂,作为“国产版 ChatGPT”、百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。在 2022 年 11 月 30 日 美国 OpenAI 研发的聊天机器人程序 ChatGPT 一经发布,就瞬间爆火全网,作为人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,“真正”像人类一样来聊天交流,随着不同版本的迭代和更新,我们可以看到众多使用者甚至能在其帮助下完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。百度文心一言能否与 ChatGPT “掰掰手腕”,在二者的背后又是什么技术趋势促使其火爆全网呢?本文我们一探究竟。一、生成式 AI 的发展和现状
1.1、什么是生成式 AI?
生成式 AI(Generative AI) 是指计算机通过机器学习从现有数据中学习一个对象(物品、产品或任务)的要素,进而生成一个全新的、原创的、真实的、与原来内容相似的对象。作为重要的战略技术,在 2025 年 10+% 的数据将由 AI 创造。
1.2、生成式 AI 的发展趋势
根据 Gartner《2021 年预测:人工智能对人类和社会的影响》 中预测:
- 至 2023 年将有 20% 的内容被生成式 AI 所创建。
- 至 2025 年,生成式 AI 产生的数据将占有所有数据的 10%,而今天这个比例不到 1%。
对于生成式 AI 的发展趋势预测,具体如下图所示:
1.3、AI 生成内容的业务场景和分类
在不含 AI 生成代码的情况下,AI 生成内容的业务场景和分类已经囊括众多的技术领域,AIGC 技术场景具体如下图所示:
二、生成式 AI 从分析领域到创作领域
2.1、 降低内容创作门槛,增加 UGC 用户群体
- AIGC 能够代替人工完成声音录制、图像渲染等工作,使更多人员能够参与到高价值的内容创作流程中。预计这一效果在 2B 结构化内容生成的领域非常明显,个别场景会出现 2C 服务。跨模态生成成为未来重点。
2.2、提升创作及反馈效率,铺垫线上实时互动
- AI 同样提升了内容的反馈生成速度,对于实时交互内容有重大意义,具有将线下和真人的快速交互迁移到线上的可能,也即令 AI 承担真人的社交、创作、协作功能,可能会出现新的潜在场景(如社交类和探索类游戏等)。我们在 Game AI 板块所提及的 AIbot 实时玩家教学在一定程度上提供了一种互动的新形式,交互教育/交互探索游戏虚拟陪伴场景值得期待。
- 目前来看,内容消费者变得更容易将现实情感需求投射在虚拟世界中,预计会产生许多深入实时的互动需求,市场规模可观。
2.3、基于海量数据激发创意认知、提升内容生产多样性
- 相较于人类艺术家,AI 能够接触借鉴更多的数据,在基于 prompt 进行内容生成后 AI 创作的内容会有更多的二次创造空间和自由度。例如,生成算法能基于特定条件或完全随机的生成现实中不存在的形状、色彩搭配、图案或结构等,赋予内容创作更多可能,产生“超现实感”及“未来感”,推动艺术创新。
2.4、模态元素二次拆解组合,改变内容生产逻辑及形式
- 通过语音克隆、编曲风格提取等手段,AIGC 能够将原客体所对应的不同模态信息进行拆解,例如演讲者的面部形象、声音、演讲内容等。在重新组合之后,能够完成过往受到条件限制无法完成的工作。例如路人的声音 + 专业的播音逻辑、更符合特定审美的面部等,打破真人/真实场景在要素组合上具有的局限性。
2.5、AI 系统或数据库联动,实现高度个性化/高频优化
- 在与特定的数据库(例如实时更新的客户数据、市场反馈数据、特定主题下的历史统计数据)或 AI 系统进行联动后(如个性化推荐系统等),AIGC 能够在更为精准的未来预测/个性化预测基础上调整其生成内容。
- 例如,根据、根据所处渠道风格调整生成内容、参考历史数据优化生成内容等。该价值在内容用户习惯调整内容营销文本营销领域有重大意义。
三、生成式 AI 改变内容创作和分发范式
3.1、当前与未来设计工作流程对比
- 当前概念设计师工作流程:接到需求→搜集参考(图库)→构思出图→和甲方沟通修改。
- 未来设计工作流程:创意→AI→创意。
3.2、AI 文生图存在最大的问题是什么?
AI 创作能力在未来短时间内的进步速度,也将取决于各行各业收集和训练行业优质数据的工作。
开发人员使用 AI 生成宠物小精灵,在初期使用“写实”数据集后发现运行效果不理想,重新使用 26 张新数据集训练 20 分钟,我们根据二者之间的对比,可以看到 AI 学习和生成效果是非常棒的,具体如下图所示:
AI 目前最大的问题不是“不够聪明”,而是“书读得太少"。 在 AI 新范式下创作,要考虑什么样的内容更利于 AI 学习和 AI 生成使用。
如果我们将艺术家关键词对生成图像的贡献视为艺术家本/的贡献,我们从原理上就可以为艺术家的创意价值定价了。
3.3、AI 从底层改变了哪些游戏规则?
今天的 AI 从底层改变了游戏规则,接下来会看到以下变化:
- 不会画画的人用 AI 生产高质量视觉作品。
- 互联网上难以估量的图像数据被重新组织起来,围绕模型训练和数据标注出现新的生意。
- 图片版权名存实亡,参与建立 AI 数据集成为艺术家的主要收益。
- 传统图像处理软件、3D 建模软件被围绕 AI 范式建立的新工具取代。
四、为何生成式 AI 迅速爆发和突破?
4.1、大模型突破瓶颈
根据英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)提出的 “摩尔定律”:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔 18 个月翻两倍以上。
而现在由于高效数据、高效算力、高效模型、高效知识需求的增长,摩尔定律原来中的 2 倍将增长至现在的 10 倍,具体如下图所示:
在 “The blessings of scale”中,根据趋势我们可以明确得知:同等条件下,随着模型参数量的增加,更大的模型会带来更好的结果,且目前的趋势并未饱和,故目前阶段大模型的投资依然会增加以获得更高的效益,具体如下图所示:
4.2、多模态融合打破边界
多模态融合打破边界,模型越来越大,模型走向行业,模型走向融合,具体如下表所示:
大模型趋势 | 内容 |
---|---|
模型越来越大 | 探索极限,目前到 5000 亿仍然保持线性增长。越来越接近人脑神经元连接数,甚至超过。 例:OpenAl GPT-3(175B) 、谷歌 PaLM(540B) |
模型走向行业 | 在通用预训练大校型(L0)的基础上,在行业数据上更新训练后,适用于行业特征拍取的模型族(L1)。 例:煤矿模型,电力大模型,药物分子大模型等。商汤:INTFRN 系统(初学者-专家-通才);百度:行业大模型。 |
模型走向融合 | 未来 2~3 年,视觉和语言大模型统一到多模态大模型,架构上也实现基本统一。各种校态大模型进行充分融合。 例:文本 + 视觉,语音 + 文本,文本 + 视频等 OpenAI DALL*E/E2;谷歌 Imagen;微软 GLIP 等。 |
五、生成式 AI 技术趋势分析
生成式 AI 技术的发展更趋向于:可控、高精度;更快、更好、更便宜。
可控和高精度重建成为技术突破口,带来了超乎想象的结果,得益于 Diffusion model、语言大模型、跨模特大模型、Nerf 等技术的突破,具体如下图所示:
六、生成式 AI 无法产生创意的基本元素
生成式 AI,可控生成于机器而言,是不同语义的重组,于人而言,就是创意!在绘画领域,AIGC 是将绘画的三要素(构图、纹理、着色)进行重组从而产生创意。但是他并不能真的产生创意的基本元素,举例具体如下图所示:
图像生成,反事实是创意,但是对于语言生成,反事实却是灾难,可谓“恐怖如斯”,具体如下图所示:
总结
百度文心一言发布,股价盘中跌超 10%,也看到很多小伙伴们在试用文心一言后发出的吐槽,基于 Generative AI 的发展不是一朝一夕,这个问题的本质也并不是仅在文心一言中存在的,而 ChatGPT 确实在自然语言理解、自然语言处理等方面有进步的地方,同时,在算法、数据、算力上推进了有效结合。而面对 ChatGPT 的热潮,我们应有的态度正如科技部部长王志刚说所说,我们国家对于任何一个新的技术,包括 AI 技术出来以后,在伦理方面都采取了一些相应的措施,对科学技术发展趋利避害,让“利”更好地发挥出来。我是白鹿,一个不懈奋斗的程序猿。望本文能对你有所裨益,欢迎大家的一键三连!若有其他问题、建议或者补充可以留言在文章下方,感谢大家的支持!
相关文章:

生成式 AI:百度“文心一言”对标 ChatGPT?什么技术趋势促使 ChatGPT 火爆全网?
文章目录前言一、生成式 AI 的发展和现状1.1、什么是生成式 AI?1.2、生成式 AI 的发展趋势1.3、AI 生成内容的业务场景和分类二、生成式 AI 从分析领域到创作领域2.1、 降低内容创作门槛,增加 UGC 用户群体2.2、提升创作及反馈效率,铺垫线上实…...

PCL 非线性最小二乘法拟合圆柱
文章目录 一、简介二、实现代码三、实现效果参考资料一、简介 这里通过非线性最小二乘的方法来实现圆柱体的拟合,具体的计算过程如下所述: 图中, p p p为输入数据的点位置,求解的参数为柱体的轴向向量 a...

【设计模式】迪米特法则
文章目录一、迪米特法则定义二、迪米特法则分析三、迪米特法则实例一、迪米特法则定义 迪米特法则(Law of Demeter, LoD):一个软件实体应当尽可能少地与其他实体发生相互作用。 二、迪米特法则分析 如果一个系统符合迪米特法则,那么当其中某一个模块发…...
CSS3笔试题精讲1
Q1 BFC专题 防止父元素高度坍塌 4种方案 父元素的高度都是由内部未浮动子元素的高度撑起的。 如果子元素浮动起来,就不占用普通文档流的位置。父元素高度就会失去支撑,也称为高度坍塌。 即使有部分元素留在普通文档流布局中支撑着父元素,如果浮动 起来的元素高度高于留下的…...

交叉编译用于移植的Qt库
前言 如果在Ubuntu上使用qt开发可移植到周立功开发板的应用程序,需要在Ubuntu上交叉编译用于移植的Qt库,具体做法如下: 1、下载源码 源码qt-everywhere-opensource-src-5.9.6.tar.xz拷贝到ubuntu自建的software文件下 2、解压 点击提取到此处 3、安装配置 运行脚本文…...
泰凌微TLSR8258 zigbee开发环境搭建
目录必备软件工具抓包分析辅助工具软件开发包PC 辅助控制软件 (ZGC)必备软件工具 下载地址:http://wiki.telink-semi.cn/ • 集成开发环境: TLSR8 Chips: Telink IDE for TC32 TLSR9 Chips: Telink RDS IDE for RISC-V • 下载调试工具: Telink Burning and Debugg…...

C#实现商品信息的显示异常处理
实验四:C#实现商品信息的显示异常处理 任务要求: 在进销存管理系统中,商品的库存信息有很多种类,比如商品型号、商品名称、商品库存量等。在面向对象编程中,这些商品的信息可以存储到属性中,然后当需要使…...
细数N个获取天气信息的免费 API ,附超多免费可用API 推荐(三)
前言 市面上有 N 多个查询天气信息的软件、小程序以及网页入口,基本都是通过调用天气查询 API 去实现的。 今天整理了一下多种场景的天气预报API 接口分享给大家,有需要赶紧收藏起来。 天气预报查询 天气预报查询支持全国以及全球多个城市的天气查询…...
20230404英语学习
今日单词 decade n.十年 allocate vt.分配,分派,把…拨给 compress v.压缩;缩短;浓缩 regenerate v.(使)复兴,(使)振兴;(使)再生 …...

冒泡排序 快排(hoare递归)
今天要讲一个是冒泡排序,进一个是快排,首先是冒泡排序,我相信大家接触的第一个排序并且比较有用的算法就是冒泡排序了,冒泡排序是算法里面比较简单的一种,所以我们先看看一下冒泡排序 还是个前面一样,我们…...

49天精通Java,第24天,Java链表、散列表、HashSet、TreeSet
目录一、链表二、散列表三、HashSet四、TreeSet五、TreeSet常用方法大家好,我是哪吒。 一、链表 从数组中间删除一个元素开销很大,其原因是向数组中插入元素时,此元素之后的所有元素都要向后端移动,删除时也是,数组中…...
HashMap源码分析小结
HashMap相关问题 HashMap实现原理 HashMap是以键值对的形式存储数据,内部是通过数组链表结构实现,在1.7之后的版本,链表结构可以升级为红黑树,提高查询效率 key和value都支持为null;key为null时hash值是0࿰…...

太奇怪了!小公司面试全挂,大厂面试全过,为什么小公司要求比大厂还高?...
大厂的人才去小公司面试,一定是降维打击吗?还真未必。一位网友很困惑:真的奇怪,小公司面试全挂,大厂面试10个过了9个,感觉小公司要求比大厂还高,这是怎么了?来看看网友们的看法。有人…...
Java开发环境配置
Java开发环境配置 Java是目前世界上最流行的编程语言之一,它的使用范围广泛,从Web应用程序到桌面应用程序再到移动应用程序,Java都是一种非常有用的语言。想要进行Java开发,首先需要在计算机上配置Java开发环境。 在本文中&…...

大学英语视听说教程(陈向京版本)
词汇题(55道) 1. You should carefully think over_____ the manager said at the meeting. A. that B. which C. what D. whose 1.选C,考察宾语从句连接词,主句谓语动词think over后面缺宾语,后面的宾语从句谓语动…...
nginx--开源免费
nginx开源免费,支持高性能,高并发的web服务和代理服务软件。 apache,nodejs nginx可以提供的服务: 1、web服务 2、负载均衡(反向代理)(动静分离) 3、web cache(web缓存) nginx…...

阿里云OSS对象存储
目录 1:OSS 1.1:开通OSS服务 1.2:搭建OSS环境 1.2.1:创建Bucket存储空间 1.2.2:创建文件夹上传图片 1.2.3:RAM访问控制 1.3:快速入门 1.3.1:下载SDK 1.3.2:搭建环…...

基于VHDL语言的汽车测速系统设计_kaic
摘 要 汽车是现代交通工具。车速是一项至关重要的指标。既影响着汽车运输的生产率,又关乎着汽车行驶有没有超速违章,还影响着汽车行驶时人们的人身安全。而伴随着我国国民的安全防范意识的逐步增强,人们也开始越来越关心因为汽车的超速而带来的极其严重…...

【数据结构】单链表(笔记总结)
👦个人主页:Weraphael ✍🏻作者简介:目前学习C和算法 ✈️专栏:数据结构 🐋 希望大家多多支持,咱一起进步!😁 如果文章对你有帮助的话 欢迎 评论💬 点赞&…...
Git操作之 git add 撤销、git commit 撤销
1、git add 添加多余文件 撤销操作 git reset HEAD 后面什么都不跟的,就是上一次add 里面的内容全部撤销 git reset HEAD XXX 后面跟文件名,就是对某个文件进行撤销 2、git commit 撤销操作 git reset --soft HEAD^ 这样就成功的撤销了commit操作 注…...

CTF show Web 红包题第六弹
提示 1.不是SQL注入 2.需要找关键源码 思路 进入页面发现是一个登录框,很难让人不联想到SQL注入,但提示都说了不是SQL注入,所以就不往这方面想了 先查看一下网页源码,发现一段JavaScript代码,有一个关键类ctfs…...

CMake基础:构建流程详解
目录 1.CMake构建过程的基本流程 2.CMake构建的具体步骤 2.1.创建构建目录 2.2.使用 CMake 生成构建文件 2.3.编译和构建 2.4.清理构建文件 2.5.重新配置和构建 3.跨平台构建示例 4.工具链与交叉编译 5.CMake构建后的项目结构解析 5.1.CMake构建后的目录结构 5.2.构…...
vue3 字体颜色设置的多种方式
在Vue 3中设置字体颜色可以通过多种方式实现,这取决于你是想在组件内部直接设置,还是在CSS/SCSS/LESS等样式文件中定义。以下是几种常见的方法: 1. 内联样式 你可以直接在模板中使用style绑定来设置字体颜色。 <template><div :s…...
第25节 Node.js 断言测试
Node.js的assert模块主要用于编写程序的单元测试时使用,通过断言可以提早发现和排查出错误。 稳定性: 5 - 锁定 这个模块可用于应用的单元测试,通过 require(assert) 可以使用这个模块。 assert.fail(actual, expected, message, operator) 使用参数…...
Linux云原生安全:零信任架构与机密计算
Linux云原生安全:零信任架构与机密计算 构建坚不可摧的云原生防御体系 引言:云原生安全的范式革命 随着云原生技术的普及,安全边界正在从传统的网络边界向工作负载内部转移。Gartner预测,到2025年,零信任架构将成为超…...

多种风格导航菜单 HTML 实现(附源码)
下面我将为您展示 6 种不同风格的导航菜单实现,每种都包含完整 HTML、CSS 和 JavaScript 代码。 1. 简约水平导航栏 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport&qu…...
Webpack性能优化:构建速度与体积优化策略
一、构建速度优化 1、升级Webpack和Node.js 优化效果:Webpack 4比Webpack 3构建时间降低60%-98%。原因: V8引擎优化(for of替代forEach、Map/Set替代Object)。默认使用更快的md4哈希算法。AST直接从Loa…...

【p2p、分布式,区块链笔记 MESH】Bluetooth蓝牙通信 BLE Mesh协议的拓扑结构 定向转发机制
目录 节点的功能承载层(GATT/Adv)局限性: 拓扑关系定向转发机制定向转发意义 CG 节点的功能 节点的功能由节点支持的特性和功能决定。所有节点都能够发送和接收网格消息。节点还可以选择支持一个或多个附加功能,如 Configuration …...
DiscuzX3.5发帖json api
参考文章:PHP实现独立Discuz站外发帖(直连操作数据库)_discuz 发帖api-CSDN博客 简单改造了一下,适配我自己的需求 有一个站点存在多个采集站,我想通过主站拿标题,采集站拿内容 使用到的sql如下 CREATE TABLE pre_forum_post_…...

热门Chrome扩展程序存在明文传输风险,用户隐私安全受威胁
赛门铁克威胁猎手团队最新报告披露,数款拥有数百万活跃用户的Chrome扩展程序正在通过未加密的HTTP连接静默泄露用户敏感数据,严重威胁用户隐私安全。 知名扩展程序存在明文传输风险 尽管宣称提供安全浏览、数据分析或便捷界面等功能,但SEMR…...