百度的新想象力在哪?
理解中国大模型,百度是一个窗口。这个窗口的特殊性不仅在于变化本身,而是在于百度本身就是那个窗口。
作者|皮爷
出品|产业家
沿着首钢园北区向西北步行10分钟,就能看到一个高约90米的大跳台,在工业园钢铁痕迹的印衬下,雪白的坡道在给人质感的同时,也更多了几分厚重——这里是刚刚过去的冬季奥运会自由滑板大跳台和单人滑板大跳台项目的举办地,伫立在首钢园的它也是当今全世界唯一一个永久保留的滑雪大跳台。
今天,这里是百度的主场。
关于百度,在过去的一年里很难有人忽视掉这家老牌中国互联网企业。不论是在大模型浪潮里代表中国的“率先出战”,还是其大模型产品在技术参数和落地上的一个个动作,再或者是百度在自身各个产品线上的AI重构,每一个事件和节点都在成为着中国大模型舞台上的核心事件之一。
这些成绩在展示着中国AI企业的特殊加速度背后,也更在让外界重新认识和理解百度——在All in AI多年后,有一身“极客”气质的百度终于站在了自己的专属舞台上。
不过如今,和它一起出现再次出现在“百度世界大会”舞台上的,不仅是大模型本身,还有百度各个“换上新装”的一众明星产品:百度文库、百度文档、百度网盘等等……
现在的百度,是一个怎样的百度?又或者说,伴随着AI大模型浪潮蜂拥而来的,除了文心大模型,百度在发生的改变还有什么?
理解中国大模型,百度是一个窗口。这个窗口的特殊性不仅在于变化本身,而是在于百度本身就是那个窗口。
一、大模型潮水里的百度时刻
“我们是全球科技大厂里最先发布大模型的公司。”在今年的3月16日,始终身穿一身白衬衫出现在公众面前的李彦宏向外界发布了百度文心大模型。
而在7个月过后的今天,这个被率先发布的互联网大厂大模型有了新的成绩单——文心大模型4.0版本正式发布。客观来看,这是目前国内唯一一个可以对标GPT-4的大模型产品。
这意味着什么?
过去几个月的时间里,大模型浪潮蜂拥而来。根据中国新一代人工智能发展战略研究院发布的《2023中国新一代人工智能科技产业发展报告》数据显示,目前国内大模型数量超过200家,其中参数量级超过10亿的模型数接近80个。
这些模型不仅是基础模型,更多的则是产业模型,比如面向金融、教育、工业、农业等不同的产业方向,它们都在成为着大模型的价值自证地和新机会市场。
但在其中,百度文心大模型仍然是尤为特殊的一个。
能力本身是大模型绕不开的必考卷。从时间线来看,在百度推出文心一言模型后的2个月后,百度正式宣布文心大模型正式从 3.0 升级到3.5,文心大模型 3.5 的模型效果累计提升超过 50%,训练速度提升了 2 倍,推理速度提升了 30 倍。
这个升级在IDC发布的《AI大模型技术能力评估报告,2023》中有足够清晰的例证。即百度文心大模型3.5在12项相关指标测试中,拿下了7个满分,包括综合评分、算法模型、行业覆盖等均取得了第一名。
而如今的4.0版本尽管被社会层面的验证仍然在路上。但根据官网数据显示,文心大模型4.0,相比3.5版本,逻辑和记忆能力有显著的提升,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。此外,文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了近30%。
此外,能力之外,场景更是当下大模型被检验的核心指标。在面向产业端的市场中,百度智能云发布了千帆平台,为企业提供“大模型超级工厂”服务。而这个方案的数据是,从今年3月份以来,它已经服务了超过17000家客户,在超过400个场景中实现了落地。
而在这些之外,百度的更特殊之处在于对自身的重新重塑,在在这次大会上重磅亮相的百度文库、百度文档、百度网盘等产品背后,对应的是百度自身对于AI的深度应用和理解,即基于文心大模型,百度真正肉眼可见的进入AI-native时代。
实际上,在过去的几个月时间里,人们对于大模型的讨论始终不绝于耳。从最开始单纯追求参数,到后来的重视场景,再到如今的AI原生应用,对应的一方面是人们对于大模型技术愈发趋向理性和冷静的观察,另一方面也更是大模型本身在实际发展不同阶段的不同核心命题——从技术到场景到AI应用。
而伴随着这些不同的命题,对应的是舞台中央不断轮换的企业,比如技术至上的极客公司,比如有专有产业数据的产业模型企业,再比如具备产品开发能力的产品模型创业者等等。但在舞台中央,在不同的阶段,百度却始终都在聚光灯下。
不论是芯片算力、还是场景落地,再或者是生态开放和AI原生应用等等,在每一个大模型的棱面上,百度始终会是那个率先出击的企业,最终也恰构成了这次百度世界大会给外界展示出的大模型“多面体”。
或者可以说,百度在成为引领者、亲历者的同时,也更在成为一面中国大模型企业出击的“时刻”标签。
二、谁在推动AI奇点?
2019年,在小说《三体》出版后,刘慈欣还写了一篇名为《技术奇点》的文章,在文章中他写到,“什么是技术奇点?是技术的进步可能由量变产生突然的质变,在极短的时间里彻底改变人类世界的状态。”
而这个词,在如今的大模型时代更是被再次提及。即在大模型时代里,什么才是真正的奇点?又或者说,什么才是真正的推动大模型普惠的最直接路径?
如果说从技术到场景,对应的是大模型缓慢前行的过程。那么,在此之外一个更为直接的答案则是应用,更具体来说,则是基于大模型技术的应用。
“应用的最关键价值在于,它能让技术变得可见、可用和可感。”一位观察大模型的投资人告诉产业家,“它能强化大模型的普惠效应。”
这也正是百度的思考。以这次大会为例,百度内部诸多应用都在成为AI驱动的应用,比如百度文库,其升级为“一站式智能文档平台”,接下来其将不仅具备之前的信息查阅功能,更具备"PPT智能生成、文档智能生成、智能编辑、智能辅助阅读"等核心AI能力。
再比如百度网盘,其主打的网盘智能助理“云一朵”是国内首个网盘智能助理,用户只需要一句话,就能对网盘内的文件、图片、视频等进行操作,方便用户在网盘里、视频里“找东西”。同样还有百度地图,基于文心大模型进行重构的百度地图V19,将上线全新“AI向导”,它将具备多轮自然语言交互能力,更接近“真人交流”体验。
可以理解为,百度正在将固有的产品界面基于大模型进行重新解构,这种解构不再是之前的产品功能优化,而是基于新的交互方式和强大的中文知识图谱做支撑,进行更为彻底的从交互到产品功能的重构。
实际上,这也恰是当下大模型强化技术标签的最强社会信号。
即伴随着大模型的技术推进,越来越多的共识是这项技术将会率先在产业侧落地,其基于大模型本身对数据的重新训练和表达可以转化为更先进的生产力,帮助企业实现更快速的数字化转型。
这种思考诚然如此,但在这之外,更关键的点在于对于C端人群语法凸显的一个问题是——“大模型是什么?”。在单纯的一问一答之外,大模型的更多元表达会是什么?
这个问题知易行难。对于中国互联网市场的一众产品而言,需要被重新架设的不仅是固有的产品思维,也更是在其上需要被重点强化的领域知识图谱和数据,以及足够强大的能支撑C端人群的算力底层。
可以理解为,百度的这些应用重构,恰是这个难题的答案。即作为兼备明星产品和坚实模型能力的互联网企业,百度是为数不多的可以将两者进行加法的科技厂商,这些最中文语义最强的知识图谱被拆解成具体的模块,经过特殊的微调和强化,和不同的产品形态进行特殊的加法,或乘法。
不过,从某种层面来看,这些应用也恰构成着百度或者说大模型企业在当下数字化时代的特殊飞轮,即通过应用可以对大模型进行更广和更深的数据训练和加持,基于现象级落地实现大模型自身的优化升级。
这是百度锚定的奇点,也更是一个大模型进化的必然奇点。
三、中国大模型拼图里,重新理解百度
实际上,在一众的节点之中,百度正在成为一个不同的百度。如果说百度之前的标签是搜索、是营销,那么如今百度更核心的标签恰是AI大模型。
这种变化足够鲜明。从整个产品矩阵来看,不论是百度最核心的搜索,还是百度文库、百度网盘、百度地图、百度营销,乃至其他板块的小度科技、度小满金融等等,都已然基于大模型构建出自己的新形态。
恰如李彦宏在会上所说,
就当下而言,在整个中国大模型的版图里,百度更可以看作是一个足够清晰的AI样板间。基于文心大模型,这家企业的产品、商业模式都在发生肉眼可见的变化,这些变化也恰在给市场和用户提供一种特殊的大模型普惠的使用方式——大模型被具象为更加专用的产品场景,帮助人们更好地解构数据和获取知识。
而在这种变化背后,对应的是如今百度文心大模型4.0更为强大的理解和逻辑能力,以及底层充分的算力支撑。
这些构成的是如今的新百度。在这个新的百度身上,看到的是新智能化的产品矩阵,新被拓宽的商业空间天花板和新的愈发广阔的新想象力。
当然,也更有对技术的始终专注和坚持。根据财报数据显示,百度核心研发费用占百度核心收入比例已连续7个季度超过20%,而这些研发的数字在如今的大模型时代,恰在从质变走到量变,转化成一个个百度重新出发的原点。
实际上,百度的变化也更在被市场所看见。在刚刚过去的9月7日晚,《时代》周刊发布了首届全球百大AI人物,百度创始人、董事长兼首席执行官李彦宏、特斯拉CEO埃隆·马斯克、英伟达创始人兼CEO黄仁勋、Open AI CEO萨姆·奥特曼等被评为全球AI领袖。《时代》给李彦宏的评语是,“李彦宏是中国最杰出的未来主义者,长期投身于AI发展的浪潮。
更客观的表达是,在当下的AI时代,百度多年的默默坚持正在被转化为加速出发的动力。在这一轮的大模型潮水里,“百度时刻”在加速到来,属于百度的中央舞台也正在缓缓驶来。
仍记得一组数据——8 月 31 日,文心一言率先向全社会全面开放,从0 点至 24 点,文心一言共计回复网友超 3342 万个问题。
或许,多年之后再看这个时间点,它是许多人在大模型时代推开的第一扇大门,也更是新百度的推开的第一扇窗。
相关文章:

百度的新想象力在哪?
理解中国大模型,百度是一个窗口。这个窗口的特殊性不仅在于变化本身,而是在于百度本身就是那个窗口。 作者|皮爷 出品|产业家 沿着首钢园北区向西北步行10分钟,就能看到一个高约90米的大跳台,在工业园钢铁痕迹的印衬下&#…...

Linux使用rpm包安装mysql5.7
以前安装过mysql 前言:检查以前是否装有mysql rpm -qa|grep -i mysql安装了会显示: bt-mysql57-5.7.31-1.el7.x86_64 停止mysql服务和删除之前安装的mysql rpm -e bt-mysql57-5.7.31-1.el7.x86_64查找并删除mysql相关目录 find / -name mysql/va…...

LLDB 三种输出方式 对比及原理探索
前言 当我们的项目过大时,就会使我们项目的编译耗时过长,如何在项目运行时进项代码调试,熟练使用LLDB就可以解决这个难题,大幅度提高我们的开发效率。 什么是 LLDB? LLDB是英文Low Lever Debug的缩写,是XCode内置的为我们开发者提供的调试工具,它与LLVM编译器一起,存…...
基于架构软件设计-架构真题(五十八)
“41”视图主要描述系统逻辑架构。其中()视图用于描述对象模型,并说明系统应该为用户提供哪些服务。 过程开发物理逻辑 解析: “41”有逻辑视图、过程视图、物理视图、开发视图和架构的描述。 逻辑视图:设计的对象…...

jvm实现的锁优化
目录 轻量级锁 轻量级锁的工作流程 轻量级锁的解锁 偏向锁 偏向锁的流程: 偏向锁和轻量级锁机区别: 其他优化 自旋锁和自适应自旋锁 锁消除 锁粗化 轻量级锁 “轻量级” 是相对于使用操作系统互斥量来实现的传统锁而言的,因此传统的…...

JMeter做http接口功能测试
1. 普通的以key-value传参的get请求 e.g. 获取用户信息 添加http请求;填写服务器域名或IP;方法选GET;填写路径;添加参数;运行并查看结果。 2. 以Json串传参的post请求 e.g. 获取用户余额 添加http请求;…...
【安全体系架构】——SIEM架构
什么是SIEM架构? 安全信息与事件管理(SIEM)架构是一种综合性的安全管理系统,旨在监控、检测、报告和应对安全事件和威胁。SIEM系统集成了多个安全功能,包括日志收集、事件管理、威胁检测和响应,以提供组织…...
nginx acess日志找不到访问记录问题
这个是AI给出的可能得原因: 如果在nginx中找不到你的访问记录,但你确实进行了访问并得到了返回,可能有以下原因: 日志文件位置设置不正确:请确保你的nginx配置文件中的access_log指令指向了正确的日志文件路径。日志文…...
canvas使用
canvas使用 1 canvas绘制基本 1 概念 HTML5<canvas>元素用于图形的绘制,区别于css,它的绘制通过javascript来完成绘制的 <canvas>标签只是图形容器,必须使用及保本来绘制图形 Canvas API主要聚焦与2D图形。同时<canvas>元素的Web…...
PMP认证考试证书领取的通知
各位考生: 2022年6月、7月、8月PMI认证考试证书领取工作已经开始,您可通过以下两种方式领取证书: 1.联系本人所在培训机构,通过培训机构向考点统一代领。 2.在2023年10月20日-10月31日内,登录本网站报名系统个人账户…...

华为云HECS云服务器docker环境下安装nacos
华为云HECS云服务器,安装docker环境,查看如下文章。 华为云HECS安装docker-CSDN博客 一、拉取镜像 docker pull nacos/nacos-server二、宿主机创建挂载目录 执行如下命令: mkdir -p /usr/local/nacos/logs mkdir -p /usr/local/nacos/con…...
Oracle数据库修改序列,Oracle中的主键值和序列中的值对应不上时的处理方式
select max(stu.id) maxid from student stu; //查询student表中id的最大值select XXX_SEQ.nextval from dual; //查询student表中id对应序列XXX_SEQ的下一个值alter sequence XXX_SEQ increment by 1000; //将序列XXX_SEQ步长改为1000,对应 student表中id的最大值s…...

Verilog基础:避免混合使用阻塞和非阻塞赋值
相关阅读 Verilog基础https://blog.csdn.net/weixin_45791458/category_12263729.html?spm1001.2014.3001.5482 “避免在一个always块中混杂阻塞赋值和非阻塞赋值”,这条原则是著名的Verilog专家Cliff Cummings在论文SUNG2000中提出的,这个观点在公众讨…...

04、MySQL-------MyCat实现分库分表
目录 九、MyCat实现分库分表1、分库分表介绍:横向(水平)拆分**垂直分表**:水平分表:**分库分表** 纵向(垂直)拆分分表字段选择 2、分库分表操作:1、分析图:2、克隆主从3、…...

开源软件-禅道Zentao
禅道Zentao 简介漏洞复现SQL注入漏洞**16.5****router.class.php SQL注入** **v18.0-v18.3****后台命令执行** 远程命令执行漏洞(RCE)后台命令执行 简介 是一款开源的项目管理软件,旨在帮助团队组织和管理他们的项目。Zentao提供了丰富的功能…...

Linux生产者消费者模型
生产者消费者模型 生产者消费者模型生产者消费者模型的概念生产者消费者模型的特点生产者消费者模型优点 基于BlockingQueue的生产者消费者模型基于阻塞队列的生产者消费者模型模拟实现基于阻塞队列的生产消费模型 生产者消费者模型 生产者消费者模型的概念 生产者消费者模式就…...

【Qt-20】Qt信号与槽
一、什么是信号和槽 信号是特定情况下被发射的事件,发射信号使用emit关键字,定义信号使用signals关键字,在signals前面不能使用public、private、protected等限定符,信号只用声明,不需也不能对其进行定义实现。另外&am…...

“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统
云布道师 前言: 随着数字经济的发展,线上数字化远程销售模式越来越成为一种主流,销售流程也演变为线上视频会议、线下拜访等多种方式的结合。根据 Gartner 报告,到 2025 年 60% 的 B2B 销售组织将从基于经验和直觉的销售转变为数…...
selenium 自动化测试——WebDriver API
控制浏览器 控制浏览器窗口大小:set_window_size()方法 设置全屏模式下运行:maximize_window()方法 from selenium import webdriver from selenium.webdriver.common.by import By import timedriver webdriver.Chrome() driver.get("http://w…...

【实战】学习 Electron:构建跨平台桌面应用
文章目录 一、Electron 简介二、Electron 的优势1. 学习曲线平缓2. 丰富的生态系统3. 跨平台支持4. 开源和社区支持 三、Electron 的使用1. 安装 Node.js2. 安装 Electron3. 创建项目4. 初始化项目5. 安装依赖6. 创建主进程文件7. 创建渲染进程文件8. 打包应用程序9. 运行应用程…...
OpenLayers 可视化之热力图
注:当前使用的是 ol 5.3.0 版本,天地图使用的key请到天地图官网申请,并替换为自己的key 热力图(Heatmap)又叫热点图,是一种通过特殊高亮显示事物密度分布、变化趋势的数据可视化技术。采用颜色的深浅来显示…...
CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型
CVPR 2025 | MIMO:支持视觉指代和像素对齐的医学视觉语言模型 论文信息 标题:MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者:Yanyuan Chen, Dexuan Xu, Yu Hu…...

Day131 | 灵神 | 回溯算法 | 子集型 子集
Day131 | 灵神 | 回溯算法 | 子集型 子集 78.子集 78. 子集 - 力扣(LeetCode) 思路: 笔者写过很多次这道题了,不想写题解了,大家看灵神讲解吧 回溯算法套路①子集型回溯【基础算法精讲 14】_哔哩哔哩_bilibili 完…...

【机器视觉】单目测距——运动结构恢复
ps:图是随便找的,为了凑个封面 前言 在前面对光流法进行进一步改进,希望将2D光流推广至3D场景流时,发现2D转3D过程中存在尺度歧义问题,需要补全摄像头拍摄图像中缺失的深度信息,否则解空间不收敛…...
数据链路层的主要功能是什么
数据链路层(OSI模型第2层)的核心功能是在相邻网络节点(如交换机、主机)间提供可靠的数据帧传输服务,主要职责包括: 🔑 核心功能详解: 帧封装与解封装 封装: 将网络层下发…...
Linux云原生安全:零信任架构与机密计算
Linux云原生安全:零信任架构与机密计算 构建坚不可摧的云原生防御体系 引言:云原生安全的范式革命 随着云原生技术的普及,安全边界正在从传统的网络边界向工作负载内部转移。Gartner预测,到2025年,零信任架构将成为超…...
【python异步多线程】异步多线程爬虫代码示例
claude生成的python多线程、异步代码示例,模拟20个网页的爬取,每个网页假设要0.5-2秒完成。 代码 Python多线程爬虫教程 核心概念 多线程:允许程序同时执行多个任务,提高IO密集型任务(如网络请求)的效率…...
实现弹窗随键盘上移居中
实现弹窗随键盘上移的核心思路 在Android中,可以通过监听键盘的显示和隐藏事件,动态调整弹窗的位置。关键点在于获取键盘高度,并计算剩余屏幕空间以重新定位弹窗。 // 在Activity或Fragment中设置键盘监听 val rootView findViewById<V…...

USB Over IP专用硬件的5个特点
USB over IP技术通过将USB协议数据封装在标准TCP/IP网络数据包中,从根本上改变了USB连接。这允许客户端通过局域网或广域网远程访问和控制物理连接到服务器的USB设备(如专用硬件设备),从而消除了直接物理连接的需要。USB over IP的…...

让回归模型不再被异常值“带跑偏“,MSE和Cauchy损失函数在噪声数据环境下的实战对比
在机器学习的回归分析中,损失函数的选择对模型性能具有决定性影响。均方误差(MSE)作为经典的损失函数,在处理干净数据时表现优异,但在面对包含异常值的噪声数据时,其对大误差的二次惩罚机制往往导致模型参数…...