当前位置: 首页 > news >正文

百度的新想象力在哪?

理解中国大模型,百度是一个窗口。这个窗口的特殊性不仅在于变化本身,而是在于百度本身就是那个窗口。 

作者|皮爷 

出品|产业家 

沿着首钢园北区向西北步行10分钟,就能看到一个高约90米的大跳台,在工业园钢铁痕迹的印衬下,雪白的坡道在给人质感的同时,也更多了几分厚重——这里是刚刚过去的冬季奥运会自由滑板大跳台和单人滑板大跳台项目的举办地,伫立在首钢园的它也是当今全世界唯一一个永久保留的滑雪大跳台。

今天,这里是百度的主场。

关于百度,在过去的一年里很难有人忽视掉这家老牌中国互联网企业。不论是在大模型浪潮里代表中国的“率先出战”,还是其大模型产品在技术参数和落地上的一个个动作,再或者是百度在自身各个产品线上的AI重构,每一个事件和节点都在成为着中国大模型舞台上的核心事件之一。

这些成绩在展示着中国AI企业的特殊加速度背后,也更在让外界重新认识和理解百度——在All in AI多年后,有一身“极客”气质的百度终于站在了自己的专属舞台上。

不过如今,和它一起出现再次出现在“百度世界大会”舞台上的,不仅是大模型本身,还有百度各个“换上新装”的一众明星产品:百度文库、百度文档、百度网盘等等……

现在的百度,是一个怎样的百度?又或者说,伴随着AI大模型浪潮蜂拥而来的,除了文心大模型,百度在发生的改变还有什么?

理解中国大模型,百度是一个窗口。这个窗口的特殊性不仅在于变化本身,而是在于百度本身就是那个窗口。

一、大模型潮水里的百度时刻

“我们是全球科技大厂里最先发布大模型的公司。”在今年的3月16日,始终身穿一身白衬衫出现在公众面前的李彦宏向外界发布了百度文心大模型。

而在7个月过后的今天,这个被率先发布的互联网大厂大模型有了新的成绩单——文心大模型4.0版本正式发布。客观来看,这是目前国内唯一一个可以对标GPT-4的大模型产品。

这意味着什么?

过去几个月的时间里,大模型浪潮蜂拥而来。根据中国新一代人工智能发展战略研究院发布的《2023中国新一代人工智能科技产业发展报告》数据显示,目前国内大模型数量超过200家,其中参数量级超过10亿的模型数接近80个。

这些模型不仅是基础模型,更多的则是产业模型,比如面向金融、教育、工业、农业等不同的产业方向,它们都在成为着大模型的价值自证地和新机会市场。

但在其中,百度文心大模型仍然是尤为特殊的一个。

能力本身是大模型绕不开的必考卷。从时间线来看,在百度推出文心一言模型后的2个月后,百度正式宣布文心大模型正式从 3.0 升级到3.5,文心大模型 3.5 的模型效果累计提升超过 50%,训练速度提升了 2 倍,推理速度提升了 30 倍。

这个升级在IDC发布的《AI大模型技术能力评估报告,2023》中有足够清晰的例证。即百度文心大模型3.5在12项相关指标测试中,拿下了7个满分,包括综合评分、算法模型、行业覆盖等均取得了第一名。

而如今的4.0版本尽管被社会层面的验证仍然在路上。但根据官网数据显示,文心大模型4.0,相比3.5版本,逻辑和记忆能力有显著的提升,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。此外,文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了近30%。

此外,能力之外,场景更是当下大模型被检验的核心指标。在面向产业端的市场中,百度智能云发布了千帆平台,为企业提供“大模型超级工厂”服务。而这个方案的数据是,从今年3月份以来,它已经服务了超过17000家客户,在超过400个场景中实现了落地。

而在这些之外,百度的更特殊之处在于对自身的重新重塑,在在这次大会上重磅亮相的百度文库、百度文档、百度网盘等产品背后,对应的是百度自身对于AI的深度应用和理解,即基于文心大模型,百度真正肉眼可见的进入AI-native时代。

实际上,在过去的几个月时间里,人们对于大模型的讨论始终不绝于耳。从最开始单纯追求参数,到后来的重视场景,再到如今的AI原生应用,对应的一方面是人们对于大模型技术愈发趋向理性和冷静的观察,另一方面也更是大模型本身在实际发展不同阶段的不同核心命题——从技术到场景到AI应用。

而伴随着这些不同的命题,对应的是舞台中央不断轮换的企业,比如技术至上的极客公司,比如有专有产业数据的产业模型企业,再比如具备产品开发能力的产品模型创业者等等。但在舞台中央,在不同的阶段,百度却始终都在聚光灯下。

不论是芯片算力、还是场景落地,再或者是生态开放和AI原生应用等等,在每一个大模型的棱面上,百度始终会是那个率先出击的企业,最终也恰构成了这次百度世界大会给外界展示出的大模型“多面体”。

或者可以说,百度在成为引领者、亲历者的同时,也更在成为一面中国大模型企业出击的“时刻”标签。

二、谁在推动AI奇点?

2019年,在小说《三体》出版后,刘慈欣还写了一篇名为《技术奇点》的文章,在文章中他写到,“什么是技术奇点?是技术的进步可能由量变产生突然的质变,在极短的时间里彻底改变人类世界的状态。”

而这个词,在如今的大模型时代更是被再次提及。即在大模型时代里,什么才是真正的奇点?又或者说,什么才是真正的推动大模型普惠的最直接路径?

如果说从技术到场景,对应的是大模型缓慢前行的过程。那么,在此之外一个更为直接的答案则是应用,更具体来说,则是基于大模型技术的应用。

“应用的最关键价值在于,它能让技术变得可见、可用和可感。”一位观察大模型的投资人告诉产业家,“它能强化大模型的普惠效应。”

这也正是百度的思考。以这次大会为例,百度内部诸多应用都在成为AI驱动的应用,比如百度文库,其升级为“一站式智能文档平台”,接下来其将不仅具备之前的信息查阅功能,更具备"PPT智能生成、文档智能生成、智能编辑、智能辅助阅读"等核心AI能力。

再比如百度网盘,其主打的网盘智能助理“云一朵”是国内首个网盘智能助理,用户只需要一句话,就能对网盘内的文件、图片、视频等进行操作,方便用户在网盘里、视频里“找东西”。同样还有百度地图,基于文心大模型进行重构的百度地图V19,将上线全新“AI向导”,它将具备多轮自然语言交互能力,更接近“真人交流”体验。

可以理解为,百度正在将固有的产品界面基于大模型进行重新解构,这种解构不再是之前的产品功能优化,而是基于新的交互方式和强大的中文知识图谱做支撑,进行更为彻底的从交互到产品功能的重构。

实际上,这也恰是当下大模型强化技术标签的最强社会信号。

即伴随着大模型的技术推进,越来越多的共识是这项技术将会率先在产业侧落地,其基于大模型本身对数据的重新训练和表达可以转化为更先进的生产力,帮助企业实现更快速的数字化转型。

这种思考诚然如此,但在这之外,更关键的点在于对于C端人群语法凸显的一个问题是——“大模型是什么?”。在单纯的一问一答之外,大模型的更多元表达会是什么?

这个问题知易行难。对于中国互联网市场的一众产品而言,需要被重新架设的不仅是固有的产品思维,也更是在其上需要被重点强化的领域知识图谱和数据,以及足够强大的能支撑C端人群的算力底层。

可以理解为,百度的这些应用重构,恰是这个难题的答案。即作为兼备明星产品和坚实模型能力的互联网企业,百度是为数不多的可以将两者进行加法的科技厂商,这些最中文语义最强的知识图谱被拆解成具体的模块,经过特殊的微调和强化,和不同的产品形态进行特殊的加法,或乘法。

不过,从某种层面来看,这些应用也恰构成着百度或者说大模型企业在当下数字化时代的特殊飞轮,即通过应用可以对大模型进行更广和更深的数据训练和加持,基于现象级落地实现大模型自身的优化升级。

这是百度锚定的奇点,也更是一个大模型进化的必然奇点。

三、中国大模型拼图里,重新理解百度

实际上,在一众的节点之中,百度正在成为一个不同的百度。如果说百度之前的标签是搜索、是营销,那么如今百度更核心的标签恰是AI大模型。

这种变化足够鲜明。从整个产品矩阵来看,不论是百度最核心的搜索,还是百度文库、百度网盘、百度地图、百度营销,乃至其他板块的小度科技、度小满金融等等,都已然基于大模型构建出自己的新形态。

恰如李彦宏在会上所说,

就当下而言,在整个中国大模型的版图里,百度更可以看作是一个足够清晰的AI样板间。基于文心大模型,这家企业的产品、商业模式都在发生肉眼可见的变化,这些变化也恰在给市场和用户提供一种特殊的大模型普惠的使用方式——大模型被具象为更加专用的产品场景,帮助人们更好地解构数据和获取知识。

而在这种变化背后,对应的是如今百度文心大模型4.0更为强大的理解和逻辑能力,以及底层充分的算力支撑。

这些构成的是如今的新百度。在这个新的百度身上,看到的是新智能化的产品矩阵,新被拓宽的商业空间天花板和新的愈发广阔的新想象力。

当然,也更有对技术的始终专注和坚持。根据财报数据显示,百度核心研发费用占百度核心收入比例已连续7个季度超过20%,而这些研发的数字在如今的大模型时代,恰在从质变走到量变,转化成一个个百度重新出发的原点。

实际上,百度的变化也更在被市场所看见。在刚刚过去的9月7日晚,《时代》周刊发布了首届全球百大AI人物,百度创始人、董事长兼首席执行官李彦宏、特斯拉CEO埃隆·马斯克、英伟达创始人兼CEO黄仁勋、Open AI CEO萨姆·奥特曼等被评为全球AI领袖。《时代》给李彦宏的评语是,“李彦宏是中国最杰出的未来主义者,长期投身于AI发展的浪潮。

更客观的表达是,在当下的AI时代,百度多年的默默坚持正在被转化为加速出发的动力。在这一轮的大模型潮水里,“百度时刻”在加速到来,属于百度的中央舞台也正在缓缓驶来。

仍记得一组数据——8 月 31 日,文心一言率先向全社会全面开放,从0 点至 24 点,文心一言共计回复网友超 3342 万个问题。

或许,多年之后再看这个时间点,它是许多人在大模型时代推开的第一扇大门,也更是新百度的推开的第一扇窗。

相关文章:

百度的新想象力在哪?

理解中国大模型,百度是一个窗口。这个窗口的特殊性不仅在于变化本身,而是在于百度本身就是那个窗口。 作者|皮爷 出品|产业家 沿着首钢园北区向西北步行10分钟,就能看到一个高约90米的大跳台,在工业园钢铁痕迹的印衬下&#…...

Linux使用rpm包安装mysql5.7

以前安装过mysql 前言:检查以前是否装有mysql rpm -qa|grep -i mysql安装了会显示:   bt-mysql57-5.7.31-1.el7.x86_64 停止mysql服务和删除之前安装的mysql rpm -e bt-mysql57-5.7.31-1.el7.x86_64查找并删除mysql相关目录 find / -name mysql/va…...

LLDB 三种输出方式 对比及原理探索

前言 当我们的项目过大时,就会使我们项目的编译耗时过长,如何在项目运行时进项代码调试,熟练使用LLDB就可以解决这个难题,大幅度提高我们的开发效率。 什么是 LLDB? LLDB是英文Low Lever Debug的缩写,是XCode内置的为我们开发者提供的调试工具,它与LLVM编译器一起,存…...

基于架构软件设计-架构真题(五十八)

“41”视图主要描述系统逻辑架构。其中()视图用于描述对象模型,并说明系统应该为用户提供哪些服务。 过程开发物理逻辑 解析: “41”有逻辑视图、过程视图、物理视图、开发视图和架构的描述。 逻辑视图:设计的对象…...

jvm实现的锁优化

目录 轻量级锁 轻量级锁的工作流程 轻量级锁的解锁 偏向锁 偏向锁的流程: 偏向锁和轻量级锁机区别: 其他优化 自旋锁和自适应自旋锁 锁消除 锁粗化 轻量级锁 “轻量级” 是相对于使用操作系统互斥量来实现的传统锁而言的,因此传统的…...

JMeter做http接口功能测试

1. 普通的以key-value传参的get请求 e.g. 获取用户信息 添加http请求;填写服务器域名或IP;方法选GET;填写路径;添加参数;运行并查看结果。 2. 以Json串传参的post请求 e.g. 获取用户余额 添加http请求;…...

【安全体系架构】——SIEM架构

什么是SIEM架构? 安全信息与事件管理(SIEM)架构是一种综合性的安全管理系统,旨在监控、检测、报告和应对安全事件和威胁。SIEM系统集成了多个安全功能,包括日志收集、事件管理、威胁检测和响应,以提供组织…...

nginx acess日志找不到访问记录问题

这个是AI给出的可能得原因: 如果在nginx中找不到你的访问记录,但你确实进行了访问并得到了返回,可能有以下原因: 日志文件位置设置不正确:请确保你的nginx配置文件中的access_log指令指向了正确的日志文件路径。日志文…...

canvas使用

canvas使用 1 canvas绘制基本 1 概念 HTML5<canvas>元素用于图形的绘制&#xff0c;区别于css,它的绘制通过javascript来完成绘制的 <canvas>标签只是图形容器&#xff0c;必须使用及保本来绘制图形 Canvas API主要聚焦与2D图形。同时<canvas>元素的Web…...

PMP认证考试证书领取的通知

各位考生&#xff1a; 2022年6月、7月、8月PMI认证考试证书领取工作已经开始&#xff0c;您可通过以下两种方式领取证书&#xff1a; 1.联系本人所在培训机构&#xff0c;通过培训机构向考点统一代领。 2.在2023年10月20日-10月31日内&#xff0c;登录本网站报名系统个人账户…...

华为云HECS云服务器docker环境下安装nacos

华为云HECS云服务器&#xff0c;安装docker环境&#xff0c;查看如下文章。 华为云HECS安装docker-CSDN博客 一、拉取镜像 docker pull nacos/nacos-server二、宿主机创建挂载目录 执行如下命令&#xff1a; mkdir -p /usr/local/nacos/logs mkdir -p /usr/local/nacos/con…...

Oracle数据库修改序列,Oracle中的主键值和序列中的值对应不上时的处理方式

select max(stu.id) maxid from student stu; //查询student表中id的最大值select XXX_SEQ.nextval from dual; //查询student表中id对应序列XXX_SEQ的下一个值alter sequence XXX_SEQ increment by 1000; //将序列XXX_SEQ步长改为1000&#xff0c;对应 student表中id的最大值s…...

Verilog基础:避免混合使用阻塞和非阻塞赋值

相关阅读 Verilog基础https://blog.csdn.net/weixin_45791458/category_12263729.html?spm1001.2014.3001.5482 “避免在一个always块中混杂阻塞赋值和非阻塞赋值”&#xff0c;这条原则是著名的Verilog专家Cliff Cummings在论文SUNG2000中提出的&#xff0c;这个观点在公众讨…...

04、MySQL-------MyCat实现分库分表

目录 九、MyCat实现分库分表1、分库分表介绍&#xff1a;横向&#xff08;水平&#xff09;拆分**垂直分表**&#xff1a;水平分表&#xff1a;**分库分表** 纵向&#xff08;垂直&#xff09;拆分分表字段选择 2、分库分表操作&#xff1a;1、分析图&#xff1a;2、克隆主从3、…...

开源软件-禅道Zentao

禅道Zentao 简介漏洞复现SQL注入漏洞**16.5****router.class.php SQL注入** **v18.0-v18.3****后台命令执行** 远程命令执行漏洞&#xff08;RCE&#xff09;后台命令执行 简介 是一款开源的项目管理软件&#xff0c;旨在帮助团队组织和管理他们的项目。Zentao提供了丰富的功能…...

Linux生产者消费者模型

生产者消费者模型 生产者消费者模型生产者消费者模型的概念生产者消费者模型的特点生产者消费者模型优点 基于BlockingQueue的生产者消费者模型基于阻塞队列的生产者消费者模型模拟实现基于阻塞队列的生产消费模型 生产者消费者模型 生产者消费者模型的概念 生产者消费者模式就…...

【Qt-20】Qt信号与槽

一、什么是信号和槽 信号是特定情况下被发射的事件&#xff0c;发射信号使用emit关键字&#xff0c;定义信号使用signals关键字&#xff0c;在signals前面不能使用public、private、protected等限定符&#xff0c;信号只用声明&#xff0c;不需也不能对其进行定义实现。另外&am…...

“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统

云布道师 前言&#xff1a; 随着数字经济的发展&#xff0c;线上数字化远程销售模式越来越成为一种主流&#xff0c;销售流程也演变为线上视频会议、线下拜访等多种方式的结合。根据 Gartner 报告&#xff0c;到 2025 年 60% 的 B2B 销售组织将从基于经验和直觉的销售转变为数…...

selenium 自动化测试——WebDriver API

控制浏览器 控制浏览器窗口大小&#xff1a;set_window_size()方法 设置全屏模式下运行&#xff1a;maximize_window()方法 from selenium import webdriver from selenium.webdriver.common.by import By import timedriver webdriver.Chrome() driver.get("http://w…...

【实战】学习 Electron:构建跨平台桌面应用

文章目录 一、Electron 简介二、Electron 的优势1. 学习曲线平缓2. 丰富的生态系统3. 跨平台支持4. 开源和社区支持 三、Electron 的使用1. 安装 Node.js2. 安装 Electron3. 创建项目4. 初始化项目5. 安装依赖6. 创建主进程文件7. 创建渲染进程文件8. 打包应用程序9. 运行应用程…...

线程同步:确保多线程程序的安全与高效!

全文目录&#xff1a; 开篇语前序前言第一部分&#xff1a;线程同步的概念与问题1.1 线程同步的概念1.2 线程同步的问题1.3 线程同步的解决方案 第二部分&#xff1a;synchronized关键字的使用2.1 使用 synchronized修饰方法2.2 使用 synchronized修饰代码块 第三部分&#xff…...

基于服务器使用 apt 安装、配置 Nginx

&#x1f9fe; 一、查看可安装的 Nginx 版本 首先&#xff0c;你可以运行以下命令查看可用版本&#xff1a; apt-cache madison nginx-core输出示例&#xff1a; nginx-core | 1.18.0-6ubuntu14.6 | http://archive.ubuntu.com/ubuntu focal-updates/main amd64 Packages ng…...

关于iview组件中使用 table , 绑定序号分页后序号从1开始的解决方案

问题描述&#xff1a;iview使用table 中type: "index",分页之后 &#xff0c;索引还是从1开始&#xff0c;试过绑定后台返回数据的id, 这种方法可行&#xff0c;就是后台返回数据的每个页面id都不完全是按照从1开始的升序&#xff0c;因此百度了下&#xff0c;找到了…...

【论文笔记】若干矿井粉尘检测算法概述

总的来说&#xff0c;传统机器学习、传统机器学习与深度学习的结合、LSTM等算法所需要的数据集来源于矿井传感器测量的粉尘浓度&#xff0c;通过建立回归模型来预测未来矿井的粉尘浓度。传统机器学习算法性能易受数据中极端值的影响。YOLO等计算机视觉算法所需要的数据集来源于…...

2025 后端自学UNIAPP【项目实战:旅游项目】6、我的收藏页面

代码框架视图 1、先添加一个获取收藏景点的列表请求 【在文件my_api.js文件中添加】 // 引入公共的请求封装 import http from ./my_http.js// 登录接口&#xff08;适配服务端返回 Token&#xff09; export const login async (code, avatar) > {const res await http…...

大模型多显卡多服务器并行计算方法与实践指南

一、分布式训练概述 大规模语言模型的训练通常需要分布式计算技术,以解决单机资源不足的问题。分布式训练主要分为两种模式: 数据并行:将数据分片到不同设备,每个设备拥有完整的模型副本 模型并行:将模型分割到不同设备,每个设备处理部分模型计算 现代大模型训练通常结合…...

快刀集(1): 一刀斩断视频片头广告

一刀流&#xff1a;用一个简单脚本&#xff0c;秒杀视频片头广告&#xff0c;还你清爽观影体验。 1. 引子 作为一个爱生活、爱学习、爱收藏高清资源的老码农&#xff0c;平时写代码之余看看电影、补补片&#xff0c;是再正常不过的事。 电影嘛&#xff0c;要沉浸&#xff0c;…...

MinIO Docker 部署:仅开放一个端口

MinIO Docker 部署:仅开放一个端口 在实际的服务器部署中,出于安全和管理的考虑,我们可能只能开放一个端口。MinIO 是一个高性能的对象存储服务,支持 Docker 部署,但默认情况下它需要两个端口:一个是 API 端口(用于存储和访问数据),另一个是控制台端口(用于管理界面…...

【FTP】ftp文件传输会丢包吗?批量几百个文件传输,有一些文件没有传输完整,如何解决?

FTP&#xff08;File Transfer Protocol&#xff09;本身是一个基于 TCP 的协议&#xff0c;理论上不会丢包。但 FTP 文件传输过程中仍可能出现文件不完整、丢失或损坏的情况&#xff0c;主要原因包括&#xff1a; ✅ 一、FTP传输可能“丢包”或文件不完整的原因 原因描述网络…...

热门Chrome扩展程序存在明文传输风险,用户隐私安全受威胁

赛门铁克威胁猎手团队最新报告披露&#xff0c;数款拥有数百万活跃用户的Chrome扩展程序正在通过未加密的HTTP连接静默泄露用户敏感数据&#xff0c;严重威胁用户隐私安全。 知名扩展程序存在明文传输风险 尽管宣称提供安全浏览、数据分析或便捷界面等功能&#xff0c;但SEMR…...