当前位置: 首页 > news >正文

重新理解百度智能云:写在大模型开放后的24小时

在这些回答背后共同折射出的一个现实是——大模型不再是一个单选题,而更是一个综合题。在这个新的时代帆船上,产品、服务、安全、开放等全部都需要成为必需品,甚至是从企业的落地层面来看,这些更是刚需品。 

作者| 皮爷 

出品|产业家 

过去的5个月,李亮很忙。

“从今年3月份文心一言发布之后,很多工业侧的企业,甚至是国央企,都主动来和我们探讨大模型的落地。”他表示,“也包括很多行业伙伴都找过来,说看如何一起打造具备服务共性的平台。”

作为百度智能云的一位工程师,过去的近半年时间里,他真切感受到了企业对AI大模型的热切程度。这种热切是企业对具备落地能力的新技术的期待,也更是担心落后的焦虑。

这不是个例。

伴随着OpenAI和国内一众大模型企业的频频发声,越来越多的“产业+AI大模型”框架正在清晰地呈现在企业面前,相较于之前的元宇宙、区块链等技术,AI大模型应用距离企业的真实场景更近,应用路径也更短,效果更“立竿见影”。

但在热火朝天的AI实践里,越来越多企业开始逐渐发现一个更为现实的问题:最佳的大模型切入点在哪?或者说,企业应该如何高效地构建适配自身的大模型?

问题背后,对应着一众企业在大模型转型路上的“挫折”。“现在很多企业的问题是有意愿,但没渠道;或者是尝试后,整体进度很慢。”一位投资人告诉我们,“中间包括数据清洗、标注,以及prompt的生成、模型微调、训练这些,市面上都没有特别易用的方式。”

实际上,这些现象也构成了尽管企业对大模型热情依旧高涨,但越来越多开始在迈出第一步同时保持“谨慎”态度,这种观望在清晰与否的转型路径,也更在参与其中的成本性价比。

不过,AI加速的好消息依旧在传来。在刚刚过去的8月31日,百度文心一言、商汤商量SenseChat等大模型首批通过了《生成式人工智能服务管理暂行办法》备案,正式面向全社会开放服务。此外,据悉,针对企业用户,百度智能云还将在9月5日举行的2023百度云智大会上宣布四大配套举措,旨在助力企业以更低成本更快捷方式使用上大模型。

在滚滚而来的AI洪流中,企业应该如何选择适合自己的大模型?或者说,在如今大模型开放的AI时代,怎样的AI大模型才能成为企业在AI数智化时代的最佳航船?

在8家大模型获批上线的当下,这个问题正在被加速推到台前。

一、AI需求,和背后的新产业命题

在得出答案之前,不妨先来看天平的另一侧:即客户AI落地的难点到底在哪?

“现在大家对于大模型在行业会怎么落地,有哪些完全颠覆性的应用,或者说这种能带来很大风潮的应用,会出现在哪儿,也都不是很确定。其实我们客户也很清楚的认识到这一点。”百度智能云一位解决方案工程师表示。

这是如今国内很多企业面临AI大模型的共性。即尽管企业对自身的业务场景有充分的认知,但大模型能做到哪一步,以及如何使用大模型进行原有业务的降本增效,这都是未知命题。

而对部分已经尝试的企业,问题则是更为尖锐。

“我们最开始使用的是国外开源模型,但最近也在考虑尝试重新接入国内的大模型,因为国外开源的中文语义理解太差了,基本的交互都出现问题。”一位低代码企业创始人这样告诉我们。

有同样感受的是另外一家农业方向的企业,在和其创始人的交流过程中,他直言,“从最开始做prompt,到后面一轮一轮的训练,包括数据清洗、高质量标注等等,整个过程的开销非常大的,训练效果还不是特别好,甚至不如原有界面。”截止到目前,这家企业的大模型产品仍然处在内测阶段,尚未对外使用。

在这些之外,更多的企业则是停滞在大模型的“第一步”——选型。

不过,在选型阶段,企业的顾虑有所不同。对目前大部分中小企业而言,其选型难的原因在于不清楚哪家底层大模型企业的产业能力强,这些能力包括产品能力,也更有对模型微调、知识增强等服务落地的要求。

而对大型企业而言,除了数据安全之外,产业理解和复用性是企业的最核心考量。“大企业更看重的是,你不仅要在我看重的这一点的业务上能做出效果,还有就是要在整个集团的复用性上,能和既有业务结合的效率要更高。”上述工程师表示。

在他的感知里,以央国企为代表的大型企业更多地希望大模型服务商是一个教练的角色,不仅要给到好的工具,还要教会企业怎么用,从长期提升价值。

从更大的视角来看,当下大模型落地的难点大概分为三个层面,一是企业不知道选择怎样的大模型,或者说企业不知道自身的需求怎样的大模型可以满足,视野范围内的大模型选项太少;二是对部分选择自建大模型的企业而言,其在prompt提示词和数据清洗、标注以及中文增强等工具链层面屡屡碰壁,投入太大或者经验不足;三是企业自身的数据安全和合规性较高,同时需要较深的产业know-how,对大模型服务商的功能能力要求较高。

不难感知到的是,如果从原子化服务的角度拆解来看,当下国内企业对大模型的需求已然不仅在产品层面,如参数、逻辑推理等硬核指标,更大的需求点涌现在服务侧,即对不同企业需求的一站式满足,这些满足或是在prompt层面、或在中文增强、数据标注、训练层面,再或是在产业场景适配乃至数据安全,以及最核心的成本层面。

大模型,已然从一道单纯的技术命题,悄然进化为一道糅合技术、产品、服务等全部环节的产业综合命题。

二、千帆背后,看见大模型的“真实表达”

在忙碌的几个月里,李亮对一家企业印象很深刻。

“有一个矿山行业的合作伙伴,在大模型的领域非常期望跟我们合作,想要通过大模型去进行整个的矿山的智慧化服务,包括安全生产的管理,安全生产的预警等等。”他说道,“我们现在在跟他进行多轮测试,有很多也有非常不错的测试效果。”

他的意外之处在于,像矿山这样的偏传统的企业,也开始主动找到百度寻求大模型方面的进展和落地。据了解,如今双方经过多轮共创,一个基于矿山场景的大模型已经接近成型。

实际上,这不是第一个主动找到百度智能云的企业。而百度智能云对这些产业伙伴的一个统一服务界面,正是在今年3月份正式推出的一站式企业级大模型平台“百度智能云千帆”。

作为唯一TO B大模型界面,百度智能云千帆也恰构成着百度大模型在如能源、金融、政务、交通等不同产业场景的真实表达,以及包括数据管理、模型训练、评估&优化、预测服务和Prompt工程和插件服务等全部大模型开发周期的能力展示。

而在刚刚过去的8月,它更是交出了一张亮眼的成绩单。

一个亮眼之处是,在本次对外公布的模型种类中,百度智能云千帆除了文心大模型的核心外,其也更全面接入Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33个开源大模型,成为国内拥有大模型最多的平台。

换言之,基于百度智能云千帆的“模型仓库”,除了文心大模型之外,企业可以自行适合自身的其它基础大模型产品。

此外,和其它模型仓库不同的是,百度智能云千帆对“模型仓库”内的模型进行了“二次加工”。

比如,在安全性层面,千帆对所有接入的第三方模型均做了模型安全增强,不仅保障文心大模型的内容安全,还保障了第三方大模型的安全输出;再比如在成本层面,对每一个接入的大模型,千帆都做了二次性能增强。

根据测算,在性能调优后,第三方模型体积可压缩至25%-50%,推理成本可降低50%。这意味着,相较于直接调用,企业在千帆平台上使用这些模型可极大地节约成本,提升效果。

与此同时,千帆对接入的大模型做了深度适配,其为企业提供模型再训练的全套工具链以及多种形式模型调优,其中包括SFT(全量参数微调、Prompt Tuning、Lora)及强化学习(奖励模型学习、强化学习训练)等等。

换言之,基于百度智能云千帆,不论是选择文心大模型,还是平台上的第三方开源大模型,企业都可以端到端地搭建自身的专属模型

不仅于此,在对外的服务能力上,百度智能云千帆可以为企业提供公有云和私有部署两种方式,包括上文所说的大模型落地难的推理、微调、托管,企业都可以基于公有云模式接入使用。而在本地部署方面,百度智能云千帆也更是可以纯软件和软硬一体的交付方式,充分满足企业本地部署的要求。

实际上,这些能力在也构成了百度智能云千帆在一众产业侧的真实落地。根据不完全统计,在过去的5个月时间里,千帆大模型平台在超过400个真实产业场景中实现了落地。截止目前,百度文心大模型已拥有中国最大的产业落地规模。

这些落地构成了中国大模型赛道的一个个特殊节点。比如在能源层面,百度智能云和国家电网联合打造的“设备运检知识助手”入选北京市首批十大行业大模型应用案例。与深圳燃气联合发布的“深燃-百度·文心大模型”,基于大模型能力,只需要进行微调,就可以形成针对性的行业模型能力,完成多个应用场景的任务。

再比如在金融层面,百度智能云与中信金控联合打造了基于大模型的数字人,让每一位银行客户都有自己专属的理财顾问,可以承担包括投研助手、投顾助手、营销助手、合规助手等在内的多个角色。

这些真实的产业落地侧写也更在一众中小企业侧。根据不完全统计,已经有超过10万家企业申请测试,这个数目伴随着如今面向全社会层面的开放动作,也更在加速倍增。据了解,在在开放的24小时内,文心一言共计回复网友问题数超过3342万个。

可以说,不论是在产品层面,还是服务层面,千帆大模型为企业提供的是一个开放兼容的大模型选择界面,在这里,企业既可以实现从0到1的端到端大模型搭建,也更可以寻求到包括数据标注、prompt在内的一众工具链能力,以最低的成本和门槛,构建出自身的专属大模型。

三、AI时代,我们需要怎样的大模型?

如今,越来越多人开始讨论的一个命题是:在如今的产业数字化时代,我们需要怎样的大模型?有的人的回答是产品,有的人的回答是服务,也更有人的回答是数据安全。

在这些回答背后共同折射出的一个现实是——大模型不再是一个单选题,而更是一个综合题。在这个新的时代帆船上,产品、服务、安全、开放等全部都需要成为必需品,甚至是从企业的落地层面来看,这些更是刚需品。

不过,这些问题也正在被作答。

以百度智能云为例,除了在产业领域侧联合企业进行落地之外,其也更是和生态伙伴联合打造了更多基于特定场景的产品。比如和软通动力打造的大模型基础设施软通天璇2.0,与微盟联合构建的AI应用型产品WAI,以及和金蝶、金山办公一起研发的专属领域大模型产品。

在这个新的团战背后,大模型正在以更加真实的姿态出现在各个产业场景和各个企业应用中,不仅是金融、能源,也不仅是大型的央国企,在如今百度智能云千帆的底座之上,越来越多的产业场景和越来越多体量的企业都正在齐力迈出AI大模型时代的第一步。

此外,从更大的视角也同样能清晰看到的是,这些产业的真实表达也恰在构成着大模型企业的产品和营收新增长飞轮。

根据不完全统计,截至目前,百度智能云千帆平台上有103款Prompt模板,包含对话、编程、电商、医疗、游戏、翻译、演讲等十余个场景。其中既有基于百度智能云在产业实践中积累的Prompt模板,也有来源于文心一言高频用户的Prompt模板。可以预见的是,作为大模型训练中最核心的环节之一,这些Prompt模板将使得千帆更容易被企业和市场欢迎。

而在财报层面,根据百度发布的2023年Q2财报显示,第二季度百度营收341亿元实现加速增长,净利润高速增长44%。此外,由《IDC中国AI公有云服务市场份额,2022》报告数据显示,2022年中国AI公有云服务总体市场79.7亿元,其中百度智能云占28.9%排名第一。

或者可以说,在AI大模型在成为各个产业基建企业验金石的同时,它也更在成为一个新的发动机。

进度仍在持续推进。在接下来的9月5日,百度智能云还将在2023百度云智大会上宣布四大配套举措。

据内部人士透露,在此次大会上,百度智能云将全面升级“千帆大模型平台”,升级将覆盖算力基础设施、大模型工具链、高质量数据集等等。此外,其将推出基于文心大模型重构的行业解决方案,同时还将发布覆盖服务营销、办公提效、生产优化三大领域的10款企业级的AI原生应用产品。大模型相关的生态政策也将在大会上同步披露。

或许再来回答前面那个问题,即“我们需要怎样的一个大模型?”——这不仅是一个对企业而言,寻找最佳选项的命题,也更是对大模型企业而言,锚定未来和自证的长期思考。

恰如百度相关负责人在采访中所说,“未来肯定还会有更多AI产品,或许这些产品不是百度开发出来,但企业都可以基于百度智能云千帆开发出来,这是我们想要的,也是会一直持续去做的。”

答案,已经在成形的路上。

*文中李亮为化名

相关文章:

重新理解百度智能云:写在大模型开放后的24小时

在这些回答背后共同折射出的一个现实是——大模型不再是一个单选题,而更是一个综合题。在这个新的时代帆船上,产品、服务、安全、开放等全部都需要成为必需品,甚至是从企业的落地层面来看,这些更是刚需品。 作者| 皮爷 出品|产…...

Stable Diffusion 提示词技巧

文章目录 背景介绍如何写好提示词提示词的语法正向提示词负向提示词 随着AI技术的不断发展,越来越多的新算法涌现出来,例如Stable Diffusion、Midjourney、Dall-E等。相较于传统算法如GAN和VAE,这些新算法在生成高分辨率、高质量的图片方面表…...

VS2019编译curl库

下载: curl-7.61.0.tar.gz 编译: 解压到一个文件下,然后右键以管理员权限运行buildconf.bat 编译x64的库使用的是x64 Native Tools Command Prompt for VS 2019 本机工具命令提示,如果想编译x86的库,可以选择x86 Nat…...

yolov5自定义模型训练三

经过11个小时cpu训练完如下 在runs/train/expx里存放训练的结果, 测试是否可以检测ok 网上找的这张识别效果不是很好,通过加大训练次数和数据集的话精度可以提升。 训练后的权重也可以用视频源来识别, python detect.py --source 0 # webca…...

服务器中了mkp勒索病毒该怎么办?勒索病毒解密,数据恢复

mkp勒索病毒算的上是一种比较常见的勒索病毒类型了。它的感染数量上也常年排在前几名的位置。所以接下来就由云天数据恢复中心的技术工程师来对mkp勒索病毒做一个分析,以及中招以后应该怎么办。 一,中了mkp勒索病毒的表现 桌面以及多个文件夹当中都有一封…...

Docker环境搭建Prometheus实验环境

环境: OS:Centos7 Docker: 20.10.9 - Community Centos部署Docker 【Kubernetes】Centos中安装Docker和Minikube_云服务器安装docker和minikube_DivingKitten的博客-CSDN博客 一、拉取Prometheus镜像 ## 拉取镜像 docker pull prom/prometheus ## 启动p…...

Python Qt学习(七)Listview

源代码: # -*- coding: utf-8 -*-# Form implementation generated from reading ui file qt_listview.ui # # Created by: PyQt5 UI code generator 5.15.9 # # WARNING: Any manual changes made to this file will be lost when pyuic5 is # run again. Do not…...

哈希表HashMap(基于vector和list)

C数据结构与算法实现(目录) 1 什么是HashMap? 我们这里要实现的HashMap接口不会超过标准库的版本(是一个子集)。 HashMap是一种键值对容器(关联容器),又叫字典。 和其他容易一样…...

go中的函数

demo1:函数的几种定义方式 package mainimport ("errors""fmt" )/* 函数的用法 跟其他语言的区别:支持多个返回值*///函数定义方法1 func add(a, b int) int {return a b }//函数定义方法2 func add2(a, b int) (sun int) {sun a breturn s…...

小试 InsCode AI 创作助手

个人理解: 自ChatGPT新版现世,一直被视面替代人工工作的世大挑战,各类人工智能语言生成工目层出不穷,也在不断影响着我们日常的工作和生活 小试CSDN的InsCode AI: - 基本概念查询方便,与个人了解&…...

粉丝经验分享:13:00 开始的面试,13:06 就结束了,问题真是变态

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…...

SASS的@规则

1,import sass扩展了import导入,对于css,import导入在页面加载的时候去下载导入的外部文件,而sass的导入,在编译成css文件的时候就将外部的sass文件导入合并编译成一个css文件。 他支持同时导入多个文件;…...

【C++初阶】模拟实现优先级队列priority_queue

👦个人主页:Weraphael ✍🏻作者简介:目前学习C和算法 ✈️专栏:C航路 🐋 希望大家多多支持,咱一起进步!😁 如果文章对你有帮助的话 欢迎 评论💬 点赞&#x1…...

如何为你的公司选择正确的AIGC解决方案?

如何为你的公司选择正确的AIGC解决方案? 摘要引言词汇解释(详细版本)详细介绍1. 确定需求2. 考虑技术能力3. 评估可行性4. 比较不同供应商 代码快及其注释注意事项知识总结 博主 默语带您 Go to New World. ✍ 个人主页—— 默语 的博客&…...

Windows下将nginx等可执行文件添加为服务

Windows下将nginx等可执行文件添加为服务 为什么将可执行文件添加为服务?将可执行文件添加为服务的步骤步骤 1:下载和安装 Nginx步骤 2:添加为服务方法一:使用 Windows 自带的 sc 命令方法二:使用 NSSM(Non…...

视觉SLAM14讲笔记-第4讲-李群与李代数

李代数的引出: 在优化问题中去解一个旋转矩阵,可能会有一些阻碍,因为它对加法导数不是很友好(旋转矩阵加上一个微小偏移量可能就不是一个旋转矩阵),因为旋转矩阵本身还有一些约束条件,那样再求…...

浅析Redis(1)

一.Redis的含义 Redis可以用来作数据库,缓存,流引擎,消息队列。redis只有在分布式系统中才能充分的发挥作用,如果是单机程序,直接通过变量来存储数据是更优的选择。那我们知道进程之间是有隔离性的,那么re…...

【每日一题】2337. 移动片段得到字符串

【每日一题】2337. 移动片段得到字符串 2337. 移动片段得到字符串题目描述解题思路 2337. 移动片段得到字符串 题目描述 给你两个字符串 start 和 target ,长度均为 n 。每个字符串 仅 由字符 ‘L’、‘R’ 和 ‘_’ 组成,其中: 字符 ‘L’…...

MySQL 数据库常用命令大全(详细)

文章目录 1. MySQL命令2. MySQL基础命令3. MySQL命令简介4. MySQL常用命令4.1 MySQL准备篇4.1.1 启动和停止MySQL服务4.1.2 修改MySQL账户密码4.1.3 MySQL的登陆和退出4.1.4 查看MySQL版本 4.2 DDL篇(数据定义)4.2.1 查询数据库4.2.2 创建数据库4.2.3 使…...

中国移动加大布局长三角,打造算力产业新高地

8月27日,以“数实融合算启未来”为主题的2023长三角算力发展大会在苏州举办,大会启动了长三角算力调度枢纽,携手各界推动算力产业高质量发展。 会上,移动云作为第一批算力资源提供方,与苏州市公共算力服务平台签订算力…...

Unity3D中Gfx.WaitForPresent优化方案

前言 在Unity中,Gfx.WaitForPresent占用CPU过高通常表示主线程在等待GPU完成渲染(即CPU被阻塞),这表明存在GPU瓶颈或垂直同步/帧率设置问题。以下是系统的优化方案: 对惹,这里有一个游戏开发交流小组&…...

CentOS下的分布式内存计算Spark环境部署

一、Spark 核心架构与应用场景 1.1 分布式计算引擎的核心优势 Spark 是基于内存的分布式计算框架,相比 MapReduce 具有以下核心优势: 内存计算:数据可常驻内存,迭代计算性能提升 10-100 倍(文档段落:3-79…...

Golang dig框架与GraphQL的完美结合

将 Go 的 Dig 依赖注入框架与 GraphQL 结合使用,可以显著提升应用程序的可维护性、可测试性以及灵活性。 Dig 是一个强大的依赖注入容器,能够帮助开发者更好地管理复杂的依赖关系,而 GraphQL 则是一种用于 API 的查询语言,能够提…...

srs linux

下载编译运行 git clone https:///ossrs/srs.git ./configure --h265on make 编译完成后即可启动SRS # 启动 ./objs/srs -c conf/srs.conf # 查看日志 tail -n 30 -f ./objs/srs.log 开放端口 默认RTMP接收推流端口是1935,SRS管理页面端口是8080,可…...

三体问题详解

从物理学角度,三体问题之所以不稳定,是因为三个天体在万有引力作用下相互作用,形成一个非线性耦合系统。我们可以从牛顿经典力学出发,列出具体的运动方程,并说明为何这个系统本质上是混沌的,无法得到一般解…...

零基础设计模式——行为型模式 - 责任链模式

第四部分:行为型模式 - 责任链模式 (Chain of Responsibility Pattern) 欢迎来到行为型模式的学习!行为型模式关注对象之间的职责分配、算法封装和对象间的交互。我们将学习的第一个行为型模式是责任链模式。 核心思想:使多个对象都有机会处…...

ios苹果系统,js 滑动屏幕、锚定无效

现象:window.addEventListener监听touch无效,划不动屏幕,但是代码逻辑都有执行到。 scrollIntoView也无效。 原因:这是因为 iOS 的触摸事件处理机制和 touch-action: none 的设置有关。ios有太多得交互动作,从而会影响…...

Android Bitmap治理全解析:从加载优化到泄漏防控的全生命周期管理

引言 Bitmap(位图)是Android应用内存占用的“头号杀手”。一张1080P(1920x1080)的图片以ARGB_8888格式加载时,内存占用高达8MB(192010804字节)。据统计,超过60%的应用OOM崩溃与Bitm…...

dify打造数据可视化图表

一、概述 在日常工作和学习中,我们经常需要和数据打交道。无论是分析报告、项目展示,还是简单的数据洞察,一个清晰直观的图表,往往能胜过千言万语。 一款能让数据可视化变得超级简单的 MCP Server,由蚂蚁集团 AntV 团队…...

LINUX 69 FTP 客服管理系统 man 5 /etc/vsftpd/vsftpd.conf

FTP 客服管理系统 实现kefu123登录,不允许匿名访问,kefu只能访问/data/kefu目录,不能查看其他目录 创建账号密码 useradd kefu echo 123|passwd -stdin kefu [rootcode caozx26420]# echo 123|passwd --stdin kefu 更改用户 kefu 的密码…...