当前位置: 首页 > news >正文

企业用大模型如何更具「效价比」?百度智能云发布5款大模型新品

服务8万企业用户,累计帮助用户精调1.3万个大模型,帮助用户开发出16万个大模型应用,自2023年12月以来百度智能云千帆大模型平台API日调用量环比增长97%...从一年前国内大模型平台的“开路先锋”到如今的大模型“超级工厂”,百度智能云千帆大模型平台在国内大模型市场牢牢占据着领先身位,但奔跑的脚步却并未停歇。

3月21日,百度智能云在北京首钢园召开千帆产品发布会,百度智能云在大会期间宣布:

1、携手北京市石景山区,共建全国首个百度智能云千帆大模型产业创新基地,助推区域产业腾飞;

2、满足企业“效价比”核心诉求,千帆ModelBuilder大模型服务全面升级,3个轻量级大模型、2个垂直场景大模型全新发布;

3、大幅降低AI原生应用开发门槛,千帆AppBuilder组件能力全面升级。

百度智能云千帆大模型产业(北京)创新基地启动建设

活动中,石景山区政府党组成员、副区长曹世辉,中关村石景山园管委会副主任崔明明,百度副总裁谢广军,百度副总裁石清华共同启动全国首个百度智能云干帆大模型产业(北京)创新基地。

创新基地致力于推动大模型技术与产业创新深度融合,双方将围绕提升算力供给、优化模型算法、推动数据开放、打造示范场景、深化人才引育等方面深耕厚植,政企合力打造人工智能产业新高地。曹世辉副区长表示,石景山区将与百度携手共进,聚焦人工智能和大模型技术研发和创新应用,构建完善AI 产业生态,为区域数字化转型和产业智能化升级提供支撑,为新质生产力的培育和发展注入澎湃动能。

百度副总裁谢广军

2023年,大模型在全球范围呈现出爆发式增长,国内更是打起了“百模大战”,无数科技大厂与科研院所聚焦大模型“本体”,疯狂“内卷”。

百度副总裁谢广军表示,大模型技术在过去一年飞速发展,随着逐步落地千行百业,2024年将成为国内大模型产业应用爆发的元年。针对企业最关心的大模型落地场景、使用成本、应用开发、应用效果四大挑战,百度智能云千帆在大模型、AI原生应用开发两个方面给出了最新“解题思路”。

百度智能云千帆大模型平台发布“3+2”新模型套餐:

提高企业应用大模型的“效价比”

大模型效果是“技术派”的不懈追求,而经济效益则是“市场派”的终极目标。谢广军在与诸多行业客户的交流中发现,除了极少的大客户对大模型有极致的效果追求,更多的企业和机构往往要综合考量大模型的使用效果、性能以及成本,即“效价比”。本次,千帆平台的模型矩阵针对企业的“效价比”核心诉求进行了一系列升级。

百度智能云千帆大模型平台模型矩阵

文心大模型ERNIE 3.5是目前百度智能云千帆大模型平台上最受欢迎的基础大模型之一。针对用户的常见通用的对话场景,ERNIE 3.5 在指令遵循、上下文学习和逻辑推理能力三方面分别进行了能力增强。升级后的ERNIE 3.5在企业应用场景如文案创作、信息抽取和工具调用三大场景中,应用表现分别大幅提升24%、27%和22%。

其次,相比超大规模参数的大模型,轻量级大模型的参数量更小,更便于客户针对特定使用场景进行模型精调,更容易达成使用效果预期,同时节约更多成本开销。本次大会,百度智能云发布了包括ERNIE Speed、ERNIE Lite、ERNIE Tiny在内,参数量由大到小的三款轻量级大模型,帮助客户实现“减量不减效”,节约不必要投资。

具体来讲,ERNIE Speed作为三款轻量级大模型中的“大个子”,推理场景下拥有最高128k的上下文长度,在处理知识问答等任务时,能够更好的处理上下文的依赖关系,生成更加连贯和准确的预测或回答。同时,针对特定场景可以将ERNIE Speed作为基座模型进行精调,模型效果可以追平甚至超过旗舰级大参数规模大模型,效价比大幅提升。

相比ERNIE Speed,ERNIE Lite的参数量则更小,也更加适合搭载在低算力的AI加速卡上处理推理任务,在兼顾模型效果与推理性能的同时,大幅降低客户落地应用成本。作为ERNIE-Bot-turbo模型的升级版,ERNIE Lite在情感分析、多任务学习、自然推理等场景下的应用效果提升了20%。推理调用成本大幅下降了53%!

三款轻量级模型中参数量最小的ERNIE Tiny则为客户提供了极致低成本、低延迟的最佳选择。在检索、推荐、意图识别等高并发、低延时等应用场景中,ERNIE Tiny的优异性能呈现了不俗表现。在某对话推荐业务场景中,精调后的ERNIE Tiny在搜索引擎推荐词激发环节,相比ERNIE 3.5,对话轮次增长了3.5%,成本下降了32%。

此外,企业在落地应用中,对大模型在人物扮演、外部工具调用均有更高的效果要求。本次千帆大模型平台ModelBuilder还基于对企业场景的深入洞察,结合百度自身业务最佳实践沉淀,推出了ERNIE Character和ERNIE Functions两款垂直场景大模型,分别适配客户在角色扮演类应用场景(如游戏NPC、客服对话等)和工具调用场景(对话中使用外部工具、调用业务函数等)中的使用需求。

在企业实践中,某智能硬件厂商,基于ERNIE Character打造智能助理,应用该模型后在人设一致性、激发并提升用户聊天欲望等方面效果显著提升。某旅游出行类APP,使用ERNIE Functions打造智能客服助手,在执行订票、查询航班状态等多种function调用上准确性达到85%。

千帆AppBuilder全面升级:

大幅降低AI原生应用开发门槛

千帆AppBuilder作为产业级AI原生应用开发平台,是千帆的重要组成部分。AppBuilder底层由基于百度多年技术和实践经验沉淀的大模型组件、AI能力组件的基础组件和面向典型应用场景深入调优建设的一系列高级组件构成。基础组件与高级组件共同支撑Agent,一方面可以通过工作流编排实现更为复杂的业务逻辑,另一方面Agent也具备强大的自主任务规划能力,能够理解用户意图自动规划执行路径,实现多工具的自动编排和执行。这些能力通过零代码态、代码态两类开发方式提供服务,更好的匹配不同开发者的使用需求。

开发完成后,应用可多渠道分发与集成,AppBuilder支持将应用一键分发到微信客服、微信公众号、Web端/H5及百度灵境矩阵等主流渠道。基于百度灵境矩阵,应用可在百度搜索、百度信息流等主流场景分发与挂载。真正实现应用开发出来后,就直接触达用户,打通从AI原生应用创建到开发再到分发的全流程。

百度智能云千帆AppBuilder

升级后的AppBuilder开放的工具组件多达55个。包括基于百度多年技术积累和自有业务沉淀的大模型组件、AI能力组件,也包括搜索等百度特色的业务组件、和多场景的第三方API工具,另外还提供了 RAG(知识检索问答)、GBI(生成式数据分析)等根据典型应用场景深入调优的高级能力组件。

开发AI原生应用离不开云基础设施,本次发布的基础组件还包括了百度智能云全新推出的向量数据库VDB 1.0。向量数据库是企业不可或缺的知识库核心组件,它针对传统知识库问答系统遇到的性能瓶颈、维护挑战及规模限制等问题提供了有力解决方案。全新发布的百度向量数据库VDB 1.0,不仅集成了全面的运维控制和安全防护能力,还兼容了千帆、LangChain等主流生态系统,能够帮助企业轻松管理数以千万计的文档知识,最大支持百亿向量存储规模以及毫秒级的向量检索速度。同时,相比同类型开源产品,VDB 1.0性能最高提升10倍。

在组件之上,千帆AppBuilder推出的Agent(智能体)应用框架,具备精准的任务自主规划能力,对多种应用工具的自动编排准确率超过90%,这个数字还在不断提升。AppBuilder还支持开发者接入自定义工具,通过将自动编排与手动编排相结合,实现更复杂场景应用的需求定制。Agent框架内的代码解释器能力,也在本次升级中大幅提升了40%的性能、在复杂的数据分析场景的生成结果可接受度高达95%,轻松应对各类数据分析与信息处理的场景。

此外,AppBuilder的代码态开发工具也再添利器。AppBuilder SDK本次重磅发布了Agent API,支持开发者将Agent便捷集成到自己的业务系统中,同时AppBuilder SDK面向主流AI原生应用场景提供了丰富的应用样例,目前已在Github开源,支持各个组件自由调用的灵活编排,帮助开发者实现应用的二次开发和便捷集成。

大会现场,还演示了如何在零代码开发模式中,只用1分钟构建一个“英语作文小帮手”Agent(智能体)应用,只需在AppBuilder中输入应用名称或希望开发的应用功能,平台就可以自动生成应用,通过简单的调整角色指令、添加所需工具组件,就可以快速生成一个英语作文批改小助手。发布后就可直接使用,三步完成应用创建与分发。

1分钟创建英语作文批改小助手

在百度智能云看来,随着大模型技术的不断演进和突破,工程化实践与用户需求适配正在变得愈发重要。只有深入场景,发掘、响应客户的真实需求,才是释放创新技术红利的最佳路径。

相关文章:

企业用大模型如何更具「效价比」?百度智能云发布5款大模型新品

服务8万企业用户,累计帮助用户精调1.3万个大模型,帮助用户开发出16万个大模型应用,自2023年12月以来百度智能云千帆大模型平台API日调用量环比增长97%...从一年前国内大模型平台的“开路先锋”到如今的大模型“超级工厂”,百度智能…...

linux 外部GPIO Watchdog驱动适配

前言 文章描述, 利用外部gpio看门狗芯片驱动芯片的复位功能。 芯片:RK3568 平台: Linux ubuntu.lan 4.19.232 #27 SMP Sat Sep 23 13:43:49 CST 2023 aarch64 aarch64 aarch64 GNU/Linux 硬件接线图示 看门狗芯片采用GPIO喂狗,W…...

活动回顾 | 走进华为向深问路,交流数智办公新体验

3月20日下午,“企业数智办公之走进华为”交流活动在华为上海研究所成功举办。此次活动由上海恒驰信息系统有限公司主办,华为云计算技术有限公司和上海利唐信息科技有限公司协办,旨在通过对企业数字差旅和HR数智化解决方案的交流,探…...

【Java】Oracle发布Java22最新版本

甲骨文(ORACLE)已经于2023年3月19日正式发布了最新版本的JDK,版本号:22 根据官方声明,Java 22 (Oracle JDK 22) 在性能、稳定性和安全性方面进行了数千种改进,包括对Java 语言、其API 和性能,以…...

Vue reactive函数的使用

let searchForm reactive({}); let data reactive({ isAdmin: true, isshowAccount: true }); reactive 是什么? reactive 是 Vue 3 Composition API 中的一个函数,用于创建一个包含响应式数据的对象。在 Vue 2.x 中,我们通常使用 data 选项…...

unity自动引用生成

using System; using System.Collections.Generic; using System.IO; using System.Linq; using System.Text; using UnityEditor; using UnityEngine; using UnityEngine.UI;/// <summary> /// 模板脚本生成 /// </summary> public class ScriptCreater : EditorW…...

【Linux系统】线程互斥与同步

目录 一.几个概念 二.线程互斥 1.定义并初始化锁 2.加锁 3.解锁 4.销毁锁 三.互斥锁的本质 1.xchg的原子性 2.加锁的过程 3.解锁的过程 四.可重入VS线程安全 五.死锁 1.死锁的概念 2.具体实例 3.死锁产生的四个必要条件 4.解决或避免死锁 六.线程同步 七.…...

武汉星起航引领跨境电商新潮流,深耕亚马逊打造全方位合作新模式

在全球化的浪潮下&#xff0c;跨境电商已成为连接各国市场的重要桥梁&#xff0c;为无数企业带来了前所未有的发展机遇。在这一领域&#xff0c;武汉星起航电子商务有限公司以其独特的战略眼光和实战经验&#xff0c;成为引领行业发展的佼佼者。公司自2017年起便深耕亚马逊平台…...

GateWay路由规则

Spring Cloud GateWay 帮我们内置了很多 Predicates功能&#xff0c;实现了各种路由匹配规 则&#xff08;通过 Header、请求参数等作为条件&#xff09;匹配到对应的路由 1 时间点后匹配 server:port: 8888 spring:application:name: gateway-servicecloud:nacos:discovery:…...

shell脚本基础改造

一、基础的shell脚本格式 #!/bin/bash 2 #3 #********************************************************************4 #Author: LJH5 #QQ: 2…...

静态综合实验

一&#xff0c;1.搭建拓扑结构并启动。 2.根据题意得该图需要14个网段&#xff0c;根据192.168.1.0/24划分子网段&#xff0c;如下&#xff1a; 划分完如图所示&#xff1a; 二、配置IP地址 R1路由器&#xff1a; 1.进入系统视图并改名. 2.接口配置IP地址&#xff1a…...

Spring Web MVC入门(6)

应用分层 在开发的过程中, 我们会发现, 程序的代码有时会很"杂乱", 如果后面的项目更大了, 那就会更加地杂乱无章(文件乱, 代码内容乱). 也基于此, 接下来让我们来学习一下应用分层. 也类似于公司的组织架构 公司初创阶段, 一个人身兼数职, 既做财务, 又做人事,还有…...

muduo异步日志

muduo异步日志实现 陈硕老师的muduo网络库的异步日志的实现&#xff0c;今晚有点晚了&#xff0c;我明晚再把这个异步日志抽出来&#xff0c;作为一个独立的日志库。 所在文件 AsyncLogging.cc AsyncLogging.h LogFile.h LogFile.cc CountDownLatch.h CountDownLatch.cc…...

在智慧能源的发展历程中,哪些技术的出现起到了关键性的作用?

智慧能源作为一种全新的能源发展理念&#xff0c;正逐渐成为能源领域的热门话题。在智慧能源的发展历程中&#xff0c;有许多技术的出现起到了关键性的作用&#xff0c;推动了智慧能源的快速发展。 一、物联网技术 物联网技术使得能源设备可以实现互联互通&#xff0c;通过传感…...

SQLiteC/C++接口详细介绍sqlite3_stmt类(十三)

返回&#xff1a;SQLite—系列文章目录 上一篇&#xff1a;SQLiteC/C接口详细介绍sqlite3_stmt类&#xff08;十二&#xff09; 下一篇&#xff1a; 待续 51、sqlite3_stmt_scanstatus_reset sqlite3_stmt_scanstatus_reset 函数用于重置指定语句对象最近一次执行的 WHER…...

扫雷(蓝桥杯,acwing)

题目描述&#xff1a; 扫雷是一种计算机游戏&#xff0c;在 2020 世纪 80 年代开始流行&#xff0c;并且仍然包含在某些版本的 Microsoft Windows 操作系统中。 在这个问题中&#xff0c;你正在一个矩形网格上玩扫雷游戏。 最初网格内的所有单元格都呈未打开状态。 其中 M个…...

macOS 通过 MacPorts 正确安装 MySQL 同时解决无法连接问题

如果你通过 sudo port install 命令正常安装了 MySQL&#xff0c;再通过 sudo port load 命令启动了 MySQL Server&#xff0c;此刻却发现使用 Navicat 之类的 GUI 软件无法连接&#xff0c;始终返回无法连接到 127.0.0.1 服务器。这是一个小坑&#xff0c;因为他默认使用了 So…...

Semi-supervised Open-World Object Detection

Semi-supervised Open-World Object Detection 摘要1 介绍2.准备工作提出的SS-OWOD问题设置2.1 基础架构3 方法3.1整体架构摘要 传统的开放世界对象检测(OWOD)问题设置首先区分已知和未知类别,然后在后续任务中引入标签时逐步学习未知对象。然而,当前的OWOD公式在增量学习…...

C语言实现射击小游戏

以下是一个简单的C语言射击小游戏的实现示例。这个游戏中&#xff0c;玩家控制一个飞船&#xff0c;敌方飞船会随机出现并向玩家移动。如果玩家的飞船与敌方飞船相撞&#xff0c;玩家就失去一条生命&#xff0c;代码如下&#xff1a; #include <stdio.h> #include <s…...

c++11 标准模板(STL)本地化库 - std::islower(std::locale) 检查字符是否被本地环境分类为小写

本地化库 本地环境设施包含字符分类和字符串校对、数值、货币及日期/时间格式化和分析&#xff0c;以及消息取得的国际化支持。本地环境设置控制流 I/O 、正则表达式库和 C 标准库的其他组件的行为。 检查字符是否被本地环境分类为小写 std::islower(std::locale) template&…...

Linux 进程控制(上):创建、终止、等待与程序替换

一. 进程控制概述进程是操作系统中的任务载体&#xff0c;而进程控制则是对其生命周期进行管理的完整机制在之前的博文中&#xff0c;我们已经窥探了进程的属性和地址空间&#xff0c;但进程并不会静止在那里。一个完善的操作系统必须能够解决以下问题&#xff1a;如何高效地克…...

基于非支配排序遗传算法NSGAII的综合能源优化调度附Matlab代码

✅作者简介&#xff1a;热爱科研的Matlab仿真开发者&#xff0c;擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。&#x1f34e; 往期回顾关注个人主页&#xff1a;Matlab科研工作室&#x1f34a;个人信条&#xff1a;格物致知,完整Matlab代码及仿真咨询…...

【GESP】C++二级考试必备:深入解析RAM、ROM与Cache的工作原理与应用场景

1. 计算机存储的基本概念与分类 计算机存储就像我们日常生活中的仓库&#xff0c;用来存放各种数据和程序。想象一下&#xff0c;你有一个大书架&#xff08;硬盘&#xff09;&#xff0c;上面放满了书&#xff08;数据&#xff09;&#xff0c;但每次找书都要花很长时间。于是…...

OV7670图像传感器底层驱动与MCU实时采集实战

1. OV7670图像传感器底层驱动技术详解OV7670是OmniVision公司于2000年代初推出的低功耗、单芯片VGA&#xff08;640480&#xff09;CMOS图像传感器&#xff0c;采用CSP封装&#xff0c;支持RGB565、YUV422、RAW RGB等多种输出格式&#xff0c;内置PLL、自动曝光/白平衡/增益控制…...

ESP32嵌入式Ruby运行时:mruby/c轻量脚本引擎实战

1. 项目概述mrubyc-esp32-arduino是一个面向 ESP32 平台 Arduino Core 的轻量级嵌入式 Ruby 运行时实现&#xff0c;基于mruby/c&#xff08;micro ruby compact&#xff09;—— mruby 的超精简子集&#xff0c;专为资源受限的 MCU 环境设计。该项目并非通用 mruby 移植&#…...

HTML怎么搜索关键词_HTML search类型input特点【说明】

HTML原生search输入框语义明确、自带清空按钮、支持系统级搜索行为及专用软键盘&#xff1b;需用<form>包裹并监听submit/search事件&#xff0c;禁用默认行为&#xff0c;且清空操作仅触发search事件。HTML原生有啥特别的它和普通text输入框渲染几乎一样&#xff0c;但语…...

创业机会:AI Agent Harness Engineering 在垂直专业市场的 7 大爆点

创业机会:AI Agent Harness Engineering 在垂直专业市场的 7 大爆点 1. 引言:AI Agent 时代的到来 在人工智能技术快速发展的今天,我们正站在一个新时代的门槛上。从早期的规则引擎到如今的大语言模型(LLMs),AI技术已经取得了令人瞩目的进步。然而,真正的革命可能在于AI…...

AWS WAF 自定义扫描器 User-Agent 拦截规则:从设计到踩坑的完整实践

通过自定义 Regex Pattern Set 拦截已知扫描器工具的 User-Agent,减少恶意扫描流量。本文记录完整的规则设计、部署、误拦截排查与修复过程,含生产事故复盘。 目录 背景与目标 方案设计 规则创建与部署 效果验证 跨 WebACL 部署与生产事故 事故复盘与修复...

零基础教程:用RetinaFace镜像快速搭建人脸检测与关键点绘制环境

零基础教程&#xff1a;用RetinaFace镜像快速搭建人脸检测与关键点绘制环境 1. 环境准备与快速部署 RetinaFace是目前最先进的人脸检测算法之一&#xff0c;能够同时实现高精度的人脸检测和关键点定位。本教程将带你从零开始&#xff0c;使用预置的RetinaFace镜像快速搭建完整…...

告别Win11反人类设计!用SysWOW64文件夹找回经典任务管理器的完整指南

深入解析Windows 11任务管理器&#xff1a;从系统架构到经典界面还原 每次Windows大版本更新&#xff0c;总有些改动让人措手不及。Windows 11带来的全新任务管理器界面&#xff0c;虽然视觉效果更现代化&#xff0c;但不少资深用户却发现操作效率反而降低了。那些熟悉的快捷键…...