当前位置: 首页 > news >正文

探寻AI大模型平台之巅——文心千帆

目录

  • 前言
  • 1. 何为文心千帆
  • 2. 核心亮点
    • 2.1 第三方大模型
    • 2.2 Prompt模板
    • 2.3 安全可靠
  • 3. 一站式服务
    • 3.1 数据管理
    • 3.2 数据标注
    • 3.3 数据处理
    • 3.4 数据训练
    • 3.5 模型纳管
      • 3.5.1 模型评估
      • 3.5.2 模型压缩
    • 3.6 服务发布
  • 总结

前言

众多AI大模型不断涌现,一时不知如何挑选,畏惧尝试又期盼适配自身产品。

算法、算力、数据等参数常用于评判的标准。放眼大部分产品,平台所具备的算力、服务企业的能力以及技术的丰富度,文心千帆即为首选,有着文心一言的优质大模型以及主流的第三方开源大模型(预测服务、Prompt工程),庞大的客户量,运维已久的数据量。

技术丰富、一站式服务、生态化建设等成就文心千帆的可视化AI平台,每一次的更新迭代可以说都带来诸多亮点,这一次带来了两大亮点:

  • 第三方大模型:支持更多主流的开源大模型,目前达到33个(此次迭代新增Llama2模型,后续融入更多开源大模型)。
  • prompt模板库:帮助开发者更好的调用,称得上国内最多最全的模板库。

通过文心千帆服务体验申请的官网地址申请公测权限,填写基本信息之后,工作人员会在三小时内进行审核。
在这里插入图片描述

1. 何为文心千帆

文心千帆大模型平台是面向企业开发者的一站式大模型开发及服务运行平台。数据管理、自动化模型SFT以及推理服务云端部署一站式大模型定制服务,助力各行业的生成式AI应用需求落地。

该平台的功能和生态非常丰富,涵盖了数据管理、模型训练、模型评估等多个方面,这为开发者提供了强大的工具和资源,让更多开发者可以轻松应用大模型技术,专注自身开发的能力。

结合自身经验之谈,谈谈我对文心千帆整体功能的理解:

  • 数据管理:一站式服务,以可视化界面进行展示,让开发者更好的理解其魅力。
  • 模型训练:训练自身的应用场景模型,并根据自身需求和数据特定进行优化。
  • 模型评估:模型评估可让开发者选择合适的模型,模型压缩可让成本和效率都达到优化。
  • 第三方大模型:为开发者提供更多模型选择,根据自身需求构建个性化应用,极大方便开发者的创作需求。

在这里插入图片描述

诸多底层技术的支撑,让训练与推理性能大幅提升,千亿模型分布式并行训练加速能力和算力利用率大幅提升,加快快速应用编排,逐渐变成一个超级系统。

面向不同的企业需求,文心千帆提供不同的功能服务,通过文心一言企业级推理云服务,并进行业务集成。其平台适用于对话沟通、内容创作、分析控制等业务场景,特别是工业级别的场景中,本身百度拥有几十年的搜索引擎,在数据层面的提炼已经精湛高超。

选择的服务不同,AI回复的示例会有所差距,快来体验下吧!!!

场景应用示例(BLOOMZ-7B)
对话沟通在这里插入图片描述
内容创作在这里插入图片描述
分析控制在这里插入图片描述

2. 核心亮点

这一次的更新迭代,可以看到文心千帆的界面增加了一些组件,特别是第三方大模型、Prompt工程。整体一番体验下来,感触非常深,毕竟有大厂先迈出先例,这是为开发者谋福利。

第三方大模型有多种模型种类,且提供多种API接口,涵盖广泛的功能和应用场景,为开发者提供丰富的选择和灵活性,目前已达到33个。

Prompt模板是目前国内最全的模板,拥有103个,覆盖了大部分的场景,这极大降低大模型的门槛。

2.1 第三方大模型

文心千帆提供了一定的大模型种类,涵盖了多种功能和应用场景,针对不同的需求,可以选择相应的API接口来满足任务的要求。每种接口在可视化的平台都有相应的注释说明,极大降低开发者门槛。

结合自身的经验,给出主流的API接口应用场景:

  • ERNIE-BotERNIE-Bot-turbo:覆盖海量中文数据,具有更强的对话问答、内容创作生成等能力。ERNIE-Bot-turbo有更高的响应速度,可应用在实时性比较高的应用场景。
  • BLOOMZ-7B:支持多语言,广泛应用于跨语言的文本处理任务。
  • Embedding-V1:适用于文本搜索、信息推荐、知识挖掘等场景。
  • Prompt:模板包含多种任务和应用场景,对于开发者来说可以获得有价值的资源(文心千帆的一大亮点!)。
  • Llama2:适用于编码、推理应用场景,目前也延伸出比较多的版本(Llama-2-7b-chat为高性能版本,Llama-2-13b-chat为性能与效果均衡版本,Llama-2-70b-chat为高精度效果版本)。

在这里插入图片描述

为了测试其接口的有效性,服务是否鉴权。简单做了一个小测试,在左侧栏目创建应用之后,通过API接口进行调用,获取对应的access_token。调用接口的示例代码,平台也为开发者一键提供示例:示例代码。

平台的扩展性极强,不仅支持定制模型接口,而且接口调用成功之后,其代码终端会有显示调用结果,其可视化界面有每个接口被调用的次数。这让更多开发者只需专注自身的开发功能,而不用在意大模型平台的功能。
在这里插入图片描述

单看这一次的更新,增添了Llama2模型与API接口,可见文心千帆平台的快速更新迭代,逐渐支持更多第三方主流开源大模型,这是一个非常值得关注的点,为开发者提供更多的关注和挑战,有助于推动AI技术的发展和应用。

其大模型的种类涵盖对话问答、内容创作、多语言处理、文本搜索和知识挖掘等多个领域,更好的为数据进行训练。再者通过对这些接口的灵活应用,开发者可以实现各种AI应用需求的落地和创新。

2.2 Prompt模板

之所以说Prompt模板是文心千帆的一大亮点,是因为他拥有国内最多最全的Prompt模板,且种类齐全。我们都知道在自然语言生成(NLG)任务中,更优质、更准确的Prompt能够帮助模型生成更具连贯性和准确性的文本。这足以证明文心千帆在这一方面花了很大的功夫。

大模型会基于prompt所提供的信息,生成对应的文本或者图片。
在这里插入图片描述

之后通过左侧栏目的在线测试调用Prompt模板,检验其是否可靠正确。
在这里插入图片描述

为了做一个简单的对比,将没有Prompt模板与Prompt模板的生成内容进行比较,发现有Prompt模板生成的token数据,逻辑流畅,有理有据,而没有Prompt模板的言简意赅甚至过于简易。


无Prompt模板(使用BLOOMZ-7B)使用Prompt模板
示例图在这里插入图片描述在这里插入图片描述

我们深度剖析该Prompt模板的内容。

我希望你充当一个电影评论家。你将编写一篇引人入胜和有创意的影评。你可以涵盖诸如情节、主题和基调、演技和角色、方向、配乐、电影摄影、制作设计、特效、剪辑、节奏、对话等主题。但最重要的方面是强调电影给你的感觉。什么是真正引起你的共鸣。你也可以对电影进行批评。请避免剧透。电影名称是{content}

证实Prompt模板均符合如下特征:

  1. 正确的语法、用词以及标点。
  2. 避免歧义,简洁易懂。
  3. 拥有更完整的信息。

总的来说,其Prompt模板拥有如下功能:

  • 支持定义模板后在在线服务-在线测试器中快速使用
  • 通过Prompt模板的云服务调用获取模板

单看可视化界面,整体排版格局清爽,以标签的方式进行搜索,也可以名称的方式搜索,这极大降低AI入门槛。

2.3 安全可靠

该平台在安全方面采取多种措施,提供丰富的功能性和灵活性,对于开发者来说这是一个值得信赖的平台。同时,安全措施本身为客户和开发者提供安全可信的体验。

其多重保障主要通过文心一言企业级服务、百度智能云安全控制机制以及文心底层内容安全功能。(对推理内容进行审核与敏感词过滤,确保安全可信。)

  • 完善的鉴权与流控安全机制:预防未授权的访问和防范滥用。
  • 自带敏感词过滤、增强审核安全:过滤不当内容,确保内容的质量和安全性。

在这里插入图片描述

3. 一站式服务

百度文心大平台的完整流程包括数据导入、数据标注、训练配置、模型纳管、服务发布以及在线测试。可视化的界面以及组件很好的诠释零门槛入门AI,从零开始构建数据集、模型训练以及部署。

为了将其整套流程串通,创建属于自身的数据集并进行模型训练,以下步骤中融入了自身的体会。

3.1 数据管理

通过如下界面创建自身的数据集,针对每种数据集,可视化平台都加上注释,方便更多零门槛的人员步入这个平台。该数据集有两种标注类型,分别为文本对话以及query问题集。
在这里插入图片描述

注意事项:如果当前数据小于32条,无法启动训练,可视化界面会进行提示,可通过数据补充或者数据处理。

在这里插入图片描述

整体一番体验下来,无标注的信息支持多种数据格式,平台的设计达到人性化。

3.2 数据标注

可视化平台进行在线标注以及修改标注,可以说很人性化,无需在专门的格式文件修改再二次上传,这不仅方便开发者,也足以说明该平台的超级系统。

在这里插入图片描述

3.3 数据处理

数据清洗和数据增强是非常主要的步骤,极大影响开发者的内容创作。

我们先看平台对于这两功能的可视化界面:

  • 数据清洗:提升内容质量,降低噪音干扰,增强数据的适应性,也提高模型的泛化性。
    在这里插入图片描述
  • 数据增强:对数据集进行扩充,提高模型的泛化能力。
    在这里插入图片描述

总的来说,平台对内容创作的数据处理考虑很周全。后续开发者也可反馈需要处理的选项,这也是开发者与平台的双向增益。

3.4 数据训练

文心千帆为开发者提供了强大的工具和资源,合理利用平台的资源可以充分发挥该模型以及数据的优势,为自身的创作内容带来极大的助力。单看其可视化界面可以看到选项以及功能都非常丰富。

发布成功数据之后,通过平台提供的预训练大模型进行配置参数。创建任务并调整训练配置,其中各个参数都在可视化的界面中进行注释,这极大降低AI开发门槛。
在这里插入图片描述

我们都知道模型的训练,训练集和测试集都有一定的比例分配。在可视化的平台中,只需配置数据的来源以及比例,平台即可一键分配。

比如如下界面,设置比例20,则表示选定数据集版本总数的80%作为训练集,20%作为验证集。
在这里插入图片描述

使用SFT进行训练,训练结束之后可看到模型的评估报告以及训练日志。
在这里插入图片描述

模型调优之后,可将模型进行发布。
在这里插入图片描述

总的来说,整体界面功能组件都很齐全,完美适配大模型的训练、多领域的应用,多语言的支持。作为大平台模型训练,后续模型的更新迭代,极大适应不断变化的市场需求和技术发展。

3.5 模型纳管

模型仓库中的模型评估、模型压缩为开发者提供了一套完整的模型管理工具,有利于优化模型的性能和效果,并支持模型的迭代和优化。

可以看到如下界面,每个模型都可新增版本进行管理,其任务列表中展示了模型不同版本、各类任务的记录。
在这里插入图片描述

3.5.1 模型评估

模型评估可以帮助开发者了解生成的大模型性能表现,支持模型之间的对比和选择,提高内容创作和服务的质量。(目前文心千帆仅支持对基础模型为BLOOMZ-7B的模型进行评估,后续会持续更新)。
在这里插入图片描述

在该平台中,需要注意的是,模型评估的时间和数据集量是成正比的,虽然模型评估时间会随着数据集增加而增加,但较小的数据集会导致模型评估报告失效,因为无法反映模型的真实性能。
在这里插入图片描述

在图例下方还有错例分析,展示BLUE-4指标较低的样本,以便用户针对性分析和迭代模型。
为避免对页面性能造成影响,每个模型最多展示2000条错例样本。
在这里插入图片描述

总的来说,模型评估的结果,可以让开发者更好的优化和不断提升自已的模型和内容创作,其错例分析也是非常不错的功能,让开发者了解模型的不足和局限性,以此不断改进模型提高自身的能力。

3.5.2 模型压缩

模型压缩通过量化压缩等工具提升大模型的推理速度(当前仅支持对基础模型为BLOOMZ-7B的模型进行压缩,后续会持续更新)。
在这里插入图片描述

总的来说,可以更好的应对大规模数据和实时服务需求,通过选择合适的源模型和压缩策略,更好的优化其模型。

3.6 服务发布

将训练完成的模型部署在百度云服务器,实现高效的预测服务。开发者通过云服务器接口轻松调用模型,快速响应用户需求(目前仅支持私有资源池,后续会开放公共资源池)。

对于计费的项目,购买时间越长,可以购买的算力资源也就越多,意味着QPS可以申请的越高。

在这里插入图片描述

发布成功的服务之后可通过可视化界面管理,通过上线、下线以及指定版本进行操作。甚至数据发布之后,可能个别回答不满意需要调整,这时需要用到数据回流,其数据回流的循环迭代方式有助于持续改进和优化模型。
在这里插入图片描述

总的来说,可视化界面管理和数据回流为开发者提供了强大的工具和方法来管理和优化预测服务。

总结

文心千帆一站式大模型定制服务在AI应用领域中提供了丰富的功能和优势。这对于开发者来说,有很大的吸引力。整体一番体验下来,可视化界面组件分类清晰,大部分功能都增加上注释,方便零门槛的AI开发者。

丰富的技术支持、完整的服务内容和强大的生态建设。其提供的Prompt模板为开发者提供了更多的灵活性和创作能力,助力各行各业的生成式AI应用需求落地。作为AI开发者来说,文心千帆这个平台非常有吸引力,值得选择,将开发者与平台与时俱进双向发展,极大促进AI技术的应用和发展。

相关文章:

探寻AI大模型平台之巅——文心千帆

目录 前言1. 何为文心千帆2. 核心亮点2.1 第三方大模型2.2 Prompt模板2.3 安全可靠 3. 一站式服务3.1 数据管理3.2 数据标注3.3 数据处理3.4 数据训练3.5 模型纳管3.5.1 模型评估3.5.2 模型压缩 3.6 服务发布 总结 前言 众多AI大模型不断涌现,一时不知如何挑选&…...

【springboot】RestTemplate配置HttpClient连接池

在Java开发中,访问第三方HTTP协议的网络接口,通常使用的连接工具为JDK自带的HttpURLConnection、HttpClient(现在应该称之为HttpComponents)和OKHttp。 这些Http连接工具,使用起来都比较复杂,如果项目中使…...

MySQL内置函数使用说明

MySQL函数使用说明 MySQL 是一个流行的关系型数据库管理系统,它提供了许多内置函数来处理和操作数据。这些函数可以简化数据库查询和操作的过程,提高代码的可读性和效率。以下是一些常见的 MySQL 内置函数及其使用说明和示例。 数值函数 ABS() 函数原…...

java后端富文本转word,再传递到浏览器下载。

思路参考,以及所有的工具类都使用了》牧羊人大佬的代码《 有帮助的话不用给到我点赞,给大佬点赞即可 这是前端代码,必须使用get。 post后端返回的流浏览器接收不到(具体原因不详)。get无法传递requestBody,…...

【动态规划算法】-回文串问题题型(34-40题)

💖作者:小树苗渴望变成参天大树🎈 🎉作者宣言:认真写好每一篇博客💤 🎊作者gitee:gitee✨ 💞作者专栏:C语言,数据结构初阶,Linux,C 动态规划算法🎄 如 果 你 …...

STM32基础回顾

文章目录 单片机编程的原理GPIO中断EXTI外部中断定时器中断、串口中断 定时器定时器中断配置过程通用定时器输出比较功能:PWM波的生成定时器的输入捕获功能主从触发模式PWMI模式 定时器的编码器接口 DMA简介通信接口USART软件配置流程:1、仅发数据的配置…...

如何解决电脑无声问题:排除故障的几种常见方法

大家好,今天我们来讨论一下处理电脑没有声音的故障。当你突然发现电脑静音无声时,需要逐步排除可能的问题,但总体而言,声音故障是相对容易解决的。接下来,我们将介绍一些排除电脑无声问题的方法。 第一步:…...

Apache RocketMQ 命令注入

漏洞简介 RocketMQ 5.1.0及以下版本,在一定条件下,存在远程命令执行风险。RocketMQ的NameServer、Broker、Controller等多个组件外网泄露,缺乏权限验证,攻击者可以利用该漏洞利用更新配置功能以RocketMQ运行的系统用户身份执行命令…...

二、搜索与图论6:Dijkstra 模板题+算法模板(Dijkstra求最短路 I, Dijkstra求最短路 II,1003 Emergency)

文章目录 算法模板Dijkstra题目代码模板朴素dijkstra算法堆优化版dijkstra 树与图的存储(1) 邻接矩阵:(2) 邻接表:关于e[],ne[],h[]的理解 关于堆的原理与操作 模板题Dijkstra求最短路 I原题链接题目思路题解 Dijkstra求最短路 II原题链接题目思路题解 1…...

ROS2学习(四)进程,线程与节点的关系

节点与节点执行器 节点,英文是node,在ROS2中,节点是一个抽象的实体,它可以代表某种或某类特定功能的抽象集合体,它可以存在于进程中,也可以存在于线程中。所有ROS2的基础功能最基础的载体是节点,所有的通信…...

【物联网】DMA传输原理与实现详解(超详细)

DMA(Direct Memory Access,直接内存访问)是一种计算机数据传输方式,允许外围设备直接访问系统内存,而无需CPU的干预。 文章目录 Part 1: DMA的工作原理配置阶段:数据传输阶段: Part 2: DMA数据…...

Java类集框架(二)

目录 1.Map(常用子类 HashMap,LinkedHashMap,HashTable,TreeMap) 2.Map的输出(Map.Entry,iterator,foreach) 3.数据结构 - 栈(Stack) 4.数据结构 - 队列(Q…...

爬虫008_流程控制语句_if_if else_elif_for---python工作笔记026

然后我们再来看一下这里的,判断,可以看到 再看一个判断,这里的布尔类型 第二行有4个空格,python的格式 注意这里,输入的age是字符串,需要转一下才行 int可以写到int(intput("阿斯顿法师打发地方")) 这样也可以...

【随笔】五周年创作纪念日

今天收到了 CSDN 的创作五周年提示,正好前几天(7.31)我也成功申请了 CSDN 博客专家,趁这个机会分享一下这几年写博客的感受吧 机缘 关注我比较久的读者应该知道我是从学传统工科半路出家搞计算机的,这里的经历还是比…...

7_分类算法—逻辑回归

文章目录 逻辑回归:1 Logistic回归(二分类问题)1.1 sigmoid函数1.2 Logistic回归及似然函数(求解)1.3 θ参数求解1.4 Logistic回归损失函数1.5 LogisticRegression总结 2 Softmax回归(多分类问题&#xff0…...

【计算机网络】应用层协议 -- DNS协议

文章目录 1. DNS背景2. 域名简介3. 域名解析过程4. 使用dig查看DNS过程 1. DNS背景 DNS(Domain Name System,域名系统)协议,是一个用来将域名转化为IP地址的应用层协议。 TCP/IP当中通过IP地址和端口号的方式,来确定…...

ES6 - 数组新增的一些常用方法

文章目录 1,Array.from()2,Array.of()3,find(),findIndex(),findLast()和findLastIndex()4,Array.fill()5,keys(),values() 和 entries()6,Array.includes()7&#xff0c…...

【BEV感知】3-BEV开源数据集

3-BEV开源数据集 1 KITTI1.1 KITTI数据怎么采集?1.2 KITTI数据规模有多大?1.3 KITTI标注了哪些目标?1.4 转换矩阵1.5 标签文件 2 nuScenes2.1 nuScenes Vs KITTI2.2 标注文件 1 KITTI KITTI 1.1 KITTI数据怎么采集? 通过车载相机、激光雷达等传感器采集。 只提供了相机正…...

Kafka-Broker工作流程

kafka集群在启动时,会将每个broker节点注册到zookeeper中,每个broker节点都有一个controller,哪个controller先在zookeeper中注册,哪个controller就负责监听brokers节点变化,当有分区的leader挂掉时,contro…...

第八篇-Tesla P40+ChatGLM2+LoRA

部署环境 系统:CentOS-7CPU: 14C28T显卡:Tesla P40 24G驱动: 515CUDA: 11.7cuDNN: 8.9.2.26目的 验证P40部署可行性,只做验证学习lora方式微调创建环境 conda create --name glm-tuning python3.10 conda activate glm-tuning克隆项目 git clone http…...

调用feign返回错误的数据

bug描述&#xff1a; 在一个请求方法中会调用到feign去获取其他的数据。 List<Demo> list aaaFeignApi.getData(personSelectGetParam);在调用的时候&#xff0c;打断点到feign的地方&#xff0c;数据是存在的&#xff0c;并且有15条。但是返回到上面代码的时候数据就…...

【Spring】(二)从零开始的 Spring 项目搭建与使用

文章目录 前言一、Spring 项目的创建1.1 创建 Maven 项目1.2 添加 Spring 框架支持1.3 添加启动类 二、储存 Bean 对象2.1 创建 Bean2.1 将 Bean 注册到 Spring 容器 三、获取并使用 Bean 对象3.1 获取Spring 上下文3.2 ApplicationContext 和 BeanFactory 的区别3.3 获取指定的…...

redis五种数据类型介绍

、string&#xff08;字符串&#xff09; 它师最基本的类型&#xff0c;可以理解为Memcached一模一样的类型&#xff0c;一个key对应一个value。 注意&#xff1a;一个键最大能存储 512MB。 特性&#xff1a;可以包含任何数据,比如jpg图片或者序列化的对象,一个键最大能存储512…...

【JavaEE】Spring Boot - 项目的创建和使用

【JavaEE】Spring Boot 开发要点总结&#xff08;1&#xff09; 文章目录 【JavaEE】Spring Boot 开发要点总结&#xff08;1&#xff09;1. Spring Boot 的优点2. Spring Boot 项目创建2.1 下载安装插件2.2 创建项目过程2.3 加载项目2.4 启动项目2.5 删除一些没用的文件 3. Sp…...

Git reset、revert用法

reset reset是删除之前的提交记录&#xff0c;所有的提交点都会被清除&#xff0c;我们看下执行前后的git log区别 D:\workspace\android>git log commit 87c1277a57544c53c603b04110e3dde100da8f57 (HEAD -> develop_main) Author: test <test.com> Date: Wed…...

Redis-1

Redis 理论部分 redis 速度快的原因 1、纯内存操作 2、单线程操作&#xff0c;避免了频繁的上下文切换和资源争用问题&#xff0c;多线程需要占用更多的 CPU 资源 3、采用了非阻塞 I/O 多路复用机制 4、提供了非常高效的数据结构&#xff0c;例如双向链表、压缩页表和跳跃…...

【Linux】Linux服务器连接百度网盘:实现上传下载

【Linux】Linux服务器连接百度网盘&#xff1a;实现上传下载 文章目录 【Linux】Linux服务器连接百度网盘&#xff1a;实现上传下载1. 前言2. 具体过程2.1 pip 安装所需包2.2 认证&#xff08;第一次连接需要认证&#xff09;2.3 下载所需文件或者目录2.4 其他指令使用2.5 注意…...

ADC模拟看门狗

如果被ADC转换的模拟电压低于低阀值或高于高阀值&#xff0c;AWD模拟看门狗状态位被设置。阀值位 于ADC_HTR和ADC_LTR寄存器的最低12个有效位中。通过设置ADC_CR1寄存器的AWDIE位 以允许产生相应中断。通过以下函数可以进行配置 void ADC_AnalogWatchdogCmd(ADC_TypeDef* ADCx…...

google谷歌gmail邮箱账号注册手机号无法进行验证怎么办?此电话号码无法用于进行验证 或 此电话号码验证次数太多

谷歌gmail邮箱账号注册手机号无法进行验证怎么办? 使用手机号码注册谷歌gmail邮箱账号时会遇到&#xff1a;此电话号码无法用于进行验证 或 此电话号码验证次数太多。造成注册google谷歌gmail邮箱账号受阻&#xff0c;无法正常完成注册。 谷歌Gmail邮箱账号正确的注册方法与教…...

Spring:IOC技术、Bean、DI

前言 Spring是一个开源的项目&#xff0c;并不是单单的一个技术&#xff0c;发展至今已形成一种开发生态圈。也就是说我们可以完全使用Spring技术完成整个项目的构建、设计与开发。Spring是一个基于IOC和AOP的架构多层j2ee系统的架构。 SpringFramework&#xff1a;Spring框架…...