[AI 大模型] 百度 文心一言
文章目录
- [AI 大模型] 百度 文心一言
- 简介
- 模型架构
- 发展
- 新技术和优势
- API 代码示例
[AI 大模型] 百度 文心一言
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0DwAIh0T-1720667576892)(https://i-blog.csdnimg.cn/direct/283919e5d78b4951ba1ade5dcfcb9cea.png#pic_center)]
简介
**百度文心一言(ERNIE Bot)**是百度推出的全新一代知识增强大语言模型,旨在通过与人对话互动、回答问题和协助创作,帮助用户高效便捷地获取信息、知识和灵感。
文心一言融合了数万亿数据和数千亿知识,具备强大的知识增强、检索增强和对话增强能力。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-v3fx7hgi-1720667576896)(https://i-blog.csdnimg.cn/direct/f2ba2c15d0c946a4be823e1200c90025.jpeg#pic_center)]
模型架构
文心一言基于百度的飞桨深度学习平台和文心知识增强大模型,采用了增强的 Transformer 架构。
其核心技术包括:
- 知识增强:通过融合大规模知识图谱,提升模型的知识理解和推理能力。
- 检索增强:结合实时检索技术,确保生成内容的准确性和时效性。
- 对话增强:优化对话生成和理解能力,使模型能够更自然地与用户互动。
此外,文心一言还采用了有监督精调、人类反馈强化学习(RLHF)和提示技术,进一步提升了模型的性能和安全性。
发展
文心一言 的发展历程可以追溯到 2019 年 3 月,百度发布了首个知识增强大模型 ERNIE 1.0。此后,百度不断迭代升级,推出了 ERNIE 2.0、ERNIE 3.0 和 ERNIE 3.5 等版本。
2023 年 3 月,百度正式发布了文心一言,并在 2023 年 8 月全面向公众开放。
截至 2024 年 4 月,文心一言的用户数已超过 2 亿,API 日均调用量突破 2 亿。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-p9IBTePN-1720667576897)(https://i-blog.csdnimg.cn/direct/72ec32ba834b480bb3bebcc3c2d0136e.jpeg#pic_center)]
新技术和优势
- 多模态能力:文心一言能够处理文本、图像、音频等多种数据类型,提供高质量的多模态输出。
- 高效架构:采用增强的 Transformer 和知识图谱技术,使得文心一言在训练和推理过程中更加高效。
- 长上下文理解:文心一言支持长达 30,000 个 token 的上下文窗口,显著提升了模型在长文本处理中的表现。
- 灵活性:文心一言提供了多种尺寸和配置,能够在从数据中心到边缘设备的各种环境中高效运行。
- 广泛应用:文心一言已经被多个行业的企业采用,用于构建自定义生成式 AI 模型,提升了企业的创新能力和竞争优势。
API 代码示例
以下是如何使用文心一言 API 进行开发的示例:
示例 1:文本生成
import requests
import json# 获取 access_token
def get_access_token(api_key, secret_key):url = "https://aip.baidubce.com/oauth/2.0/token"params = {"grant_type": "client_credentials","client_id": api_key,"client_secret": secret_key}response = requests.post(url, params=params)return response.json().get("access_token")# 文本生成请求
def generate_text(prompt, max_tokens, api_key, secret_key):access_token = get_access_token(api_key, secret_key)url = f"https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions?access_token={access_token}"payload = json.dumps({"messages": [{"role": "user", "content": prompt}],"max_tokens": max_tokens})headers = {'Content-Type': 'application/json'}response = requests.post(url, headers=headers, data=payload)return response.json()# 示例调用
api_key = "YOUR_API_KEY"
secret_key = "YOUR_SECRET_KEY"
prompt = "写一篇关于人工智能未来发展的文章。"
response = generate_text(prompt, 150, api_key, secret_key)
print(response['result'])
示例 2:对话生成
import requests
import json# 获取 access_token
def get_access_token(api_key, secret_key):url = "https://aip.baidubce.com/oauth/2.0/token"params = {"grant_type": "client_credentials","client_id": api_key,"client_secret": secret_key}response = requests.post(url, params=params)return response.json().get("access_token")# 对话生成请求
def generate_conversation(messages, api_key, secret_key):access_token = get_access_token(api_key, secret_key)url = f"https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions?access_token={access_token}"payload = json.dumps({"messages": messages})headers = {'Content-Type': 'application/json'}response = requests.post(url, headers=headers, data=payload)return response.json()# 示例调用
api_key = "YOUR_API_KEY"
secret_key = "YOUR_SECRET_KEY"
messages = [{"role": "system", "content": "你是一个乐于助人的助手。"},{"role": "user", "content": "你好!"}
]
response = generate_conversation(messages, api_key, secret_key)
print(response['result'])
示例 3:情感分析
import requests
import json# 获取 access_token
def get_access_token(api_key, secret_key):url = "https://aip.baidubce.com/oauth/2.0/token"params = {"grant_type": "client_credentials","client_id": api_key,"client_secret": secret_key}response = requests.post(url, params=params)return response.json().get("access_token")# 情感分析请求
def analyze_sentiment(text, api_key, secret_key):access_token = get_access_token(api_key, secret_key)url = f"https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions?access_token={access_token}"payload = json.dumps({"messages": [{"role": "user", "content": text}]})headers = {'Content-Type': 'application/json'}response = requests.post(url, headers=headers, data=payload)return response.json()# 示例调用
api_key = "YOUR_API_KEY"
secret_key = "YOUR_SECRET_KEY"
text = "我今天感觉非常开心!"
response = analyze_sentiment(text, api_key, secret_key)
print(response['result'])
百度文心一言的推出标志着 AI 技术的又一次飞跃,为开发者和企业提供了强大的工具,推动了 AI 应用的广泛普及和创新。
相关文章:
[AI 大模型] 百度 文心一言
文章目录 [AI 大模型] 百度 文心一言简介模型架构发展新技术和优势API 代码示例 [AI 大模型] 百度 文心一言 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0DwAIh0T-1720667576892)(https://i-blog.csdnimg.cn/direct/283919e5d78b4951ba1ade5dcfc…...
机器学习开源分子生成系列(2)-基于三维形状和静电相似性的DeepFMPO v3D安装及使用
前言 本文是基于 3D 的分子生成方法DeepFMPO v3D的介绍及安装使用。 一、DeepFMPO v3D是什么? github代码介绍文章 在药物发现中,如何寻找具新颖性和结构多样性的候选分子是颇受药物设计科学家关注的问题。通过虚拟筛选的化学空间搜索往往会受限于筛选…...
机器学习-16-分布式梯度提升库XGBoost的应用
参考XGBoost库 1 XGBoost分布式梯度提升库 XGBoost,全称为eXtreme Gradient Boosting,是一个优化的分布式梯度提升库,旨在高效、灵活且便携。它在Gradient Boosting框架下实现了机器学习算法,并广泛用于分类、回归和排序任务。XGBoost之所以受到广泛欢迎,主要归功于它的…...
视觉/AIGC面经->多模态
1.ocr检测如何做?qwen的文本检测是否合理? paligemma: <loc0110><loc0124><loc0224><loc0389> plate ; <loc0244><loc0130><loc0281><loc0430> plate ; <loc0364><loc0820><loc0403><loc0951> pl…...
<数据集>钢板缺陷检测数据集<目标检测>
数据集格式:VOCYOLO格式 图片数量:1986张 标注数量(xml文件个数):1986 标注数量(txt文件个数):1986 标注类别数:7 标注类别名称:[crescent gap, silk spot, water spot, weld line, oil spot, punchin…...
EdgeOne安全能力开箱测评挑战赛
活动地址:EdgeOne安全能力开箱测评挑战赛-腾讯云开发者社区-腾讯云 随着网络攻击日益频繁,企业网站面临着数据泄露、DDoS攻击、CC攻击等多种安全威胁。如何有效保护企业网站安全,成为企业IT部门的重要任务。腾讯云EdgeOne作为一款集成了CDN和…...
神经网络识别数字图像案例
学习资料:从零设计并训练一个神经网络,你就能真正理解它了_哔哩哔哩_bilibili 这个视频讲得相当清楚。本文是学习笔记,不是原创,图都是从视频上截图的。 1. 神经网络 2. 案例说明 具体来说,设计一个三层的神经网络。…...
c++包管理器
conan conan search,查看网络库 conan profile detect,生成缓存信息conan new cmake_exe/cmake_lib,创建cmakelists.txtconan install .,执行Conanfile.txt中的配置,生成相关的bat文件 项目中配置Conanfile.txt(或者…...
监控易V7.6.6.15升级详解7,日志分析更高效
随着企业IT系统的日益复杂,日志管理成为了保障系统稳定运行、快速定位问题的重要工具。为了满足广大用户对日志管理功能的更高需求,监控易系统近日完成了重要版本升级,对日志管理功能进行了全面优化和新增。 一、Syslog日志与SnmpTrap日志统…...
HTML表格、表单标签
目录 一、表格 (1)关于表格中标签说明 (2)关于表格中属性说明 (3)简单操作演示 (4)表格小结 二、表单 (1)简单操作演示 (2)注…...
(Windows环境)FFMPEG编译,包含编译x264以及x265
本文使用 MSYS2 来编译 ffmpeg 一、安装MSYS2 MSYS2 是 Windows 下的一组编译套件,它可以在 Windows 系统中模拟 Linux 下的编译环境,如使用 shell 运行命令、使用 pacman 安装软件包、使用 gcc (MinGW) 编译代码等。 MSYS2 的安装也非常省心&#x…...
notepad++中文出现异体汉字,怎么改正
notepad显示异体字,如何恢复? 比如 “门” 和 “直接” 的"直"字,显示成了 方法 修改字体, 菜单栏选择 Settings(设置),Style Configurator…(语言格式设置…)…...
EasyAnimate-v3版本支持I2V及超长视频生成
阿里云人工智能平台(PAI)自研开源的视频生成项目EasyAnimate正式发布v3版本: 支持 图片(可配合文字) 生成视频 支持 上传两张图片作为起止画面 生成视频 最大支持720p(960*960分辨率) 144帧视…...
最新PHP自助商城源码,彩虹商城源码
演示效果图 后台效果图 运行环境: Nginx 1.22.1 Mysql5.7 PHP7.4 直接访问域名即可安装 彩虹自助下单系统二次开发 拥有供货商系统 多余模板删除 保留一套商城,两套发卡 源码无后门隐患 已知存在的BUG修复 彩虹商城源码:下载 密码:chsc 免责声明&…...
Vue2打包部署后动态修改后端接口地址的解决方法
文章目录 前言一、背景二、解决方法1.在public文件夹下创建config文件夹,并创建config.js文件2.编写config.js内容3.在index.html中加载config.js4.在封装axios工具类的js中修改配置 总结 前言 本篇文章将介绍使用Vue2开发前后端分离项目时,前端打包部署…...
【后端开发实习】用MongoDB实现仓库管理的出库入库实战
用MongoDB实现仓库管理的出库入库 MongoDB什么是MongoDBMongoDB安装以及开始运行配置启动以及mongoshmongodb的基础使用命令启动和使用MongoDB服务数据库操作集合操作文档操作 项目部署在数据库中创建一张商品信息表提供信息表的增删改查操作接口 MongoDB 什么是MongoDB Mong…...
内网信息收集——用户凭据窃取
文章目录 一、获取域内单机密码和hash1.1 在线读取lsass进程内存1.2 离线读取lsass.exe进程内存1.3 在线读取本地SAM文件1.4 离线读取本地SAM文件 二、域hash获取三、windows凭据导出 一、获取域内单机密码和hash 在windows中,SAM文件是windows用户的账户数据库&am…...
组串式逆变器散热分析
1 引言 组串式逆变器散热方式主要有强制风冷和自然冷却两种,针对两种散热方式的实际效果,笔者抽取了不同厂家不同散热方式的两款组串式逆变器进行实验对比,发现在同样的环境温度下,强制风冷的逆变器内部环境温度及核心器件温升比…...
WEB07Vue+Ajax
1. Vue概述 Vue(读音 /vjuː/, 类似于 view),是一款用于构建用户界面的渐进式的JavaScript框架(官方网站:https://cn.vuejs.org)。 在上面的这句话中呢,出现了三个词,分别是&#x…...
uniapp打包成Android时,使用uni.chooseLocation在App端显示的地址列表是空白?一直转圈的解决办法
问题描述: uniapp打包后的测试版app在ios里可以显示高德地图的定位列表,但是安卓手机却不显示定位列表,一直在转圈圈,怎么回事?之前的功能在正式版都能用,真机运行也能用,为什么测试版的安卓手…...
Python MCP模板的“最后一公里”难题:K8s ServiceMesh集成、gRPC透明代理、证书自动轮转——全链路演示
第一章:Python MCP模板的企业级定位与架构全景Python MCP(Model-Controller-Plugin)模板并非通用Web框架的变体,而是专为企业级中台系统设计的可扩展服务骨架。它聚焦于解耦业务模型、控制逻辑与插件化能力扩展,适用于…...
如何将应用程序从三星传输到三星 [快速传输]
升级到像三星 Galaxy S25/S25 Ultra 这样的新手机总是令人兴奋的,但当涉及到将应用程序等数据从旧三星手机传输到新三星手机时,就会变得棘手。在新三星手机上手动安装 Play 商店中所有常用的应用程序非常耗时。那么,如何高效地将应用程序从三…...
【Agent】大模型在线API接入基础入门
大模型在线API接入基础入门一、全球AI模型版图与平台选型1、OpenRouter突破封锁的中转平台2、国内模型生态:性价比与可用性的平衡4、模型选型决策二、获取并保存API KEY三、调用API1、非SDK方式调用2、 OpenAI SDK方式调用(1)什么是SDK&#…...
毕业项目技术辅导:前后端与数据分析模块协作
毕业项目进入冲刺期,功能点多、时间紧、还要准备演示与答辩? 我这边提供毕业项目技术协作,主要做: 前端页面与交互实现(可配合你现有框架)后端接口、数据库与联调支持数据清洗、分析与可视化展示既有代码 b…...
泛微OA字段联动与JS代码顺序控制的实战技巧:如何避免数据遍历中的坑
泛微OA字段联动与JS代码顺序控制的实战技巧:如何避免数据遍历中的坑 在泛微OA系统的二次开发中,字段联动和JS代码控制是提升表单交互性的两大核心功能。但当这两个功能需要在同一业务流程中协同工作时,开发者常常会遇到一个棘手的问题&#x…...
PPO-Lag在Velocity-Walker2d任务中周期性震荡的原因分析与解决方案
PPO-Lag在Velocity-Walker2d任务中周期性震荡的机制解析与调优实践 当你在Velocity-Walker2d环境中观察到训练曲线像心电图一样规律起伏时,很可能正遭遇PPO-Lag算法的经典震荡问题。这种周期性波动不仅影响策略收敛效率,更可能掩盖算法在安全约束处理上的…...
别再做老好人了,优秀PM都有攻击性!
在职场中,“老好人”似乎是一个自带“善意”的标签,但对于项目经理(PM)而言,这三个字往往意味着内耗、妥协与项目失控。很多PM深陷“讨好型人格”的陷阱,怕得罪客户、怕得罪团队、怕得罪领导,凡…...
别再手动调字号了!用algorithm宏包搞定LaTeX伪代码排版(附完整代码)
LaTeX伪代码排版进阶指南:从字体调整到专业级算法展示 在学术论文写作中,尤其是计算机科学和人工智能领域,算法的清晰呈现几乎与算法本身同等重要。许多研究者花费大量时间优化算法性能,却常常忽视算法描述的可读性——这就像精心…...
Python+百度OCR实战:5分钟搞定批量图片经纬度提取(附完整代码)
Python百度OCR实战:5分钟搞定批量图片经纬度提取(附完整代码) 当你面对数百张带有经纬度水印的野外考察照片时,是否曾为手动记录坐标而抓狂?去年参与某生态调查项目时,团队摄影师每天传回300张带坐标水印的…...
从相位差到厘米级精度:深入解析蓝牙6.0 CS中PBR公式的推导与验证
1. 蓝牙6.0 CS技术中的相位测距原理 蓝牙6.0引入的信道探测(CS)功能将定位精度提升到了厘米级,这主要得益于其采用的相位测距法(PBR)。想象一下,这就像用无线电波玩"激光测距",只不过我们用的是相位差而不是光脉冲。在实际操作中&a…...
