当前位置：首页 > news >正文

【从0开发】百度BML全功能AI开发平台【实操：以部署情感分析模型为例】

news 2025/7/8 0:41:34

一、全功能AI开发平台介绍
二、AI项目落地应用流程（以文本分类为例）
- 2-0、项目开始
- 2-1、项目背景
- 2-2、数据准备介绍
- 2-3、项目数据
- 2-4、建模调参介绍
- 2-5、项目的建模调参
- 2-6、开发部署
- 2-7、项目在公有云的部署
附录：调用api代码
总结

一、全功能AI开发平台介绍

在这里插入图片描述

全功能AI开发平台是一个综合性的平台，旨在支持各种人工智能（AI）应用的开发、部署和管理。这些平台通常提供一系列工具、库和服务，以帮助开发者、数据科学家和工程师创建和操作各种类型的AI应用。以下是全功能AI开发平台通常提供的一些功能和特性：

数据管理：提供数据存储、数据集成、数据清洗和数据标注工具，以支持AI模型的训练和评估。
模型开发：包括模型训练、调优和验证工具，以及深度学习框架集成，使开发者能够创建自定义AI模型。
自动化ML（AutoML）：提供自动化工具，可以自动选择和调整模型参数，以简化模型开发流程。
部署和托管：支持AI模型的部署到云端或边缘设备，并提供自动扩展和管理模型的能力。
可解释性和监控：提供模型解释性工具，以及实时性能监控和错误检测，以确保AI应用的可靠性和可解释性。
集成和API：支持将AI功能集成到现有应用程序中，以及提供API，以便其他应用程序可以调用AI模型。
安全性和隐私：提供安全性和隐私保护功能，以确保AI应用的数据和模型的安全性。
可视化工具：提供可视化界面，以简化模型训练和部署的管理和监控。

下面以百度BML全功能AI开发平台为例进行介绍（一站式AI开发流程如下），且底层框架内置文心大模型基座：

在这里插入图片描述

二、AI项目落地应用流程（以文本分类为例）

2-0、项目开始

任务抽象：

项目有多少个任务场景
每个任务场景需要开发多少个模型
部署场景的约束是什么

任务流程介绍：

采集/标注数据
选择预训练模型
数据增强策略
超参数调整
模型训练以及评估
分析报告

2-1、项目背景

项目背景介绍：

在我们的生活和工作中，很多事情都可以转化为一个分类问题来解决，比如“上班坐公交还是坐地铁”、“吃米饭还是吃面条”等等可以转化为二分类问题。自然语言处理领域也是这样，大量的任务可以用文本分类的方式来解决，比如垃圾文本识别、涉黄涉暴文本识别、意图识别、文本匹配、命名实体识别等，有着极其广泛的应用场景：

投诉信息分类：训练客服投诉信息的自动分类，将每个用户投诉的内容进行分类管理，节省大量客服人力。
媒体文章分类：训练网络媒体文章的自动分类，进而实现各类文章的自动分类。
文本审核：定制训练文本审核的模型，如训练文本中是否含有违规/偏激性质的描述。

中文新闻文本标题分类任务简介：

新闻分类是文本分类中常见的应用场景。在传统分类模式下，往往是通过人工对新闻内容进行核对，从而将新闻划分到合适的类别中。这种方式会消耗大量的人力资源，并且效率不高。采用深度学习的方法可以取得较高的分类精度，是新闻推荐等场景下的基础任务。

使用BML开发平台，注册账号并且开始使用：官方链接
在这里插入图片描述

2-2、数据准备介绍

项目数据：

项目任务需要什么样的数据
如何制作高质量的数据集（图片数据：是否存在高度相似、模糊的图片，进行数据的清洗）
数据量不够怎么办（每一类的图片数量是否大于80张？是否需要增加图片以平衡类别数量？进行上采样？）

高质量数据：

数据标注正确
尽量提升数据的类别，提升模型的泛化能力
保证训练数据尽量与业务数据接近，各个类别平衡
数据划分正确，测试集验证集不会泄露。
以结果为导向看数据：看哪个类别的数据模型不太擅长识别，即分析badcase，采用数据增强增加数据数量。

数据增强（以图片的数据增强为例）：

对比度
色平衡
亮度
锐化
目标框裁剪
标注框旋转
标注框翻转
水平裁剪

BML平台优势：

智能标注
多人标注
数据质检报告
支持与数据采集设备直连
BML自动化数据清洗：去近似、去模糊、裁剪、旋转、镜像。
自动数据增强。开放超过40种算子，灵活配置

在这里插入图片描述

2-3、项目数据

本文采用中文新闻文本标题分类数据集进行示例:数据

在这里插入图片描述

点击数据集管理，并创建数据集。

在这里插入图片描述

在创建数据集界面，设置好相关信息并点击完成

在这里插入图片描述

填写导入配置信息: 设置数据的标注状态，是否为有标注信息，从本地导入，上传txt文本。之后点击上传txt文本将下载好的数据上传。
数据集创建完成后，可以在数据集管理界面看到导入的数据，并可以查看到导入状态、标注状态等信息。

2-4、建模调参介绍

建模调参：

选择什么样的模型
有没有精度更高的模型
如何调优，进一步提升性能
要不要购买服务器？

BML平台优势：

提供预置模型调参、NoteBook建模、自定义作业建模等三种开发方式，满足不同需求的开发者。

在这里插入图片描述

自动调参：以某种高级策略搜索超参组合，自动获得优秀的模型效果

2-5、项目的建模调参

选择使用预置模型调参，选择自然语言处理模型，点击创建任务
选择类型为文本分类-类型为单文本单标签。
创建完成后点击新建运行。
添加数据可以选择刚才导入的数据集，也可以选择公开数据集（二分类。数据量较少），需要注意的是，如果选择公开数据集，可以跳过前边的所有步骤。
在配置模型阶段，可以进行相关预训练模型的配置以及超参数的设置。Tiny版本模型更小，训练速度更快，但是精度略差。之后设置训练资源，以及选择计算节点。提交运行任务。
训练结束后点击评估报告，可以查看模型的表现情况（由于时间原因，我这里选择的是公开二分类数据进行训练）, 点击配置详情可以查看训练时设置的参数，训练可视化可以查看训练过程中的指标变化

在这里插入图片描述

进一步测试模型可以点击发布按钮进行模型的发布，发布模型之后可以在发布模型这一列看到已经发布的模型，这时候点击评估报告可以看到模型校验按钮，可以进行模型的校验，输入文本进行校验。

在这里插入图片描述

2-6、开发部署

部署环境：

云端：公有云部署，即将模型部署为在线服务，从而以REST API的方式提供推理预测能力。且公有云部署是最快捷的模型部署方式，不同类型的模型在执行公有云部署时的流程基本一致，当部署后在线API的接口与模型有关。

易于部署迭代
可使用大模型，快速上线
高延迟
成本线性升高

边缘端：

算力限制
前期开发部署成本高
低延迟
成本可控

在线服务说明：在线服务当前仅允许一个模型版本处于上线状态，若上线时有其他模型版本在线，则会将当前版本下线并且上线新的版本。服务状态以及其含义说明如下所示：

在这里插入图片描述

2-7、项目在公有云的部署

在模型仓库中选择发布的模型版本，之后进行在线服务部署。
在线服务设置：设置服务名称以及接口地址，模型配置阶段设置已经发布的模型以及对应版本，在资源配置阶段设置好需要使用的配置，按照小时计费。
创建好在线服务之后，创建应用，之后调用接口进行服务调用

在这里插入图片描述

之后使用ak、sk以及请求url来进行接口的调用

附录：调用api代码

import requests
import jsonAPI_KEY = ""
SECRET_KEY = ""def main():url = "https://aip.baidubce.com/rpc/2.0/nlp/v1/sentiment_classify?charset=&access_token=" + get_access_token()payload = json.dumps("")headers = {'Content-Type': 'application/json','Accept': 'application/json'}response = requests.request("POST", url, headers=headers, data=payload)print(response.text)def get_access_token():"""使用 AK，SK 生成鉴权签名（Access Token）:return: access_token，或是None(如果错误)"""url = "https://aip.baidubce.com/oauth/2.0/token"params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}return str(requests.post(url, params=params).json().get("access_token"))if __name__ == '__main__':main()

参考文章：
百度BML全功能开发平台官网.
数据集管理.
EasyDL文本价格整体说明.
开发文档训练、部署等.
鉴权认证机制.
服务与支持文档.
示例代码中心.

总结

人有悲欢离合，月有阴晴圆缺，此事古难全。

【从0开发】百度BML全功能AI开发平台【实操：以部署情感分析模型为例】

目录一、全功能AI开发平台介绍二、AI项目落地应用流程（以文本分类为例）2-0、项目开始2-1、项目背景2-2、数据准备介绍2-3、项目数据2-4、建模调参介绍2-5、项目的建模调参2-6、开发部署2-7、项目在公有云的部署附录：调用api代码总结一、全…...

编程日记 2023/10/15 14:48:10

源码解析FlinkKafkaConsumer支持punctuated水位线发送

背景 FlinkKafkaConsumer支持当收到某个kafka分区中的某条记录时发送水位线，比如这条特殊的记录代表一个完整记录的结束等，本文就来解析下发送punctuated水位线的源码 punctuated 水位线发送源码解析 1.首先KafkaFetcher中的runFetchLoop方法 public…...

编程日记 2023/10/15 14:47:10

vue3学习（五）--- 父子组件传值

文章目录 defineProps普通写法TS写法 defineEmits普通写法TS写法 defineExpose defineProps 和 defineEmits 都是只能在 <script setup> 中使用的编译器宏。他们不需要导入，且会随着 <script setup> 的处理过程一同被编译掉。 defineProps 接收父组件传…...

编程日记 2023/10/15 14:46:08

寻找AI时代的关键拼图，从美国橡树岭国家实验室读懂AI存力信标

超算，是计算产业的明珠，是人类探索未知的航船。超算的发展与变化，不仅代表着各个国家与地区间的科技竞争力，更将作为趋势风向标，影响整个数字化体系的走向。在目前阶段，超算与AI计算的融合是大势所趋。为了…...

编程日记 2023/10/15 14:45:07

多线程并发篇---第十二篇

系列文章目录文章目录系列文章目录一、说说ThreadLocal原理？二、线程池原理知道吗？以及核心参数三、线程池的拒绝策略有哪些？一、说说ThreadLocal原理？ hreadLocal可以理解为线程本地变量，他会在每个线程都创建一个副本，那么在线程之间访问内部副本变量就行了，做到了…...

编程日记 2023/10/15 14:44:06

P7537 [COCI2016-2017#4] Rima

由于题目涉及到后缀，不难想到用 trie 树处理。将每个字符串翻转插入 trie，后缀就变成了前缀，方便处理。条件 LCS ( A , B ) ≥ max ⁡ ( ∣ A ∣ , ∣ B ∣ ) − 1 \text{LCS}(A,B) \ge \max(|A|,|B|)-1 LCS(A,B)≥max(∣A∣,∣B∣)−1&…...

编程日记 2023/10/15 14:43:05

SwiftUI Swift CoreData 计算某实体某属性总和

有一个名为 Item 的实体，它有一个名为 amount 的 Double 属性，向你的 View 添加一个计算属性： Code: struct ContentView: View {Environment(\.managedObjectContext) private var viewContextFetchRequest(sortDescriptors: [NSSortDescri…...

编程日记 2023/10/15 14:42:04

确保安装了docker和docker-compose sudo docker -v Docker version 20.10.12, build 20.10.12-0ubuntu4 sudo docker-compose -v docker-compose version 1.29.2, build unknown 编写docker-compose.yml version: "3.1" services: skywalking-oap:image: apach…...

编程日记 2023/10/15 14:41:02

【Codeforces】 CF1097G Vladislav and a Great Legend

题目链接 CF方向 Luogu方向题目解法首先一个套路是普通幂转下降幂（为什么？因为观察到 k k k 很小，下降幂可以转化组合数问题，从而 d p dp dp 求解） 即 f ( X ) k ∑ i 0 k { k i } i ! ( f ( X ) i ) f(X)^k…...

编程日记 2023/10/15 14:40:01

力扣每日一题36：有效的数独

题目描述： 请你判断一个 9 x 9 的数独是否有效。只需要根据以下规则 ，验证已经填入的数字是否有效即可。数字 1-9 在每一行只能出现一次。数字 1-9 在每一列只能出现一次。数字 1-9 在每一个以粗实线分隔的 3x3 宫内只能出现一次。（请参考…...

编程日记 2023/10/15 14:38:59

钉钉数字校园小程序开发：开启智慧教育新时代

随着信息技术的快速发展和校园管理的日益复杂化，数字校园已成为现代教育的重要趋势。钉钉数字校园小程序作为一种创新应用，以其专业性、思考深度和逻辑性，为学校提供了全新的管理、教学和沟方式。本文从需求分析、技术实现和应用思考三个方面…...

编程日记 2023/10/15 14:37:57

数据结构与算法--其他算法

数据结构与算法--其他算法 1 汉诺塔问题 2 字符串的全部子序列 3 字符串的全排列 4 纸牌问题 5 逆序栈问题 6 数字和字符串转换问题 7 背包问题 8 N皇后问题暴力递归就是尝试 1，把问题转化为规模缩小了的同类问题的子问题 2，有明确的不需要继续…...

编程日记 2023/10/15 14:36:56

矩阵键盘行列扫描

/*----------------------------------------------- 内容：如计算器输入数据形式相同从右至左使用行列扫描方法 ------------------------------------------------*/ #include<reg52.h> //包含头文件，一般情况不需要改动，头文件包含…...

编程日记 2023/10/15 14:35:55

unity 实现拖动ui填空，并判断对错

参考：https://ask.csdn.net/questions/7971448 根据自己的需求修改为如下代码使用过程中，出现拖动ui位置错误的情况，修改为使用 localPosition 但是吸附到指定位置却需要用的position public class DragAndDrop : MonoBehaviour, IBeginDr…...

编程日记 2023/10/15 14:34:54

《机器学习》第5章神经网络

文章目录 5.1 神经元模型5.2 感知机与多层网络5.3 误差逆传播算法5.4 全局最小与局部最小5.5 其他常见神经网络RBF网络ART网络SOM网络级联相关网络Elman网络Boltzmann机 5.6 深度学习 5.1 神经元模型神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它…...

编程日记 2023/10/15 14:33:53

FPGA project ： flash_erasure

SPI是什么： SPI（Serial Peripheral Interface，串行外围设备接口）通讯协议，是Motorola公司提出的一种同步串行接口技术，是一种高速、全双工、同步通信总线，在芯片中只占用四根管脚用来控制及数据…...

编程日记 2023/10/15 14:32:52

AC修炼计划（AtCoder Regular Contest 166）

传送门：AtCoder Regular Contest 166 - AtCoder 一直修炼cf，觉得遇到了瓶颈了，所以想在atcode上寻求一些突破，今天本来想尝试vp AtCoder Regular Contest 166，但结局本不是很好，被卡了半天，止步…...

编程日记 2023/10/15 14:31:51

Android---Android 是如何通过 Activity 进行交互的

相信对于 Android 工程师来说，startActivity 就像初恋一般。要求低，见效快，是每一个菜鸟 Android 工程师迈向高级 Android 工程师的必经阶段。经过这么多年的发展，startActivity 在 google 的调教下已经变得愈发成熟，对…...

编程日记 2023/10/15 14:30:51

【论文解读】单目3D目标检测 MonoCon（AAAI2022）

本文分享单目3D目标检测，MonoCon模型的论文解读，了解它的设计思路，论文核心观点，模型结构，以及效果和性能。目录一、MonoCon简介二、论文核心观点三、模型框架四、模型预测信息与3D框联系五、损失函数六、…...

编程日记 2023/10/15 14:29:50

Angular知识点系列（5）-每天10个小知识

目录 41. Angular的路由守卫42. 处理文件的上传和下载43. Angular的动画系统44. 使用第三方库和选择评估45. 性能优化46. AOT和JIT编译47. 处理响应式布局和适配不同屏幕尺寸48. Angular的国际化（i18n）49. Angular的PWA开发50. 使用Angular Material或其…...

编程日记 2023/10/15 14:28:49

[特殊字符] 智能合约中的数据是如何在区块链中保持一致的？

🧠 智能合约中的数据是如何在区块链中保持一致的？ 为什么所有区块链节点都能得出相同结果？合约调用这么复杂，状态真能保持一致吗？本篇带你从底层视角理解“状态一致性”的真相。一、智能合约的数据存储在哪里&#xf…...

编程新知 2025/6/21 14:52:47

【大模型RAG】拍照搜题技术架构速览：三层管道、两级检索、兜底大模型

摘要拍照搜题系统采用“三层管道（多模态 OCR → 语义检索 → 答案渲染）、两级检索（倒排 BM25 向量 HNSW）并以大语言模型兜底”的整体框架： 多模态 OCR 层将题目图片经过超分、去噪、倾斜校正后，分别用…...

编程新知 2025/7/7 17:33:09

vscode里如何用git

打开vs终端执行如下： 1 初始化 Git 仓库（如果尚未初始化） git init 2 添加文件到 Git 仓库 git add . 3 使用 git commit 命令来提交你的更改。确保在提交时加上一个有用的消息。 git commit -m "备注信息" 4 …...

编程新知 2025/6/21 12:50:31

OpenLayers 可视化之热力图

注：当前使用的是 ol 5.3.0 版本，天地图使用的key请到天地图官网申请，并替换为自己的key 热力图（Heatmap）又叫热点图，是一种通过特殊高亮显示事物密度分布、变化趋势的数据可视化技术。采用颜色的深浅来显示…...

编程新知 2025/7/6 21:38:30

《Qt C++ 与 OpenCV：解锁视频播放程序设计的奥秘》

引言：探索视频播放程序设计之旅在当今数字化时代，多媒体应用已渗透到我们生活的方方面面，从日常的视频娱乐到专业的视频监控、视频会议系统，视频播放程序作为多媒体应用的核心组成部分，扮演着至关重要的角色。无论是在个人电脑、移动设备还是智能电视等平台上，用户都期望…...

编程新知 2025/7/7 5:59:03

python/java环境配置

环境变量放一起 python： 1.首先下载Python Python下载地址：Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个，然后自定义，全选可以把前4个选上 3.环境配置 1）搜高级系统设置 2…...

编程新知 2025/7/6 7:09:46

java 实现excel文件转pdf | 无水印 | 无限制

文章目录目录文章目录前言 1.项目远程仓库配置 2.pom文件引入相关依赖 3.代码破解二、Excel转PDF 1.代码实现 2.Aspose.License.xml 授权文件总结前言 java处理excel转pdf一直没找到什么好用的免费jar包工具，自己手写的难度，恐怕高级程序员花费一年的事件，也…...

编程新知 2025/7/7 14:31:27

解决Ubuntu22.04 VMware失败的问题 ubuntu入门之二十八

现象1 打开VMware失败 Ubuntu升级之后打开VMware上报需要安装vmmon和vmnet，点击确认后如下提示最终上报fail 解决方法内核升级导致，需要在新内核下重新下载编译安装查看版本 $ vmware -v VMware Workstation 17.5.1 build-23298084$ lsb_release…...

编程新知 2025/7/7 16:21:08

苍穹外卖--缓存菜品

1.问题说明用户端小程序展示的菜品数据都是通过查询数据库获得，如果用户端访问量比较大，数据库访问压力随之增大 2.实现思路通过Redis来缓存菜品数据，减少数据库查询操作。缓存逻辑分析： ①每个分类下的菜品保持一份缓存数据…...

编程新知 2025/7/6 17:23:13

Spring AI 入门：Java 开发者的生成式 AI 实践之路

一、Spring AI 简介在人工智能技术快速迭代的今天，Spring AI 作为 Spring 生态系统的新生力量，正在成为 Java 开发者拥抱生成式 AI 的最佳选择。该框架通过模块化设计实现了与主流 AI 服务（如 OpenAI、Anthropic）的无缝对接&…...

编程新知 2025/6/21 17:17:46

目录

一、全功能AI开发平台介绍

二、AI项目落地应用流程（以文本分类为例）

2-0、项目开始

2-1、项目背景

2-2、数据准备介绍

2-3、项目数据

2-4、建模调参介绍

2-5、项目的建模调参

2-6、开发部署

2-7、项目在公有云的部署

附录：调用api代码

总结

相关文章：