当前位置: 首页 > news >正文

PP-ChatOCRv2、PP-TSv2、大模型半监督学习工具...PaddleX新特性等你来pick!

小A是一名刚刚毕业的算法工程师,有一天,他被老板安排了一个活,要对一批合同扫描件进行自动化信息抽取,输出结构化的分析报表。OCR问题不大,但是怎么进行批量的结构化信息抽取呢?小A陷入了苦苦思索…

小B是一名项目经理,最近他接手了一个紧急的AI项目,客户提供的数据很多,但是标注的样本很少,很难达到客户要求的精度指标。而如果大量标注数据,时间上根本来不及。deadline一天天临近,小B整天愁眉苦脸…

小C是一家小型AI服务提供商的老板,长期做项目下来,他总觉得需要沉淀一套标准化的工具,快速应对多种多样的场景需求,尤其要满足多种复杂环境的模型部署,但公司的研发力量被项目缠身,陷入了恶性循环。小C一筹莫展…

俗话说的好,方法总比困难多,新版本的PaddleX有望解决小A、小B和小C的燃眉之急!

转眼间,距离飞桨AI套件PaddleX的正式发布Run in PaddleX!四步搞定10+任务场景36个精选产业模型开发与部署!已经过去了两个月。两个月期间,PaddleX团队快速响应AI落地的新需求、新功能,以期能在今天新内容发布中给大家交一个满意的答卷!接下来,就让我们看一看PaddleX都带来了什么新内容吧!

四大更新内容速览

强大的大小模型结合特色工具

  • PP-ChatOCRv2: PP-OCR与文心一言强强结合,支持1.5万+大字库解决生僻字、多页pdf、表格识别等难题,无需训练即可在20+场景实现关键信息抽取平均准确率80%以上。
  • PP-TSv2: 支持时序预测时序异常检测任务。在用电负荷预测、预测性维护等多场景任务自适应寻优!电力场景预测误差降低20%以上,设备异常检测场景召回率提升5%。
  • 大模型半监督学习工具: 借助少量有标注数据和大量无标注数据,大大提升模型的精度;在分类、检测、OCR识别3类任务的17个模型上,实现小模型精度提升10%~26%。

40+精选产业高精度模型库

新增RT-DETR-H、TimesNet_AD、PP-HGNetv2-B4等8个精选模型,扩充时序分类、时序异常检测等任务。PaddleX目前已覆盖目标检测、图像分割、3D、OCR、时序预测、图像识别系统、PDF转word等40+精选产业高精度模型库。

低代码工具箱全流程开发

新增数据格式转换、数据划分、评估指标说明等10+界面功能优化,工具箱/开发者双模式高低代码联动功能更丰富,布局更美观!

云端&本地端双平台按需使用

云端和Windows本地端能力同步升级,双平台按需选择!AI Studio云端资源随处可达,实现24小时随处AI开发。为充分利用本地算力,可一键下载本地端软件,满足多样需求。小伙伴们还等什么,来AI Studio云端一键体验吧!这里偷偷爆个料,Linux离线版本地端距离发布很近了呦!

  • PaddleX云端快速体验:

    https://aistudio.baidu.com/intro/paddlex/models

  • PaddleX本地端下载:

    https://aistudio.baidu.com/intro/paddlex

想和志同道合的开发者交流开发经验?想和PaddleX官方开发者交流?欢迎来PaddleX频道交流:https://aistudio.baidu.com/community/channel/610

接下来,让我们详细看一下更新内容吧!

新特性详解

强大的大小模型结合特色工具

PP-ChatOCRv2

相信大家对PP-ChatOCR的惊艳效果还有很深的印象(点击回顾PP-ChatOCR:基于文心大模型的通用图像关键信息抽取利器,开发提效50%!),现在,我们正式迎来了它的第2版。

PP-ChatOCRv2是一个融合了LLM大模型和OCR技术的通用文本图像智能分析系统,覆盖20+高频应用场景,支持5种文本图像智能分析能力和部署,包括通用场景关键信息抽取(快递单、营业执照和机动车行驶证等)、复杂文档场景关键信息抽取(解决生僻字、特殊标点、多页PDF、表格等难点问题)、通用OCR、文档场景专用OCR、通用表格识别。此外针对垂类业务场景,也支持模型训练、微调和Prompt优化。

图片

PP-ChatOCRv2 多场景识别效果PP-ChatOCRv2在PP-ChatOCR的基础上进一步升级,小模型+大模型串联逻辑不变,在通用信息抽取、复杂文档信息抽取、代码拓展性、基础功能完备四个方面做了更新。下面是v2的特性总结:

  • 场景丰富: 支持5种智能文本图像分析能力,覆盖20+高频应用场景,尤其针对复杂文档场景进行了专项优化。
  • 精准度高: 「PP-OCR」与「文心一言」强强结合,支持1.5万+大字库,解决生僻字、多页PDF、表格等难题,无需训练即可在20+场景关键信息抽取平均准确率80%以上。
  • 一键部署: 一键获取PP-ChatOCRv2离线部署SDK,助力企业快速实现工程落地。
  • 便捷开发: 针对垂类业务场景,通过简单点击UI界面按钮,可完成Prompt优化、模型训练和微调。

立即在线体验:

https://aistudio.baidu.com/projectdetail/paddlex/7050167

PP-TSv2

说到时序处理,大家一定还记得PaddleX重磅推出的PP-TS(点击回顾PP-TS基于启发式搜索和集成方法的时序预测模型,使预测更加准确),现在让我们看看v2带来了什么新特性。

图片
PP-TSv2 电力和交通场景落地效果

  • 场景丰富: 支持时序预测时序异常检测两大通用任务,在用电负荷预测、预测性维护、能耗分析、交流流量预估等场景中有重要应用价值。
  • 精准度高: 多场景任务自适应寻优。时序预测,在电力场景预测误差降低20%以上;时序异常检测,在设备异常监控场景相同精度下,召回提升约5%。
  • 便捷开发: 简单点击UI界面即可完数据的预处理一键化去重,数据格式转化以及划分,高精度的自定义训练,研发成本低。
  • 一键部署: 一键获取PP-TSv2离线部署SDK和服务化部署,助力企业快速工程落地。

立即在线体验:

https://aistudio.baidu.com/projectdetail/paddlex/7044307

大模型半监督学习工具

不知道大家有没有遇到过数据标注成本高、周期长的困扰,有没有那么一种可能,精心标注少量的数据,配合大量的无标注数据,就能达到比肩全量标注的模型精度呢?是的,PaddleX就带来了这样一款提效神器——大模型半监督学习工具。

大模型半监督学习工具(LMSSL)利用视觉大模型的强大特征表征能力和PaddleX的特色半监督学习方法,在少量有标注数据和大量无标注数据的混合数据上学习到更好的特征,从而得到超高精度的大模型;该工具还内置了蒸馏和微调小模型的方法,进一步可以得到精度更高的小模型。

为了验证该工具的有效性,我们测试了其在公开数据集的指标。最终,该工具刷新了图像分类-10%ImageNet、目标检测-10%COCO的半监督学习SOTA精度。目前,该工具支持图像分类、目标检测、OCR识别三类视觉任务17个模型,大家无需关心细节,只需提供更多无标注数据,点击两次按钮,即可得到高精度的大模型和小模型。下面列举了使用该工具后,不同场景中大模型和小模型的精度提升情况。

图片

图像分类不同场景和指标提升情况

图片

目标检测不同场景和指标题提升情况

立即在线体验:

  • 图像分类-大模型半监督学习工具:

    https://aistudio.baidu.com/projectdetail/paddlex/7045718

  • 目标检测-大模型半监督学习工具:

    https://aistudio.baidu.com/projectdetail/paddlex/7045736

  • OCR识别-大模型半监督学习工具:

    https://aistudio.baidu.com/projectdetail/paddlex/7045737

以上这些特色工具有没有让大家眼前一亮呢?未来PaddleX将持续推出更多的特色工具,欢迎保持关注哦~

对这些特色工具很感兴趣,想了解得更深入一些?没问题,关注本公众号,后面陆续会有针对性讲解的文章~

40+精选产业高精度模型库

本次更新中,图像分类、目标检测任务方向分别新增了3个精选模型,为大家带来了更多的精度-速度权衡选择。另外,额外覆盖了时序异常检测、时序分类两个任务方向,各自新增一个精选模型。这些精选模型个个都很能打,有下面的实测数据为证。大家的模型选型又有新的选项啦!

图片

PaddleX 本次发版新增模型list

PaddleX已支持的40+算法模型,可参考该链接:

https://aistudio.baidu.com/intro/paddlex/models

后续,PaddleX将持续扩大开发者心心念念的实例分割模型、LLM模型等,欢迎大家进入文章底部的交流频道,反馈对新模型的需求!

低代码工具箱全流程开发

新版PaddleX正式发布以来,用户对工具箱/开发者双模式高低代码联动的开发方式大家赞赏。PaddleX为了做好极致的AI开发全流程, 这次更新增加了数据分析工具、数据格式转换工具、数据划分工具、评估指标说明等10+功能,低代码工具箱模式功能更丰富,布局更美观!

图片

云端&本地端双平台按需使用

云端AI Studio平台,PaddleX可以通过项目大厅和模型库两个入口使用。

Windows本地端PaddleX2.2.0版本也正式发布啦,除特色工具外,云端所有能力实现完全同步。一键下载安装windows本地端,即可完成模型开发全流程。

图片

结语

最后,稍微总结一下:

PaddleX是面向国内外主流AI硬件的,全流程、高效率的飞桨精选AI模型的一站式AI开发套件。PaddleX的使命是助力AI技术快速落地,愿景是使人人成为AI Developer!

在本次更新中,PaddleX带来了强大的大小模型结合特色工具、40+精选产业高精度模型库、低代码工具箱全流程开发、云端&本地端双平台按需使用等特性,希望能给大家带来更大的AI开发效率提升和更好的产品体验!

目前PaddleX依然处在快速迭代中,欢迎大家试用和指正!比心~

添加AI Studio飞桨AI套件官方频道,和大家一起讨论吧,传送门:

https://aistudio.baidu.com/community/channel/610

  • PaddleX云端在线体验:

    https://aistudio.baidu.com/intro/paddlex/models

  • PaddleX Windows本地端下载地址:

    https://aistudio.baidu.com/intro/paddlex

相关文章:

PP-ChatOCRv2、PP-TSv2、大模型半监督学习工具...PaddleX新特性等你来pick!

小A是一名刚刚毕业的算法工程师,有一天,他被老板安排了一个活,要对一批合同扫描件进行自动化信息抽取,输出结构化的分析报表。OCR问题不大,但是怎么进行批量的结构化信息抽取呢?小A陷入了苦苦思索… 小B是…...

HarmonyOS 学习记录

时光荏苒,岁月如梭,韶华不负,未来可期。转眼间已经30岁了,学习的重要性不言而喻,在接下来的日子里记录下自己学习HarmonyOS的过程。增加一下知识储备,防患于未然嘛 不得不说华为的开发文档写的不错,开发工具直接安装后自动配置环境…...

阿里云 业务集群的冗余、备份、监控方案

1. 请解释什么是业务集群的冗余、备份和监控? 一、冗余方案 硬件冗余:在业务集群中,关键设备如服务器、存储设备等应采用双机热备或集群技术,确保在某台设备出现故障时,其他设备能够自动接管工作,保证业务…...

无人驾驶的未来 后疫情时代如何抵达

作者 | 马冀,澳鹏(Appen)中国区副总裁 自动驾驶—疫情危难中显身手 2020年,一场突如其来的新冠肺炎肆虐全球, 导致不同国家的人们被迫隔离或保持社交距离,人与人之间的接触变得风险极高。一时间,人们对于…...

(论文阅读31/100)Stacked hourglass networks for human pose estimation

31.文献阅读笔记 简介 题目 Stacked hourglass networks for human pose estimation 作者 Alejandro Newell, Kaiyu Yang, and Jia Deng, ECCV, 2016. 原文链接 https://arxiv.org/pdf/1603.06937.pdf 关键词 Human Pose Estimation 研究问题 CNN运用于Human Pose E…...

【第2章 Node.js基础】2.6 Node.js 的Buffer数据类型

Buffer数据类型 文章目录 Buffer数据类型什么是Buffer数据类型Buffer 的特点 创建Buffer实例Buffer用于编码转换将Buffer 实例转换为JSON 对象Buffer实例基本操作1. 写入Buffer实例:2. 从Buffer实例读取数据:3. Buffer实例合并: 4. Buffer实例…...

reactive和effect,依赖收集触发依赖

通过上一篇文章已经初始化项目,集成了ts和jest。本篇实现Vue3中响应式模块里的reactive方法。 前置知识要求 如果你熟练掌握Map, Set, Proxy, Reflect,可直接跳过这部分。 Map Map是一种用于存储键值对的集合,并且能够记住键的原始插入顺…...

【C#学习】backgroundWorker控件

BackgroundWorker 控件的几个实例(C# backgroundworker使用方法): 在 WinForms 中,有时要执行耗时的操作,在该操作未完成之前操作用户界面,会导致用户界面停止响应。 解决的方法就是新开一个线程&#xff…...

Istio学习笔记-部署模型

参考:Istioldie 1.18 / 部署模型 当您将 Istio 用于生产环境部署时,需要确定一系列的问题。 网格将被限制在单个集群中还是分布在多个集群中? 是将所有服务都放置在单个完全连接的网络中,还是需要网关来跨多个网络连接服务&#…...

磁盘调度算法

磁盘调度算法是计算机操作系统中用于管理磁盘上的数据访问的重要组成部分。这些算法有助于优化数据的读写操作,以减少磁盘访问时间,提高系统性能。以下是一些常见的磁盘调度算法: 先来先服务(FCFS,First-Come-First-Se…...

力扣题库2. 两数相加

给你两个 非空 的链表,表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的,并且每个节点只能存储 一位 数字。 请你将两个数相加,并以相同形式返回一个表示和的链表。 你可以假设除了数字 0 之外,这两个数都不会以 0 开…...

【Linux】第十六站:进程地址空间

文章目录 一、程序地址空间1.内存的分布2.static修饰后为什么不会被释放3.一个奇怪的现象 二、进程地址空间1.前面现象的原因2.地址空间究竟是什么?3.为什么要有进程地址空间4.页表5.什么叫进程?6.进程具有独立性。为什么?怎么做到呢&#xf…...

基于Springboot的影城管理系统(有报告)。Javaee项目,springboot项目。

演示视频: 基于Springboot的影城管理系统(有报告)。Javaee项目,springboot项目。 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 项目介绍…...

如何在面试中胜出?接口自动化面试题安排上

📢专注于分享软件测试干货内容,欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!📢交流讨论:欢迎加入我们一起学习!📢资源分享:耗时200小时精选的「软件测试」资…...

联邦学习研究综述笔记

联邦学习 联邦学习的定义:联邦学习是一种分布式机器学习架构,包含多个客户端(参与者)和一个聚合服务器。客服端(参与方):在本地使用自己的私有数据训练模型,训练完成之后将模型的参…...

RedisTemplate乱码问题

其实这是在解决一个项目问题是发现的,因为原开发者的大意,造成了系统出现严重的逻辑问题。 因为系统系统采用分模块开发,某模块使用Spring提供的RedisTemplate进行值的读写,另一位使用了框架基于Jedis的一套公用方法进行值的读写…...

Java用户和内核交互图

...

2023.11.14使用bootstrap制作一个简洁的前端注册登录页

2023.11.14使用bootstrap制作一个简洁的前端注册登录页 比较简洁的登录页,主要是为自己开发的一些平台页面做测试用,前端具备功能如下: (1)输入用户名、密码,需补充后端验证代码。 (2&#xff…...

Avatar虚拟形象解决方案,趣味化的视频拍摄与直播新体验

企业们正在寻找新的方式来吸引和保持观众的注意力,一种新兴的解决方案就是使用Avatar虚拟形象技术,这种技术可以让用户在视频拍摄或直播场景中,以自定义的数字人形象出现,同时保持所有的表情和脸部驱动。美摄科技正是这个领域的领军者&#x…...

MongoDB备份与恢复以及导入导出

MongoDB备份与恢复 1、mongodump数据备份 在Mongodb中我们使用mongodump命令来备份MongoDB数据。该命令可以导出所有数据 (数据和数据结构) 或指定数据(集合、部分集合内容)到指定目录中。 语法: mongodump -h dbhost -d dbname -o dbdirec…...

C++实现分布式网络通信框架RPC(3)--rpc调用端

目录 一、前言 二、UserServiceRpc_Stub 三、 CallMethod方法的重写 头文件 实现 四、rpc调用端的调用 实现 五、 google::protobuf::RpcController *controller 头文件 实现 六、总结 一、前言 在前边的文章中,我们已经大致实现了rpc服务端的各项功能代…...

Linux链表操作全解析

Linux C语言链表深度解析与实战技巧 一、链表基础概念与内核链表优势1.1 为什么使用链表?1.2 Linux 内核链表与用户态链表的区别 二、内核链表结构与宏解析常用宏/函数 三、内核链表的优点四、用户态链表示例五、双向循环链表在内核中的实现优势5.1 插入效率5.2 安全…...

AI Agent与Agentic AI:原理、应用、挑战与未来展望

文章目录 一、引言二、AI Agent与Agentic AI的兴起2.1 技术契机与生态成熟2.2 Agent的定义与特征2.3 Agent的发展历程 三、AI Agent的核心技术栈解密3.1 感知模块代码示例:使用Python和OpenCV进行图像识别 3.2 认知与决策模块代码示例:使用OpenAI GPT-3进…...

Java-41 深入浅出 Spring - 声明式事务的支持 事务配置 XML模式 XML+注解模式

点一下关注吧!!!非常感谢!!持续更新!!! 🚀 AI篇持续更新中!(长期更新) 目前2025年06月05日更新到: AI炼丹日志-28 - Aud…...

【Zephyr 系列 10】实战项目:打造一个蓝牙传感器终端 + 网关系统(完整架构与全栈实现)

🧠关键词:Zephyr、BLE、终端、网关、广播、连接、传感器、数据采集、低功耗、系统集成 📌目标读者:希望基于 Zephyr 构建 BLE 系统架构、实现终端与网关协作、具备产品交付能力的开发者 📊篇幅字数:约 5200 字 ✨ 项目总览 在物联网实际项目中,**“终端 + 网关”**是…...

Rapidio门铃消息FIFO溢出机制

关于RapidIO门铃消息FIFO的溢出机制及其与中断抖动的关系,以下是深入解析: 门铃FIFO溢出的本质 在RapidIO系统中,门铃消息FIFO是硬件控制器内部的缓冲区,用于临时存储接收到的门铃消息(Doorbell Message)。…...

使用 SymPy 进行向量和矩阵的高级操作

在科学计算和工程领域,向量和矩阵操作是解决问题的核心技能之一。Python 的 SymPy 库提供了强大的符号计算功能,能够高效地处理向量和矩阵的各种操作。本文将深入探讨如何使用 SymPy 进行向量和矩阵的创建、合并以及维度拓展等操作,并通过具体…...

用机器学习破解新能源领域的“弃风”难题

音乐发烧友深有体会,玩音乐的本质就是玩电网。火电声音偏暖,水电偏冷,风电偏空旷。至于太阳能发的电,则略显朦胧和单薄。 不知你是否有感觉,近两年家里的音响声音越来越冷,听起来越来越单薄? —…...

深度学习水论文:mamba+图像增强

🧀当前视觉领域对高效长序列建模需求激增,对Mamba图像增强这方向的研究自然也逐渐火热。原因在于其高效长程建模,以及动态计算优势,在图像质量提升和细节恢复方面有难以替代的作用。 🧀因此短时间内,就有不…...

第八部分:阶段项目 6:构建 React 前端应用

现在,是时候将你学到的 React 基础知识付诸实践,构建一个简单的前端应用来模拟与后端 API 的交互了。在这个阶段,你可以先使用模拟数据,或者如果你的后端 API(阶段项目 5)已经搭建好,可以直接连…...