当前位置: 首页 > news >正文

玩转OCR | 探索腾讯云智能结构化识别新境界

在这里插入图片描述

📝个人主页🌹:Eternity._
🌹🌹期待您的关注 🌹🌹

在这里插入图片描述
在这里插入图片描述

❀ 玩转OCR

  • 腾讯云智能结构化识别
  • 产品介绍
  • 服务应用
  • 产品特征
  • 行业案例
  • 总结

腾讯云智能结构化识别


腾讯云智能结构化OCR产品分为基础版与高级版,广泛适用于各行业,能精准识别卡证、物流单据、工业标签、服务合同及医疗报告等多种文档类型。即便面对版式灵活多变或中英文混合排版的挑战,该产品仍能保持卓越的识别精度。

通过运用先进的多模态大模型技术,腾讯云OCR能够智能建立键值对应关系,并允许客户根据自身需求定制个性化模板,从而显著提高数据抓取与录入的效率。 这一解决方案广泛适用于政务事务处理、票据核销流程、行业表单自动化填写等多个业务场景。

在这里插入图片描述

产品介绍


背景:

在交通、物流、金融、零售等多个行业中,各类票据、表单、文档、合同等文件普遍面临版式布局复杂、中英文混合排版、票据混杂粘贴、印刷体与手写体并存、样式多样且差异显著、英文字段解析难度高等一系列挑战。这些痛点导致传统的通用文字识别技术难以满足企业对高精度识别的业务需求。

为了解决这些问题,我们就需要使用智能结构化:

  • 智能结构化融合了业界领先的深度学习技术、图像检测技术以及OCR大模型能力,能够实现不限版式的结构化信息抽取。无论是固定卡证还是复杂的物流单据,均可实现智能识别。

在这里插入图片描述

服务应用


  • 注册并登录腾讯云,通过实名认证后,开通服务

在这里插入图片描述

  • 开通服务后,我们可以进入控制台,体验demo

在这里插入图片描述

使用文字识别服务:

  • 直接在文字识别体验Demo中体验,智能结构化(高级版)
    在这里插入图片描述

代码调用:


import json
import types
from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.ocr.v20181119 import ocr_client, models
try:# 实例化一个认证对象,入参需要传入腾讯云账户 SecretId 和 SecretKey,此处还需注意密钥对的保密# 代码泄露可能会导致 SecretId 和 SecretKey 泄露,并威胁账号下所有资源的安全性。以下代码示例仅供参考,建议采用更安全的方式来使用密钥,请参见:https://cloud.tencent.com/document/product/1278/85305# 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取cred = credential.Credential("SecretId", "SecretKey")# 实例化一个http选项,可选的,没有特殊需求可以跳过httpProfile = HttpProfile()httpProfile.endpoint = "ocr.tencentcloudapi.com"# 实例化一个client选项,可选的,没有特殊需求可以跳过clientProfile = ClientProfile()clientProfile.httpProfile = httpProfile# 实例化要请求产品的client对象,clientProfile是可选的client = ocr_client.OcrClient(cred, "", clientProfile)# 实例化一个请求对象,每个接口都会对应一个request对象req = models.RecognizeGeneralTextImageWarnRequest()params = {"ImageUrl": "https://waizi.org.cn/uploadfile/201402/22/222111297.jpg"}req.from_json_string(json.dumps(params))# 返回的resp是一个RecognizeGeneralTextImageWarnResponse的实例,与请求对象对应resp = client.RecognizeGeneralTextImageWarn(req)# 输出json格式的字符串回包print(resp.to_json_string())except TencentCloudSDKException as err:print(err)

用于测试图片:

在这里插入图片描述

识别结果:

Address: "XX市XX区XX号"
Angle: 0
Business: "XXXXXXXXXXXXXXXXXXXXXXXXXX、XXXXXXXX、XXXXXXXXXX、XXXXXXXX、XXXXXXXX、XXXXXXXXXX"
Capital: "万元整"
ComposingForm: ""
Electronic: false
IsDuplication: 1
Name: "XXXXXX公司"
NationalEmblem: true
Period: "0000年00月00日至0000年00月00日"
Person: "XXX"
QRCode: true
RecognizeWarnCode: [
]
RecognizeWarnMsg: [
]
RegNum: "000000000000000"
RegistrationAuthority: "XX省工商行政管理局"
RegistrationDate: "0000年00月"
RequestId: "5276ef57-3aa7-49f1-b064-dc6beb6a44e3"
Seal: true
SerialNumber: ""
SetDate: "0000年00月"
Title: "营业执照"
Type: "有限责任公司"

产品特征


在这里插入图片描述

产品体验:

在采用腾讯云智能结构化OCR产品的基础与高级版本进行营业执照识别时,我深刻体会到其高效与精准度。该产品能够迅速且准确地捕捉营业执照上的关键字段信息,涵盖了统一社会信用代码、公司名称、主体类型、法定代表人、注册资本、组成形式、成立日期、营业期限以及经营范围等多个重要细节。

行业案例


物流单据识别:

适用于各种版式不固定、版面复杂、中英文混排的场景,针对进出口物流、货代、进出口贸易的单据,完成高精度的结构化识别,跨境货代场景,快递&快运场景,国际贸易与采购等等

在这里插入图片描述

票据单据识别:

用于企业员工发票报销,通过 OCR 技术提取各种纸质发票、凭证上的发票号码、金额、发票代码等关键信息,支持数据录入和自动核对,减少人工校验成本。

在这里插入图片描述

总结


腾讯云通过持续的技术研发和创新,不断提升智能结构化OCR技术的准确性和效率。

其OCR技术能够高效地将身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息转化为可编辑、可搜索的数字文本,极大地便利了信息的处理和利用。而在给与用户们的体验也很不错,OCR将来定会为我们的生活带来更大便利。

在这里插入图片描述

相关文章:

玩转OCR | 探索腾讯云智能结构化识别新境界

📝个人主页🌹:Eternity._ 🌹🌹期待您的关注 🌹🌹 ❀ 玩转OCR 腾讯云智能结构化识别产品介绍服务应用产品特征行业案例总结 腾讯云智能结构化识别 腾讯云智能结构化OCR产品分为基础版与高级版&am…...

idea2024创建JavaWeb项目以及配置Tomcat详解

今天呢,博主的学习进度也是步入了JavaWeb,目前正在逐步杨帆旗航,迎接全新的狂潮海浪。 那么接下来就给大家出一期有关JavaWeb的配置教学,希望能对大家有所帮助,也特别欢迎大家指点不足之处,小生很乐意接受正…...

外连接转AntiJoin的应用场景与限制条件 | OceanBase SQL 查询改写系列

在《SQL 改写系列:外连接转内连接的常见场景与错误》一文中,我们了解到谓词条件可以过滤掉连接结果中的 null 情形的,将外连接转化为内连接的做法是可行的,正如图1中路径(a)所示。此时,敏锐的你或许会进一步思考&#…...

华为实训课笔记 2024 1223-1224

华为实训 12/2312/24 12/23 [Huawei]stp enable --开启STP display stp brief --查询STP MSTID Port Role STP State Protection 实例ID 端口 端口角色 端口状态 是否开启保护[Huawei]display stp vlan xxxx --查询制定vlan的生成树计算结…...

MySQL超详细安装配置教程(亲测有效)

目录 1.下载mysql 2.环境配置 3.安装mysql ​4.navicat工具下载与连接 ​5总结 1.下载mysql mysql下载--MySQL :: 下载 MySQL 社区服务器 下载的时候这里直接逃过就行 我这里的版本是最新的mysql8.0.37 下载完成之后,将压缩包进行解压 这里我建议大…...

MySQL 8.0:explain analyze 分析 SQL 执行过程

介绍 MySQL 8.0.16 引入一个实验特性:explain formattree ,树状的输出执行过程,以及预估成本和预估返 回行数。在 MySQL 8.0.18 又引入了 EXPLAIN ANALYZE,在 formattree 基础上,使用时,会执行 SQL &#…...

信管通低代码信息管理系统应用平台

目前,国家统一要求事业单位的电脑都要进行国产化替代,替代后使用的操作系统都是基于linux的,所有以前在WINDOWS下运行的系统都不能使用了,再者,各单位的软件都很零散,没有统一起来。需要把日常办公相关的软…...

git推送本地仓库到远程(Gitee)

目录 一、注册创建库 二、创建仓库 三、推送本地仓库到远程 1.修改本地仓库用户名和邮箱 2.本地库关联远程仓库 3.拉取远程仓库的文件 4.推送本地库的文件 5.查看远程仓库 四、远程分支查看 1.查看远程分支 2.修改test.txt文件 一、注册创建库 Gitee官网&#xff1…...

【C++语言】多态

一、多态的概念 多态的概念:通俗来说,就是多种形态,具体点就是去完成某种行为,当不同的对象去完成时会产生出不同的状态。 我们可以举一个例子: 比如买票这种行为,当普通人买票时,是全价买票&am…...

ThinkPHP 吸收了Java Spring框架一些特性

ThinkPHP 吸收了Java Spring框架一些特性,下面介绍如下: 1、controller 控制器层 存放控制器层的文件,用于处理请求和响应 2、model 实体类 存放实体类的文件,用于定义数据模型 3、dao DAO层 存放DAO(数据访问…...

自动控制系统综合与LabVIEW实现

自动控制系统综合是为了优化系统性能,确保其可靠性、稳定性和灵活性。常用方法包括动态性能优化、稳态误差分析、鲁棒性设计等。结合LabVIEW,可以通过图形化编程、高效数据采集与处理来实现系统综合。本文将阐述具体方法,并结合硬件选型提供实…...

记录一个SVR学习

1、为什么使用jupter来做数据预测?而不是传统pycharm编辑器 1、Jupyter Notebook 通过anaconda统一管理环境,可以运行python、R、Sql等数据分析常用语言。 2、做到交互式运行,可以逐步运行代码块,实时查看结果,便于调…...

Java内存区域进一步详解

方法区 方法区属于是 JVM 运行时数据区域的一块逻辑区域,是各个线程共享的内存区域。 《Java 虚拟机规范》只是规定了有方法区这么个概念和它的作用,方法区到底要如何实现那就是虚拟机自己要考虑的事情了。也就是说,在不同的虚拟机实现上&am…...

SpiderFlow平台v0.5.0流程的执行过程

流程执行过程: 1. 流程启动 流程的执行通常从一个 开始节点 开始,该节点是整个爬虫任务的起点。开始节点没有实际的功能作用,主要作用是标记流程的起始。 执行顺序:在执行过程中,系统按照流程中的连接线顺序依次执行…...

利用.NET Upgrade Assitant对项目进行升级

本教程演示如何把WPF程序从 <TargetFrameworkVersion>v4.8</TargetFrameworkVersion>升级到<TargetFramework>net8.0-windows</TargetFramework>. 下载并安装.NET Upgrade Assistant - Visual Studio Marketplace Supported .NET upgrades: .NET Frame…...

JAVA开发Erp时日志报错:SQL 当 IDENTITY_INSERT 设置为 OFF 时,不能为表 ‘***‘ 中的标识列插入显式值

错误提示 ### SQL: INSERT INTO sys_user ( user_id, username, password, status, create_time, update_time ) VALUES ( ?, ?, ?, ?, ?, ? ) ### Cause: com.microsoft.sqlserver.jdbc.SQLServerException: 当 IDENTITY_INSERT 设置为 OFF 时&…...

[计算机网络]ARP协议的故事:小明找小红的奇妙旅程

1.ARP小故事 在一个繁忙的网络世界中&#xff0c;每个设备都有自己的身份标识——MAC地址&#xff0c;就像每个人的身份证号码一样。在这个故事里&#xff0c;我们的主角小明&#xff08;主机&#xff09;需要找到小红&#xff08;目标主机&#xff09;的MAC地址&#xff0c;才…...

数学竞赛网站:构建互动学习的网络平台

2.1 MYSQL数据库 题目确定了是一个应用程序之后&#xff0c;就开始按部就班的进行设计与分析。本课题是需要数据库作为数据管理工具以及数据载体&#xff0c;从程序功能分析到数据分析&#xff0c;选择合适的关系型数据库是当下所选择的重要环节。关系型数据库可选择余地不多&a…...

IntelliJ IDEA 快捷键大全:提升开发效率的利器

目录 一、基础快捷键 1. 文件操作快捷键 2. 编辑&#xff08;Editing&#xff09; 2.1 代码补全与导航 2.2 代码编辑 2.3 代码折叠与展开 3. 查找与替换 4. 调试 5. 版本控制 高级快捷键 重构快捷键&#xff1a;让代码更加优雅 导航快捷键&#xff1a;快速定位代码 …...

机器人角度参考方式

机器人的角度可以根据需求和系统设计来决定。通常情况下&#xff0c;机器人角度&#xff08;如航向角或偏航角&#xff09;有两种常见的参考方式&#xff1a; 参考开机时的 0&#xff1a;这是最常见的方式&#xff0c;机器人在开机时会将当前的方向作为 0&#xff08;即参考方向…...

通义千问2.5-7B电商推荐系统实战:3天上线完整部署流程

通义千问2.5-7B电商推荐系统实战&#xff1a;3天上线完整部署流程 电商平台每天面临海量用户和商品&#xff0c;如何实现精准推荐成为关键挑战。传统推荐系统开发周期长、成本高&#xff0c;而基于大模型的智能推荐方案正在改变这一现状。 1. 项目背景与价值 通义千问2.5-7B-I…...

Clawdbot汉化版代码实例:crontab定时任务+每日天气报告Telegram推送

Clawdbot汉化版代码实例&#xff1a;crontab定时任务每日天气报告Telegram推送 1. 项目概述与使用场景 Clawdbot汉化版是一个可以在微信、WhatsApp、Telegram等社交平台中使用的智能对话助手。与传统的在线AI服务不同&#xff0c;Clawdbot完全运行在用户自己的设备上&#xf…...

Fish-Speech 1.5 多语言语音合成实战:如何用 API 快速生成中日语语音(附完整代码示例)

Fish-Speech 1.5 多语言语音合成实战&#xff1a;从API调用到音色定制的完整指南 在数字内容创作和智能交互领域&#xff0c;多语言语音合成技术正成为打破沟通壁垒的关键工具。Fish-Speech 1.5作为新一代开源语音合成引擎&#xff0c;以其出色的多语言支持能力和灵活的API接口…...

Notepad--:Mac用户的跨平台文本编辑器终极指南

Notepad--&#xff1a;Mac用户的跨平台文本编辑器终极指南 【免费下载链接】notepad-- 一个支持windows/linux/mac的文本编辑器&#xff0c;目标是做中国人自己的编辑器&#xff0c;来自中国。 项目地址: https://gitcode.com/GitHub_Trending/no/notepad-- 还在为macOS…...

996引擎 - [开发辅助] 利用 robocopy 同步项目 dev 文件夹

996引擎 - [开发辅助] 利用 robocopy 同步项目 dev 文件夹 代码 git 管,资源统一放内网服务器。 使用以下脚本同步 岗位 同步方向 需求 策划 本地 >>> 内网服务器 提交资源 美术 本地 >>> 内网服务器 提交资源 程序 内网服务器 >>> 本地 拉取资源 …...

字节面试必看!3个真实场景教你搞定消息队列,小白也能收藏拿满分!

本文针对字节跳动面试中常见的消息队列问题&#xff0c;从实战角度出发&#xff0c;详细剖析了消息队列在解耦、异步、削峰等方面的应用场景。通过电商订单、秒杀等真实案例&#xff0c;阐述了如何用消息队列解决实际业务问题&#xff0c;并提供了应对面试官高频追问的满分答案…...

Windows安卓开发终极指南:一键安装ADB Fastboot驱动工具

Windows安卓开发终极指南&#xff1a;一键安装ADB Fastboot驱动工具 【免费下载链接】Latest-adb-fastboot-installer-for-windows A Simple Android Driver installer tool for windows (Always installs the latest version) 项目地址: https://gitcode.com/gh_mirrors/la/…...

Qwen3-TTS功能体验:除了文本转语音,还能用自然语言微调音色

Qwen3-TTS功能体验&#xff1a;除了文本转语音&#xff0c;还能用自然语言微调音色 1. 引言&#xff1a;重新定义语音合成的可能性 想象一下&#xff0c;你正在为一个游戏角色配音&#xff0c;需要一种"低沉沙哑的中年男性声音&#xff0c;带着些许疲惫和沧桑感"。…...

SDMatte Web服务稳定性测试:高并发请求下7860端口响应与错误率分析

SDMatte Web服务稳定性测试&#xff1a;高并发请求下7860端口响应与错误率分析 1. 测试背景与目标 SDMatte作为一款面向高质量图像抠图的AI模型&#xff0c;在实际生产环境中需要处理大量并发请求。本次测试旨在评估其Web服务在高并发场景下的稳定性表现&#xff0c;重点关注…...

电商卖家看过来!用Face3D.ai Pro低成本生成商品模特3D头像

电商卖家看过来&#xff01;用Face3D.ai Pro低成本生成商品模特3D头像 关键词&#xff1a;3D头像生成、电商模特、AI建模、低成本解决方案、Face3D.ai Pro 摘要&#xff1a;本文详细介绍如何利用Face3D.ai Pro为电商商品快速生成专业级3D模特头像&#xff0c;从系统部署到实际…...