当前位置: 首页 > news >正文

玩转OCR | 腾讯云智能结构化OCR初次体验

目录

一、什么是OCR(需要了解)

二、产品概述与核心优势

产品概述

智能结构化能做什么

举例说明(选看)

1、物流单据识别

2、常见证件识别 

3、票据单据识别

4、行业材料识别

三、产品特性

高精度

泛化性

易用性

四、产品实际测试与感受

证书识别

驾驶证识别

营业执照识别 

五、个人看法总结

一、什么是OCR(需要了解)

OCR又被称为光学字符识别技术,在数字化转型的浪潮中企业为了提高效率、降低成本的关键工具,而我们今天介绍的这款产品就是腾讯云推出的智能结构化OCR,它凭借其先进的技术和广泛的应用场景,正在推动跨行业高效精准的文档处理与数据提取新时代。

本文将全面介绍腾讯云智能结构化OCR的功能、技术优势、应用实践以及行业案例,帮助您深入了解并有效运用这一强大的工具。

二、产品概述与核心优势

产品概述

智能结构化(Smart Structure Optical Character Recognition )融合了业界领先的深度学习技术、图像检测技术以及OCR大模型能力,能够实现不限版式的结构化信息抽取。无论是固定卡证还是复杂的物流单据,均可实现智能识别。该产品预学习建立键值对应关系,支持客户定制模板,提升数据提取录入效率,适用于政务、票据核销、行业表单和国际物流等场景。

智能结构化能做什么

上传图片自动提取结构化信息,智能KV格式信息提取

  • 自动化识别千种版式的自动提取
  • 亿级调用经过大规模验证
  • 98%准确率高
  • 1API   1个API解决多种识别问题

举例说明(选看)

要识别的单据证照、不限定版式,智能结构化全搞定,6000+种版面的证照单据支持,无需集成多个接口,单一接口解决诸多证照单据识别问题

1、物流单据识别

适用于各种版式不固定、版面复杂、中英文混排的场景,针对进出口物流、货代、进出口贸易的单据,完成高精度的结构化识别:

  1. 跨境货代场景,涉及单据运单、海外发票、装箱单、提单、进出口报关单、托书、磅单、货物保险单、货运到达通知。
  2. 快递&快运场景,涉及单据:出货单、出库单、签回单。
  3. 国际贸易与采购,涉及单据:采购订单、海外发票、海关进口关税、原厂地证明、国际信用证书。

2、常见证件识别 

适用于各种个人企业证件的识别场景,针对下列典型版式统一、未定制的材料,可完成高精度识别结构化:

  1. 政务类个人证件,如:临时身份证、出生证、结婚证、军官证、警察证、残疾人证、导游证等。
  2. 教育类个人证件,如:学生证、四六级证、教师资格证、毕业证书、学位证、学历认证、办学许可证等。
  3. 交通类个人证件,如:道路运输证、从业资格证、网约车运输证、网约车驾驶证、临时车牌、车辆合格证等。
  4. 企业资质类证照,如:医疗许可证、食品经营许可证、药品生产许可证、烟草专卖许可证、运输许可证等。
  5. 其他单据材料,如:车险保单、快递运单、银行回单、商业汇票、磅单等。
3、票据单据识别

适用于各种票据单据的识别场景,针对下列典型版式统一、未定制的材料,可完成高精度识别结构化:

  1. 金融类票据单据,如:银行纸质回单、银行电子回单、大额汇兑凭证、代理记账许可证书、客户入账通知单等。
  2. 财务类报销单据,如:商品小票、支付截图凭证、滴滴行程单、酒店水单、海关缴纳书、商品订单页等。
  3. 运输类票据单据,如:报关单、运单、英文发票、英文小票、发货卸货单、采购单、配送单等。

4、行业材料识别

适用于细分行业领域各种特殊材料的识别场景,针对下列典型版式统一、未定制的材料,可完成短文本及表格的高精度结构化:

  1. 工业行业材料,如:商品标签、设备铭牌、价签等。
  2. 服务行业材料,如:合同、标书、车辆保险单据、彩票等。
  3. 医疗行业材料,如:药品说明书、出院记录、医院检验报告单等。

三、产品特性

高精度

泛化性

易用性

支持任意固定版式的卡证票据识别,各字段精度均处于业界领先水平,识别准确率达到90%以上。

支持多种常见固定版式的数据结构化提取,如警察证、教师资格证、道路运输证等,适用于多行业场景。

用户仅需简单的几步配置,即可定制个性化结构抽取方式,快速提取数据,无需训练,实现高效录入。

四、产品实际测试与感受

因为我是学生,所以我就简单的拿一个获奖证书来进行测试,简单测试一下该产品的识别效果和能力。

点击跳转到腾讯云OCR API

进行下面的操作(发起请求前需要确保是否已经开通了该服务

然后就可以了,选择你想要识别的图像,然后点击发起请求。

证书识别

这里我们可以看到识别的结果如下:

"Angle": 0,"RequestId": "e56fbd1d-d65e-41f6-ab62-b9f716e2152f","Title": "蓝桥杯大赛获奖证书","Name": "******",//这里我就不展示了"CertNumber": "******",//这里我就不展示了"IDNumber": "******",//这里我就不展示了"IssuingOrganization": "工业和信息化部人才交流中心","CompetitionCommittee": "蓝桥杯大赛组委会","Date": "2023年4月23日","Seal": true,"QRCode": true,"RecognizeWarnCode": [],"RecognizeWarnMsg": [],"RegistrationAuthority": "工业和信息化部人才交流中心","RegistrationDate": "2023年4月23日","SetDate": "2023年4月23日","IsDuplication": 1

 调用实例代码


package mainimport ("fmt""github.com/tencentcloud/tencentcloud-sdk-go/tencentcloud/common""github.com/tencentcloud/tencentcloud-sdk-go/tencentcloud/common/errors""github.com/tencentcloud/tencentcloud-sdk-go/tencentcloud/common/profile"ocr "github.com/tencentcloud/tencentcloud-sdk-go/tencentcloud/ocr/v20181119"
)func main() {// 实例化一个认证对象,入参需要传入腾讯云账户 SecretId 和 SecretKey,此处还需注意密钥对的保密// 代码泄露可能会导致 SecretId 和 SecretKey 泄露,并威胁账号下所有资源的安全性。以下代码示例仅供参考,建议采用更安全的方式来使用密钥,请参见:https://cloud.tencent.com/document/product/1278/85305// 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取credential := common.NewCredential("SecretId","SecretKey",)// 实例化一个client选项,可选的,没有特殊需求可以跳过cpf := profile.NewClientProfile()cpf.HttpProfile.Endpoint = "ocr.tencentcloudapi.com"// 实例化要请求产品的client对象,clientProfile是可选的client, _ := ocr.NewClient(credential, "", cpf)// 实例化一个请求对象,每个接口都会对应一个request对象request := ocr.NewRecognizeGeneralTextImageWarnRequest()// 返回的resp是一个RecognizeGeneralTextImageWarnResponse的实例,与请求对象对应response, err := client.RecognizeGeneralTextImageWarn(request)if _, ok := err.(*errors.TencentCloudSDKError); ok {fmt.Printf("An API error has returned: %s", err)return}if err != nil {panic(err)}// 输出json格式的字符串回包fmt.Printf("%s", response.ToJsonString())
} 
驾驶证识别

调试API后,系统返回处理成功的响应,并提供识别后的驾驶证内容,识别结果示例如下: 

Address: "广东省深圳市南山区腾讯大厦"
ArchivesCode: ""
BackPageCardCode: ""
BackPageName: ""
CardCode: "440305198305101408"
Class: "C2"
CumulativeScore: ""
CurrentTime: ""
DateOfBirth: "1983-05-10"
DateOfFirstIssue: "2005-05-01"
DriverLicenseType: "Normal"
EndDate: "2025-10-01"
GenerateTime: ""
IssuingAuthority: "上海市公安局交通警察总队"
Name: "刘洋"
Nationality: "中国"
RecognizeWarnCode: [
]
RecognizeWarnMsg: [
]
Record: ""
RequestId: "6c156215-4f2c-42b4-b41d-ffd8cff488bb"
Sex: "女"
StartDate: "2015-10-01"
State: ""
营业执照识别 

 调试API后,系统返回处理成功的响应,并提供识别后的营业执照内容,识别结果示例如下: 

Address: "深圳市南山区高新区高新南一路飞亚达大厦"
Angle: 0.09112373739480972
Business: "计算机软、硬件的设计、技术开发、销售(不含专营、专控、专卖商品及限制项目);数据库及计算机网络服务;国内商业、物资供销业(不含专营、专控、专卖商品)"
Capital: "人民币柒仟万"
ComposingForm: ""
Electronic: false
IsDuplication: 1
Name: "杭州市魔乐计算机有限公司"
NationalEmblem: true
Period: "1998年11月至长期"
Person: "毛华"
QRCode: true
RecognizeWarnCode: [
]
RecognizeWarnMsg: [
]
RegNum: "110000012345678"
RegistrationAuthority: "广东省工商行政管理局"
RegistrationDate: "1998年11月13日"
RequestId: "0dd108d7-28bb-435f-b9fa-27e6a9d6cb32"
Seal: true
SerialNumber: ""
SetDate: "1998年11月"
Title: "营业执照"
Type: "有限责任公司"

五、个人看法总结

腾讯云提供的产品,识别能力和效果都是不错的,感兴趣的话可以试试。

参考资料

  • 腾讯云 智能结构化OCR产品官网
  • 腾讯云 OCR技术文档
  • 腾讯云 OCR API 接口文档
  • 腾讯云 OCR API 在线调用页面
  • 腾讯云 OCR 体验 Demo
  • 腾讯云 Smart OCR 产品页

相关文章:

玩转OCR | 腾讯云智能结构化OCR初次体验

目录 一、什么是OCR(需要了解) 二、产品概述与核心优势 产品概述 智能结构化能做什么 举例说明(选看) 1、物流单据识别 2、常见证件识别 3、票据单据识别 4、行业材料识别 三、产品特性 高精度 泛化性 易用性 四、…...

记一次 dockerfile 的循环依赖错误

文章目录 1. 写在最前面1.1 具体循环依赖的例子 2. 报错的位置2.1 代码快速分析2.2 代码总结2.3 关于 parser 的记录 3. 碎碎念 1. 写在最前面 笔者在使用 dockerfile 多阶段构建的功能时,写出了一个「circular dependency detected on stage: xx」的错误。 解决方…...

Trimble天宝X9三维扫描仪为建筑外墙检测提供了全新的解决方案【沪敖3D】

随着城市化进程的快速推进,城市高层建筑不断增多,对建筑质量的要求也在不断提高。建筑外墙检测,如平整度和垂直度检测,是衡量建筑质量的重要指标之一。传统人工检测方法不仅操作繁琐、效率低下,还难以全面反映墙体的真…...

【MySQL】深度学习数据库开发技术:使用CC++语言访问数据库

**前言:**本节内容介绍使用C/C访问数据库, 包括对数据库的增删查改操作。 主要是学习一些接口的调用, 废话不多说, 开始我们的学习吧! ps:本节内容比较容易, 友友们放心观看哦! 目录 准备mysql…...

LabVIEW化工实验室设备故障实时监测

化工实验室中,各类设备的运行状态直接影响实验的精度与安全性。特别是重要分析仪器的突发故障,可能导致实验中断或数据失效。为了实现设备运行状态的实时监控与故障快速响应,本文提出了一套基于LabVIEW的解决方案,通过多参数采集、…...

单例模式懒汉式、饿汉式(线程安全)

饿汉式单线程安全吗 饿汉式单例(Eager Singleton)是线程安全的。这种实现方式在类加载时就创建了单例实例,因此在多线程环境中,不存在多个线程同时创建实例的问题。 饿汉式单例的实现 以下是一个饿汉式单例的示例: …...

Cursor登录按钮点击没反应

问题 系统:Windows11 Cursor:Cursor 0.44.9 当安装Cursor打开进行登录时,点击Sign in没反应 解决方案 1.打开window11的设置 2.点击应用中的默认应用 3.在设置应用程序的默认值中搜索Google(没有Google浏览器的尝试下载一个&a…...

论文实现:Reactive Nonholonomic Trajectory Generation via Parametric Optimal Control

1. 多项式螺旋 曲率: κ ( s ) a 0 a 1 s a 2 s 2 a 3 s 3 a 4 s 4 a 5 s 5 \begin{align} \kappa(s) a_0 a_1s a_2s^2 a_3s^3 a_4s^4 a_5s^5 \end{align} κ(s)a0​a1​sa2​s2a3​s3a4​s4a5​s5​​ 机器人朝向: θ ( s ) a 0 s a 1 …...

基于单片机中药存放环境监测系统的实现

基于单片机中药存放环境监测系统的实现 项目开发背景 随着现代中药的广泛应用,中药材的存储环境对其质量有着至关重要的影响。温湿度、烟雾、火灾等环境因素,若不加以控制,将会导致中药材失效或变质。因此,设计一个基于单片机的…...

九垠赢+商业管理系统 Common.ashx 文件上传致RCE漏洞复现

0x01 产品简介 九垠赢+商业管理系统是基于互联网技术的进销存管理软件,适用于新零售背景下各种业态的线上线下一体化的商超经营管理。赢+ERP以商业管理系统为底座,融合了多种软、硬件解决方案,实现了从企业、供应商、三方平台到顾客等日常管理的全线数字化、智能化和移动化…...

速盾:服务器CDN加速解析的好处有哪些呢?

随着互联网应用的普及,越来越多的企业开始关注如何提升网站的访问速度和用户体验。为了实现这一目标,许多企业选择使用CDN(内容分发网络)来加速网站的内容分发。CDN通过在全球范围内分布多个节点,将内容缓存到离用户最…...

C++ 设计模式:备忘录模式(Memento Pattern)

链接:C 设计模式 链接:C 设计模式 - 状态模式 备忘录模式(Memento Pattern)是一种行为设计模式,它允许在不破坏封装性的前提下捕获和恢复对象的内部状态。这个模式在需要保存和恢复对象状态的场景中非常有用&#xff…...

Android 系统 Activity 系统层深度定制的方法、常见问题以及解决办法

Android 系统 Activity 系统层深度定制的方法、常见问题以及解决办法 目录 引言Activity 系统层概述Activity 系统架构图Activity 系统层深度定制的方法 4.1 自定义 Activity 生命周期4.2 自定义 Activity 启动流程4.3 自定义 Activity 转场动画4.4 自定义 Activity 窗口管理4…...

PDF怎么压缩得又小又清晰?5种PDF压缩方法

PDF 文件在日常办公与学习中使用极为频繁,可想要把它压缩得又小又清晰却困难重重。一方面,PDF 格式本身具有高度兼容性,集成了文字、图像、矢量图等多样元素,压缩时难以兼顾不同元素特性,稍不注意,文字就会…...

YK人工智能(三)——万字长文学会torch深度学习

2.1 张量 本节主要内容: 张量的简介PyTorch如何创建张量PyTorch中张量的操作PyTorch中张量的广播机制 2.1.1 简介 几何代数中定义的张量是基于向量和矩阵的推广,比如我们可以将标量视为零阶张量,矢量可以视为一阶张量,矩阵就是…...

关于CISP报名费用详情

CISP即“注册信息安全专业人员”,是中国信息安全测评中心实施的国家认证项目,旨在培养信息安全领域的专业人才。对于有意报考CISP的考生而言,了解报名考试费用是备考过程中不可或缺的一环。 CISP的报名考试费用主要包括培训费用、考试费用、…...

vim 按下esc后取消高亮

配置 ideavimrc文件 " 按下 Esc 键时自动取消高亮 " 在普通模式下按下 Esc 键取消高亮 nnoremap <Esc> :nohlsearch<CR> " 在插入模式下按下 Esc 键取消高亮 inoremap <Esc> <Esc>:nohlsearch<CR>" 额外&#xff1a;当退出…...

SwiftUI:多语言实现富文本插值

实现的UI需求&#xff1a; 要求&#xff1a; 英文显示&#xff1a;3068 people have joined this plan today! 中文显示&#xff1a;今日有 3068 人已加入此计划&#xff01; 实现代码&#xff1a; Text(AttributedString(localized:"**\(payPeoples)** people have joi…...

操作系统基础

概念 控制和管理操作系统软件和硬件 用户观点&#xff1a;用户和计算机之间的接口 基本概念 特征 并发&#xff0c;共享&#xff0c;虚拟&#xff0c;异步 功能 处理机管理&#xff0c;存储器管理&#xff0c;文件管理&#xff0c;设备管理 作为用户和硬件接口 命令接口&am…...

函数调用流程可用工具

方法 1、gdb&#xff0c;这个网上很多找找就有 2、tcmalloc&#xff0c;直接在调用的地方调一个malloc就可以看到调用的流程&#xff0c;具体见tcmalloc 3、backtrace&#xff0c;个人感觉这么最方便&#xff0c;具体见backtrace...

在HarmonyOS ArkTS ArkUI-X 5.0及以上版本中,手势开发全攻略:

在 HarmonyOS 应用开发中&#xff0c;手势交互是连接用户与设备的核心纽带。ArkTS 框架提供了丰富的手势处理能力&#xff0c;既支持点击、长按、拖拽等基础单一手势的精细控制&#xff0c;也能通过多种绑定策略解决父子组件的手势竞争问题。本文将结合官方开发文档&#xff0c…...

《通信之道——从微积分到 5G》读书总结

第1章 绪 论 1.1 这是一本什么样的书 通信技术&#xff0c;说到底就是数学。 那些最基础、最本质的部分。 1.2 什么是通信 通信 发送方 接收方 承载信息的信号 解调出其中承载的信息 信息在发送方那里被加工成信号&#xff08;调制&#xff09; 把信息从信号中抽取出来&am…...

自然语言处理——循环神经网络

自然语言处理——循环神经网络 循环神经网络应用到基于机器学习的自然语言处理任务序列到类别同步的序列到序列模式异步的序列到序列模式 参数学习和长程依赖问题基于门控的循环神经网络门控循环单元&#xff08;GRU&#xff09;长短期记忆神经网络&#xff08;LSTM&#xff09…...

使用 SymPy 进行向量和矩阵的高级操作

在科学计算和工程领域&#xff0c;向量和矩阵操作是解决问题的核心技能之一。Python 的 SymPy 库提供了强大的符号计算功能&#xff0c;能够高效地处理向量和矩阵的各种操作。本文将深入探讨如何使用 SymPy 进行向量和矩阵的创建、合并以及维度拓展等操作&#xff0c;并通过具体…...

rnn判断string中第一次出现a的下标

# coding:utf8 import torch import torch.nn as nn import numpy as np import random import json""" 基于pytorch的网络编写 实现一个RNN网络完成多分类任务 判断字符 a 第一次出现在字符串中的位置 """class TorchModel(nn.Module):def __in…...

Angular微前端架构:Module Federation + ngx-build-plus (Webpack)

以下是一个完整的 Angular 微前端示例&#xff0c;其中使用的是 Module Federation 和 npx-build-plus 实现了主应用&#xff08;Shell&#xff09;与子应用&#xff08;Remote&#xff09;的集成。 &#x1f6e0;️ 项目结构 angular-mf/ ├── shell-app/ # 主应用&…...

PAN/FPN

import torch import torch.nn as nn import torch.nn.functional as F import mathclass LowResQueryHighResKVAttention(nn.Module):"""方案 1: 低分辨率特征 (Query) 查询高分辨率特征 (Key, Value).输出分辨率与低分辨率输入相同。"""def __…...

Java数值运算常见陷阱与规避方法

整数除法中的舍入问题 问题现象 当开发者预期进行浮点除法却误用整数除法时,会出现小数部分被截断的情况。典型错误模式如下: void process(int value) {double half = value / 2; // 整数除法导致截断// 使用half变量 }此时...

C#学习第29天:表达式树(Expression Trees)

目录 什么是表达式树&#xff1f; 核心概念 1.表达式树的构建 2. 表达式树与Lambda表达式 3.解析和访问表达式树 4.动态条件查询 表达式树的优势 1.动态构建查询 2.LINQ 提供程序支持&#xff1a; 3.性能优化 4.元数据处理 5.代码转换和重写 适用场景 代码复杂性…...

宇树科技,改名了!

提到国内具身智能和机器人领域的代表企业&#xff0c;那宇树科技&#xff08;Unitree&#xff09;必须名列其榜。 最近&#xff0c;宇树科技的一项新变动消息在业界引发了不少关注和讨论&#xff0c;即&#xff1a; 宇树向其合作伙伴发布了一封公司名称变更函称&#xff0c;因…...