深眸科技革新升级OCR技术,与AI视觉实现有效融合赋能各行业应用
OCR即光学字符识别,是通过扫描仪或工业相机等电子设备检查打印的字符,并通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
目前,随着机器视觉和人工智能技术的进一步升级,OCR技术实现了与AI视觉的有效融合,在工业领域的实际生产应用中发挥着越来越重要的作用,包括在食品、医药、电力、消费电子等众多行业中具备良好的应用效果。
字符识别流程
图像预处理
目的:提高图像质量,从而提高OCR的准确性。
常见的图像预处理操作包括灰度化、二值化、降噪和图像增强等。
文字分割
目的:将图像中的文字区域切割出来,便于后续的文字识别。
文字分割可通过基于连通区域的方法或基于深度学习的方法实现。
文字识别
目的:将区域中的文字内容转化为计算机可识别的字符编码。
文字识别可以通过模版匹配的方法或基于深度学习的方法实现。
后处理
目的:进一步提高OCR的准确性,去除识别结果中的错误信息。
常见的后处理操作包括纠错、排版和格式化等。
场景复杂多样 字符识别难题凸显
在实际生产中,众多场景需要用OCR技术实现对印刷字符的检测,包括自动化设备控制、产品品质控制和物流控制等识别场景,但由于这些识别场景复杂多样,想要进一步提升字符识别应用效果往往面临困难。
高效率难题
由于生产工艺的影响,字符标签往往存在印刷模糊、歪斜、污染、破损等问题,导致检测效率较低。
高通用性难题
对于字符的检测包括不同种语言文字、数字、符号等繁杂的字符组合以及条形码、二维码等不同码制。
生产环境难题
识别过程容易受生产环境、产品品质和工艺、拍摄角度等影响,从而出现字符图像不清晰、畸形、缺失等情况。
研发难题
OCR在复杂场景的应用部署需要研发人员的深度参与,还需要字符样本深度学习训练、反复调参,操作门槛较高。
综上所述,在复杂多样的识别场景中,传统OCR技术面临多重难题,为实现缺陷字符的进一步检出,各制造厂商开始运用AI+机器视觉检测技术,对出厂前产品进行更严格检测,包括根据不同的产品材料、缺陷情况和客户需求,使用不同的光源、不同照射角度和不同像素的工业相机,对被识别字符的缺陷和复杂背景进行区分,最后利用缺陷图像的颜色、灰度、形状、大小等来识别。
技术革新升级 深度学习与OCR有效融合
随着字符识别技术加速渗透工业领域,作为机器视觉前沿技术的引领者,深眸科技坚持对OCR技术的革新升级,通过将深度学习与字符识别技术有效融合,全面赋能各行业应用。
深眸科技创新研发的轻辙标注训练平台,通过字符识别模块配合具备较高精度的工业相机拍摄取图,集推、训、测、转一体,能够在字符复杂、环境干扰等情况下,实现全场景、复杂条件下的字符识别。
通过深度学习算法,轻辙标注训练平台能够助力OCR技术能实现更高的识别精度和速度,并精准且快速完成因生产工艺导致的字符标签印刷模糊、歪斜、污染、破损等缺陷的检出,从而满足字符识别的高效率要求;轻辙标注训练平台还能通过自主学习各类工业场景中不同类型的字符,包括不同种语言文字、数字、符号等繁杂的字符组合以及条形码、二维码等不同码制,进一步提升了在字符识别场景中的通用能力。
深眸落地案例 OCR技术在各行业的应用
医药行业 · 药盒OCR检测
项目背景:
对于小盒装产品医药行业往往会将数个产品用透明塑料薄膜先包裹在进行装箱。塑料薄膜存在反光、多层堆叠(降低了字符的对比度)现象,会对字符识别产生严重的干扰。
检测难点:
· 多个产品多行字符
· 需要实现较高的识别准确率
· 塑料薄膜存在反光、堆叠对识别产生影响
解决方案:
深眸科技在此项目中,通过工业相机拍摄取图,以OCR技术加持,系统能够排除反光、堆叠等因素的干扰,提取分析并比较药盒生产日期、二维码等字符的完整性、正确性和是否存在缺失,当检测到问题时,发出信号给剔除装置并警报提示。
医药行业 · 药盒OCR检测项目
电力行业 · 电力线路杆号牌分拣
项目背景:
线路塔杆的杆号牌是线路杆塔的“身份证”,担负着宣传电力知识、安全警示的作用,杆号牌的字迹模糊、脱落等现象,给线路巡视检修、故障抢修等工作带来许多潜在隐患。
检测难点:
· 杆号牌字符不确定,无法预置字符库方式建立图像字符模版
· 字符方向与来料多样,存在相近字符的干扰
· 字符存在挤压变形,影响字符输出
解决方案:
深眸科技自研的轻辙标注训练平台,能够通过搭配文本检测算法与优化SVTR文本识别、文本方向分类器、文本尺度修正等算法,规范字符在尺度处理上的统一性。同时满足客户快速换型生产要求,在部分字符缺损、漏检、小数点符号干扰的情况下,对所有字符联想检出。
电力行业 · 电力线路杆号牌分拣项目
消费电子行业 · OCR错漏检测
项目背景:
空调内机外壳的品牌LOGO以及商标丝印在生产时会有缺损和错误的情况,同时装配阶段也会发生混料现象。由于生产量巨大,人工质检已经不能满足生产效率。
检测难点:
· 多种不同型号产品
· 商标丝印各不相同,软件切换时间短
· 单位检测时间需要判断多个图像特征
· 缺陷类型多样,产品成像角度不稳定
解决方案:
深眸科技的轻辙标注训练平台通过自研算法,能够秒级切换不同产品型号生产,还能动态判断产品字符内容,并以高性能软件架构实现效率提升,实现空调内机外壳品牌LOGO和商标丝印等字符的精准识别。
消费电子行业 · OCR错漏检测项目
相关文章:

深眸科技革新升级OCR技术,与AI视觉实现有效融合赋能各行业应用
OCR即光学字符识别,是通过扫描仪或工业相机等电子设备检查打印的字符,并通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。 目前,随着机器视觉和人工智能技术的进一步升级,OCR技术实…...

性能测试知多少---系统架构分析
之前有对性能需求进行过分析,那篇主要从项目业务、背景等角度如何抽丝剥茧的将项目的需求抽离出来。在我们进行需求的时候也需要对被测项目的架构有一定的认识,如果不了解被测系统的架构,那么在后期的性能分析与调优阶段将无从下手。 简单系…...

【观察】华为:数智世界“一触即达”,应对数智化转型“千变万化”
毫无疑问,数智化既是这个时代前进所趋,也是国家战略所指,更是所有企业未来发展进程中达成的高度共识。 但也要看到,由于大量新兴技术的出现,技术热点不停的轮转,加上市场环境的快速变化,让数智化…...

我的 2023 秋招总结,拿到了大厂offer
2023秋招小结 前言 & 介绍 作为2024年毕业的学生,在2023年也就是今年秋招。 现在秋招快结束了,人生可能没有几次秋招的机会(应该就一次,最多两次吧哈哈),也有一点感悟,所以小小总结一下。…...
力扣labuladong——一刷day36
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、力扣230. 二叉搜索树中第K小的元素二、力扣538. 把二叉搜索树转换为累加树三、力扣1038. 从二叉搜索树到更大和树 前言 首先,BST 的特性大家应该…...

解锁编程潜能:探索亚马逊CodeWhisperer,打造编程世界的声音引导者
文章目录 前言一、什么是 Amazon CodeWhisperer?二、如何使用CodeWhisperer?安装CodeWhisperer插件配置CodeWhisperer生成注释和文档 总结 前言 随着CHATGPT的一声巨响,大语言模型已经成为了一个备受瞩目的创新应用。亚马逊云科技作为全球领…...
01_面向对象高级_static
Static static 的中文意思是"静态",它可以修饰成员变量、成员方法 1. Static 修饰成员变量 static 修饰的成员变量,也称之为"类变量"类变量它是属于类的,与类一起加载,在内存中只有一份,会被类…...

双写绕过 [极客大挑战 2019]BabySQL 1
打开题目 随便输入账号密码 根据报错信息可知这是单引号的字符型注入 那我们试试万能密码 1 or 11 页面报错 1 or 11 页面报错 而且根据报错内容显示是没有我们注入上去的or的 那我们就试试 1 order by 3 # 页面报错,根据报错显示页面过滤掉了or和by 那我们…...
uni.app 使用 mixins 技术统一注入小程序页面分享到好友,分享朋友圈功能
uni.app 使用 mixins 技术统一注入小程序页面分享到好友,分享朋友圈功能 1. 在utils文件夹下创建share.js2. 为所有页面挂载3.单独页面使用 1. 在utils文件夹下创建share.js export default{data(){return {// 默认全局分享内容mixinsShare:{title:首页, //分享标题path:/pag…...

贝叶斯AB测试
AB测试是用来评估变更效果的有效方法,但很多时候会运行大量AB测试,如果能够在测试中复用之前测试的结果,将有效提升AB测试的效率和有效性。原文: Bayesian AB Testing[1] 随机实验,又称AB测试,是行业中评估因果效应的既…...

信息检索与数据挖掘 | 【实验】检索评价指标MAP、MRR、NDCG
文章目录 📚实验内容📚知识梳理📚实验步骤🐇前情提要🐇MAP评价指标函数🐇MRR 评价指标函数🐇NDCG评价指标函数🐇调试结果 📚实验内容 实现以下指标评价,并对…...
读书笔记:彼得·德鲁克《认识管理》第24章 管理岗位的设计与内容
一、章节内容概述 管理岗位应该始终基于必要的任务,应该是一份实实在在的工作,为企业的整体目标做出可见的(如果不是可衡量的话)贡献,还应该具有尽可能广泛的权威和范围。管理者应该接受绩效目标而不是上级领导 的指导和控制。在设计管理岗位…...

某60区块链安全之51%攻击实战学习记录
区块链安全 文章目录 区块链安全51%攻击实战实验目的实验环境实验工具实验原理攻击过程 51%攻击实战 实验目的 1.理解并掌握区块链基本概念及区块链原理 2.理解区块链分又问题 3.理解掌握区块链51%算力攻击原理与利用 4.找到题目漏洞进行分析并形成利用 实验环境 1.Ubuntu1…...

为什么原生IP可以降低Google play账号关联风险?企业号解决8.3/10.3账号关联问题?
在Google paly应用上架的过程中,相信大多数开发者都遇到过开发者账号因为关联问题,导致应用包被拒审和封号的情况。 而众所周知,开发者账号注册或登录的IP地址及设备是造成账号关联的重要因素之一。酷鸟云最新上线的原生IP能有效降低账号因I…...
排列组合C(n,m)和A(n,m)理解及代码实现
排列组合C(n,m)和A(n,m)理解及代码实现-CSDN博客...
EasyExcel导入从第几行开始
//获得工作簿 read EasyExcel.read(inputStream, Student.class, listener); //获得工作表 又两种形形式可以通过下标也可以通过名字2003Excel不支持名字 ExcelReaderSheetBuilder sheet read.sheet(); sheet.headRowNumber(2);...

均匀光源积分球的应用领域有哪些
均匀光源积分球的主要作用是收集光线,并将其用作一个散射光源或用于测量。它可以将光线经过积分球内部的均匀分布后射出,因此积分球也可以当作一个光强衰减器。同时,积分球可以实现均匀的朗伯体漫散射光源输出,整个输出口表面的亮…...

【LeetCode】每日一题 2023_11_18 数位和相等数对的最大和(模拟/哈希)
文章目录 刷题前唠嗑题目:数位和相等数对的最大和题目描述代码与解题思路思考解法偷看大佬题解结语 刷题前唠嗑 LeetCode? 启动!!! 本月已经过半了,每日一题的全勤近在咫尺~ 题目:数位和相等数对的最大和…...
【喵叔闲扯】--迪米特法则
迪米特法则,也称为最少知识原则(Law of Demeter),是面向对象设计中的一个原则,旨在降低对象之间的耦合性,提高系统的可维护性和可扩展性。该原则强调一个类不应该直接与其它不相关的类相互交互,…...

企业视频数字人有哪些应用场景
来做个数字人吧,帮我干点活吧。 国内的一些数字人: 腾讯智影 腾讯智影数字人是一种基于人工智能技术的数字人物形象,具有逼真的外观、语音和行为表现,可以应用于各种场景,如新闻播报、文娱推介、营销、教育等。 幻…...

UE5 学习系列(二)用户操作界面及介绍
这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…...

Prompt Tuning、P-Tuning、Prefix Tuning的区别
一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning(提示调优) 核心思想:固定预训练模型参数,仅学习额外的连续提示向量(通常是嵌入层的一部分)。实现方式:在输入文本前添加可训练的连续向量(软提示),模型只更新这些提示参数。优势:参数量少(仅提…...

大型活动交通拥堵治理的视觉算法应用
大型活动下智慧交通的视觉分析应用 一、背景与挑战 大型活动(如演唱会、马拉松赛事、高考中考等)期间,城市交通面临瞬时人流车流激增、传统摄像头模糊、交通拥堵识别滞后等问题。以演唱会为例,暖城商圈曾因观众集中离场导致周边…...

Docker 运行 Kafka 带 SASL 认证教程
Docker 运行 Kafka 带 SASL 认证教程 Docker 运行 Kafka 带 SASL 认证教程一、说明二、环境准备三、编写 Docker Compose 和 jaas文件docker-compose.yml代码说明:server_jaas.conf 四、启动服务五、验证服务六、连接kafka服务七、总结 Docker 运行 Kafka 带 SASL 认…...

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility
Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility 1. 实验室环境1.1 实验室环境1.2 小测试 2. The Endor System2.1 部署应用2.2 检查现有策略 3. Cilium 策略实体3.1 创建 allow-all 网络策略3.2 在 Hubble CLI 中验证网络策略源3.3 …...

CMake 从 GitHub 下载第三方库并使用
有时我们希望直接使用 GitHub 上的开源库,而不想手动下载、编译和安装。 可以利用 CMake 提供的 FetchContent 模块来实现自动下载、构建和链接第三方库。 FetchContent 命令官方文档✅ 示例代码 我们将以 fmt 这个流行的格式化库为例,演示如何: 使用 FetchContent 从 GitH…...
关于 WASM:1. WASM 基础原理
一、WASM 简介 1.1 WebAssembly 是什么? WebAssembly(WASM) 是一种能在现代浏览器中高效运行的二进制指令格式,它不是传统的编程语言,而是一种 低级字节码格式,可由高级语言(如 C、C、Rust&am…...

华为云Flexus+DeepSeek征文|DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建
华为云FlexusDeepSeek征文|DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建 前言 如今大模型其性能出色,华为云 ModelArts Studio_MaaS大模型即服务平台华为云内置了大模型,能助力我们轻松驾驭 DeepSeek-V3/R1,本文中将分享如何…...
AspectJ 在 Android 中的完整使用指南
一、环境配置(Gradle 7.0 适配) 1. 项目级 build.gradle // 注意:沪江插件已停更,推荐官方兼容方案 buildscript {dependencies {classpath org.aspectj:aspectjtools:1.9.9.1 // AspectJ 工具} } 2. 模块级 build.gradle plu…...

Linux 内存管理实战精讲:核心原理与面试常考点全解析
Linux 内存管理实战精讲:核心原理与面试常考点全解析 Linux 内核内存管理是系统设计中最复杂但也最核心的模块之一。它不仅支撑着虚拟内存机制、物理内存分配、进程隔离与资源复用,还直接决定系统运行的性能与稳定性。无论你是嵌入式开发者、内核调试工…...