当前位置：首页 > news >正文

机器学习笔记 - Ocr识别中的CTC算法原理概述

news 2026/5/11 6:16:29

一、文字识别

在文本检测步骤中，分割出了文本区域。现在需要识别这些片段中存在哪些文本。

机器学习笔记 - Ocr识别中的文本检测EAST网络概述-CSDN博客文章浏览阅读300次。在 EAST 网络的这个分支中，它合并了 VGG16 网络不同层的特征输出。现在，该层之后的特征大小将等于 pool4 层的输出，然后将两者合并到一层中。全卷积网络用于定位图像中的文本，该 NMS 阶段基本上用于将许多不精确检测到的文本框合并到每个文本区域（单词或行文本）的单个边界框中。幸运的是，可以使用预先训练的权重，可以从下面链接下载。EAST 架构是在考虑不同大小的字区域的情况下创建的。类似地，VGG16 模型其他层的输出被连接起来，最后，应用 Conv 3×3 层在输出层之前生成最终的特征映射层。https://skydance.blog.csdn.net/article/details/134481120 例如，请参见下图，其中左侧有片段，右侧有识别的文本。这就是我们想要的结果。

机器学习笔记 - Ocr识别中的CTC算法原理概述

一、文字识别

相关文章：

机器学习笔记 - Ocr识别中的CTC算法原理概述

系列二、Lock接口

JVM虚拟机：通过日志学习PS+PO垃圾回收器

从0开始学习JavaScript--JavaScript使用Promise

使用契约的链上限价订单

Iceberg学习笔记（1）—— 基础知识

springboot中动态api如何设置

Java —— 抽象类和接口

数字IC前端学习笔记：异步复位，同步释放

Linux内核移植之网络驱动更改说明一

邮件|gitpushgithub报错|Lombok注解

【前端知识】Node——events模块的相关方法

广州华锐互动VRAR | VR课件内容编辑器解决院校实践教学难题

Wireshark抓包：理解TCP三次握手和四次挥手过程

网络工程师-HCIA网课视频学习

【每日刷题——语音信号篇】

Linux进程通信——IPC、管道、FIFO的引入

数理统计的基本概念（一）

clickhouse分布式之弹性扩缩容的故事

数据结构--串的基本概念

太空采矿的工程挑战：从月球氦-3到小行星资源开采的现实路径

Python: Condition Variable Pattern

AI新闻链接汇总（2026-05-10）

Yeti自定义分析插件开发：实战创建恶意软件行为分析模块

本地化AI代码助手Refly：从部署到调优的完整实践指南

【2025最新】基于SpringBoot+Vue的汽车资讯网站管理系统源码+MyBatis+MySQL

“社恐”技术大牛周志明的写作哲学：如何像他一样，用开源文档和博客打造个人技术品牌

终极SOCD清理工具：Hitboxer让你的游戏操作精准如职业选手

OpenClaw插件实战：为Telegram审批消息添加一键操作按钮

Switch游戏文件管理的终极解决方案：5步掌握NSC_BUILDER批量处理技巧