离线视频ocr识别
sudo apt-get install libleptonica-dev libtesseract-dev
sudo apt-get install tesseract-ocr-chi-sim
python -m pip install video-ocr
windows安装方法:
下载安装
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-5.3.3.20231005.exe
下载
wget https://github.com/simonflueckiger/tesserocr-windows_build/releases/download/tesserocr-v2.6.0-tesseract-5.3.1/tesserocr-2.6.0-cp311-cp311-win_amd64.whl
pip install tesserocr-2.6.0-cp311-cp311-win_amd64.whl
git clone https://github.com/PinkFloyded/video-ocr.git
cd video-ocr
notepad setup.py
去掉版本依赖,修改如下:
install_requires=["tesserocr","scipy","opencv-python","numpy","tqdm","click","Pillow",],
之后安装
python setup.py install
如果遇到
RuntimeError: Failed to init API, possibly an invalid tessdata path: ./
则需要设置环境变量TESSDATA_PREFIX为C:\Program Files\Tesseract-OCR\tessdata\
默认只能识别英文,所以要把包改掉
查看默认位置:
Python 3.10.12 (main, Jun 11 2023, 05:26:28) [GCC 11.4.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import video_ocr
>>> video_ocr.__file__
'/home/catcatyu/.local/lib/python3.10/site-packages/video_ocr.py'
>>>
nano /home/catcatyu/.local/lib/python3.10/site-packages/video_ocr.py
修改124行添加lang=chi_sim 参数。
def _ocr(frame):pil_image = Image.fromarray(frame.image)text = tesserocr.image_to_text(pil_image,lang="chi_sim") #这行frame.text = textpbar.update()return frame
之后使用
video-ocr --sample_rate 10 1.mp4
即可识别。
效果:


使用--sample_rate 参数可以提高精度数字越大越好
相关文章:
离线视频ocr识别
sudo apt-get install libleptonica-dev libtesseract-dev sudo apt-get install tesseract-ocr-chi-sim python -m pip install video-ocrwindows安装方法: 下载安装 https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-5.3.3.20231005.exe 下…...
双十一流量卡选购指南:不要只看月租,性价比高才是硬道理!
双十一来了,流量卡也推出了不少性价比较高的套餐,为了方便大家选择,这篇文章给大家推荐如何流量卡,希望大家都能够买到合适自己的流量卡,不该花的钱坚决不花! 这篇文章内容较多,请大家耐…...
时序预测 | MATLAB实现WOA-CNN-GRU-Attention时间序列预测(SE注意力机制)
时序预测 | MATLAB实现WOA-CNN-GRU-Attention时间序列预测(SE注意力机制) 目录 时序预测 | MATLAB实现WOA-CNN-GRU-Attention时间序列预测(SE注意力机制)预测效果基本描述模型描述程序设计参考资料 预测效果 基本描述 1.MATLAB实现…...
华为防火墙二层透明模式下双机热备负载分担配置(两端为路由器)
这种模式只做负载分担,不能是主备备份,因为主备备份模式下,备设备会把vlan down掉,如果是主备备份模式,那在主挂后,备的状态在切换过程中先起vlan,再建立ospf邻接,那业务会断线较久&…...
“基于RflySim平台飞控底层算法开发”系列专题培训 (第三期)
>> RflySim平台系列专题培训 RflySim平台是一个生态系统或工具链(官网:https://doc.rflysim.com),发起于北航可靠飞行控制研究组,主要用于遵循基于模型设计的思想进行无人系统的控制和安全测试。本平台选择MATL…...
Leetcode刷题详解——全排列 II
1. 题目链接:47. 全排列 II 2. 题目描述: 给定一个可包含重复数字的序列 nums ,按任意顺序 返回所有不重复的全排列。 示例 1: 输入:nums [1,1,2] 输出: [[1,1,2],[1,2,1],[2,1,1]]示例 2: 输…...
音频——解析 PCM 数据
文章目录 生成 PCM 数据16bit16bit mono16bit stereo16bit 4 channel16bit 8 channel24bit解析 PCM 数据解析 24bit 数据程序源码生成 PCM 源码解析 PCM 源码生成 PCM 数据 16bit 16bit mono int 48k_16bit_modo[] = {0, 4276, 8480, 12539, 16383, 19947, 23169, 25995, 28…...
win10 下 ros + Qt 工程CMakeLists.txt
win10 下 ros Qt 工程CMakeLists.txt 系统:win10 ros: melodic Qt: 5.12.12 源码目录: D:\workspace\catkin_qt 示例代码 https://github.com/ncnynl/ros-qt.git 由于示例代码是Qt4 ,目前我是用QT5,所以CMakeLists.txt 修改如下 CMakeLists.txt #####…...
Scala中编写多线程爬虫程序并做可视化处理
目录 一、引言 二、Scala爬虫程序的实现 1、引入必要的库 2、定义爬虫类 3、可视化处理 三、案例分析:使用Scala爬取并可视化处理电影数据 1、定义爬虫类 2、实现爬虫程序的控制逻辑 3、可视化处理电影数据 四、总结 一、引言 随着互联网的快速发展&#…...
使用 huggingface_hub 镜像下载 大模型
download.py 👇 import os # 配置 hf镜像 os.environ[HF_ENDPOINT] https://hf-mirror.com# 设置保存的路径 local_dir "XXXXXX"# 设置仓库id model_id "sensenova/piccolo-large-zh"cmd f"huggingface-cli download --resume-downlo…...
路径加密(替换空格),剑指offer,力扣
目录 我们直接看题解吧: 方法: 审题目事例提示: 解题思路: 法1: 代码(法1): 法2: 代码(法2): 原题解: 【剑指Offer】2、替…...
HarmonyOS开发:UI开展前的阶段总结
前言 关于HarmonyOS,陆陆续续总结了有14篇的文章,大家可以发现,没有一篇是关于UI相关的,不是自己没有分享的打算,而是对于这些UI而言,官方都有着一系列的文档输出,如果我再一一的分享࿰…...
Linux安装Libreoffice
windos安装Libreoffice https://zh-cn.libreoffice.org/ C:\路径\LibreOffice\program\soffice.bin --help 看是否输出帮助命令 Linux安装Libreoffice 1、下载rpm包并解压https://mirrors.cloud.tencent.com/libreoffice/libreoffice/stable/ 2、安装: yum install…...
如何将系统盘MBR转GPT?无损教程分享!
什么是MBR和GPT? MBR和GPT是磁盘的两种分区形式:MBR(主引导记录)和GPT(GUID分区表)。 新硬盘不能直接用来保存数据。使用前应将其初始化为MBR或GPT分区形式。但是,如果您在MBR时需…...
基于element-plus定义表单配置化
文章目录 前言一、配置化的前提二、配置的相关组件1、新建form.vue组件2、新建input.vue组件3、新建select.vue组件4、新建v-html.vue组件5、新建upload.vue组件6、新建switch.vue组件7、新建radio.vue组件8、新建checkbox.vue组件9、新建date.vue组件10、新建time-picker.vue组…...
LeetCode算法题解(贪心)|LeetCode122. 买卖股票的最佳时机 II、LeetCoed55. 跳跃游戏、LeetCode45. 跳跃游戏 II
一、LeetCode122. 买卖股票的最佳时机 II 题目链接:122. 买卖股票的最佳时机 II 题目描述: 给你一个整数数组 prices ,其中 prices[i] 表示某支股票第 i 天的价格。 在每一天,你可以决定是否购买和/或出售股票。你在任何时候 …...
计蒜客详解合集(2)期
目录 T1126——单词倒排 T1617——地瓜烧 T1612——蒜头君的数字游戏 T1488——旋转单词 T1461——校验信用卡号码 T1437——最大值和次大值 T1126——单词倒排 超级水的一道题,和T1122类似但更简单,分割后逆序输出即可~ 编写程序,读入…...
华为防火墙vrrp+hrp双机热备主备备份(两端为交换机)
默认上下来全两个vrrp主都是左边 工作原理: vrrp刚开机都是先initialize状态,然后切成active或standb状态。 hrp使用18514端口,且用的单播,要策略放行,由主设备发hrp心跳报文 如果设备为acitve状态时自动优先级为65…...
Angular 由一个bug说起之一:List / Grid的性能问题
在angular中,MatTable构建简单,使用范围广。但某些时候会出现卡顿 卡顿情景: 1:一次性请求太多的数据 2:一次性渲染太多数据,这会花费CPU很多时间 3:行内嵌套复杂的元素 4:使用过多的…...
第12章 PyTorch图像分割代码框架-3:推理与部署
推理模块 模型训练完成后,需要单独再写一个推理模块来供用户测试或者使用,该模块可以命名为test.py或者inference.py,导入训练好的模型文件和待测试的图像,输出该图像的分割结果。inference.py主体部分如代码11-7所示。 代码11-7 …...
Unity新手避坑指南:用OnMouseOver做悬停UI,为什么你的提示框总‘鬼畜’抖动?
Unity悬停UI优化实战:告别抖动提示框的5个关键策略 当你在Unity中实现鼠标悬停提示功能时,是否遇到过提示框像"打地鼠"一样疯狂抖动的尴尬场景?这种看似简单的交互效果背后,隐藏着Unity事件系统、坐标转换和渲染管线的复…...
深入理解ESP32 BLE扫描:从扫描间隔、窗口到白名单,如何优化你的设备发现策略?
ESP32 BLE扫描性能优化实战:从参数调优到智能过滤策略 在物联网设备爆炸式增长的今天,BLE(低功耗蓝牙)技术已成为连接智能设备的首选方案之一。作为开发者,我们经常面临一个核心挑战:如何在资源受限的嵌入式…...
网易云音乐NCM格式转换终极指南:5分钟实现音乐自由播放
网易云音乐NCM格式转换终极指南:5分钟实现音乐自由播放 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 还在为下载的网易云音乐只能在官方客户端播放而烦恼吗?NCM格式转换工具为你带来真正的音乐自由解决方案…...
如何高效管理多平台云存储:网盘直链下载助手完全指南
如何高效管理多平台云存储:网盘直链下载助手完全指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云…...
# 微前端架构下的 Vue 项目实战:从零搭建可扩展的模块化系统在现代前端工程中,**微前端架构(Micro-Fro
微前端架构下的 Vue 项目实战:从零搭建可扩展的模块化系统 在现代前端工程中,微前端架构(Micro-Frontends) 正逐渐成为大型单页应用(SPA)治理的核心方案。它通过将一个庞大的前端应用拆分为多个独立部署、运…...
百度网盘链接解析终极指南:3个高效策略突破下载限制
百度网盘链接解析终极指南:3个高效策略突破下载限制 【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址 项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 百度网盘解析工具是一款开源工具,专为获取百度网盘…...
CefFlashBrowser完整指南:如何在2024年完美运行Flash游戏和内容
CefFlashBrowser完整指南:如何在2024年完美运行Flash游戏和内容 【免费下载链接】CefFlashBrowser Flash浏览器 / Flash Browser 项目地址: https://gitcode.com/gh_mirrors/ce/CefFlashBrowser 还在为Flash内容无法在现代浏览器中播放而烦恼吗?C…...
Gemma-3-12b-it多模态工具DevOps:Prometheus监控+Grafana看板
Gemma-3-12b-it多模态工具DevOps:Prometheus监控Grafana看板 1. 项目概述 Gemma-3-12b-it是基于Google最新大模型开发的多模态交互工具,专为本地化部署场景设计。该工具通过深度CUDA优化实现了12B参数模型的高效运行,支持图文混合输入与流式…...
Calibre中文路径保护插件:终极解决方案告别拼音路径困扰
Calibre中文路径保护插件:终极解决方案告别拼音路径困扰 【免费下载链接】calibre-do-not-translate-my-path Switch my calibre library from ascii path to plain Unicode path. 将我的书库从拼音目录切换至非纯英文(中文)命名 项目地址:…...
计算机网络知识应用:优化DeOldify分布式集群的内部通信效率
计算机网络知识应用:优化DeOldify分布式集群的内部通信效率 最近在帮一个团队部署DeOldify老照片上色服务,他们业务量增长很快,单机扛不住了,必须上集群。集群搭起来容易,但真跑起来才发现,节点之间“说话…...
