【声音转文字CapsWriter】声音随时转化为文字,CapsWriter提高工作效率
文章目录
- 前言
- 1. 软件与模型下载
- 2. 本地使用测试
- 3. 异地远程使用
- 3.1 内网穿透工具下载安装
- 3.2 配置公网地址
- 3.3 修改config文件
- 3.4 异地远程访问服务端
- 4. 配置固定公网地址
- 4.1 修改config文件
- 5. 固定tcp公网地址远程访问服务端
前言
今天我要给大家安利一个神器——CapsWriter-Offline。这款工具可以用声音搞定所有文字输入的工作,绝对是一个不可错过的宝藏应用!它不仅能让你的语音瞬间变成文字,还能通过结合cpolar内网穿透技术实现远程访问和使用其强大的功能。
无论是整理会议录音、进行高效的聊天输入,还是处理其他复杂的文本转换任务,CapsWriter-Offline都能轻松应对。而且最重要的是,它的操作非常简单,上手几乎零门槛!
接下来的内容中,我会详细介绍如何在Windows系统中安装并使用这款工具,并且告诉你一些实用的小技巧和注意事项。相信我,掌握了这些方法后,你的工作效率将会有质的飞跃!

1. 软件与模型下载
本例演示环境为Windows11,另外需要准备一个麦克风。
首先,我们需要下载CapsWriter-Offline的64位版本,可以使用服务端、客户端。然后需要下载models.zip模型文件。
下载地址:Releases · HaujetZhao/CapsWriter-Offline (github.com)

将软件和模型下载好后进行解压,然后将解压好的模型文件夹models复制到解压好的CapsWriter-Offline的文件夹中并替换原有的同名文件夹。

2. 本地使用测试
现在我们首先双击打开服务端(start_server),会弹出窗口对模型进行加载,加载完成后会提示开始服务:

这时我们在双击打开客户端(start_client),会弹出窗口连接服务端并检测音频输入设备:

显示连接成功即可开始使用了。
软件在Windows系统中默认使用大小写切换键caps lock进行语音输入(可以在配置文件中进行修改),一直按住说话,松手即可识别语音并在聊天软件对话窗口等界面进行输出:

可以看到对语音的识别非常准确,连标点符号也是。
除了支持无限时长语音的转写,作者在更新后,软件现在还支持文件转录字幕。即在客户端可以转写音视频文件为 srt 字幕了,只需将音视频文件拖动到客户端 exe 上打开即可。大家感兴趣的话,可以自行尝试。
3. 异地远程使用
此时,我们已经可以在本地的Windows系统电脑中使用CapsWriter-Offline进行语音转文字了,但也仅能在本地局域网中的设备上使用,如果想在异地也能远程使用在本地部署的工具应该怎么办呢?
很简单,只要在本地电脑上安装一个cpolar内网穿透工具就能轻松实现公网环境远程访问内网部署的服务了,无需公网IP,也不用设置路由器那么麻烦,接下来就介绍一下如何安装cpolar内网穿透!
3.1 内网穿透工具下载安装
安装cpolar步骤:
Cpolar官网地址: https://www.cpolar.com
点击进入cpolar官网,点击免费使用注册一个账号,并下载最新版本的Cpolar

登录成功后,点击下载Cpolar到本地并安装(一路默认安装即可)本教程选择下载Windows版本。

Cpolar安装成功后,在浏览器上访问http://localhost:9200,使用cpolar账号登录,登录后即可看到Cpolar web 配置界面,结下来在web 管理界面配置即可。

3.2 配置公网地址
接下来配置一下修改CapsWriter-Offline客户端文件需要用到的公网地址,
登录后,点击左侧仪表盘的隧道管理——创建隧道,
创建一个 CapsWriter-Offline 的公网TCP地址隧道
- 隧道名称:可自定义命名,本例中使用
123 - 协议:选择tcp
- 本地地址:6016
- 端口类型:选择随机临时TCP端口
- 地区:选择China VIP
点击创建

隧道创建成功后,点击左侧的状态——在线隧道列表,查看所生成的公网访问地址,可以看到生成了tcp公网地址,复制即可。

3.3 修改config文件
现在我们可以在异地使用另一台Windows系统电脑,下载好CapsWriter-Offline软件(无需下载模型文件)。
进入CapsWriter-Offline文件夹,使用vscode打开config文件对客户端配置进行修改:

我们需要对客户端配置中的地址和端口进行修改,使用刚才cpolar生成的公网地址7.tcp.vip.cpolar.cn替换127.0.0.1,使用公网地址后的端口10906替换6016,保存文件即可。


3.4 异地远程访问服务端
在本地电脑服务端(start_server)运行的前提下,现在使用这台异地电脑双击打开客户端(start_client),可以看到通过使用cpolar生成的公网地址异地也能远程访问本地服务端,使用它进行语音转文字啦!

小结
如果我们需要经常异地远程访问本地配置的服务,由于刚才创建的是随机的公网地址,24小时会发生变化。可以把地址设置成固定的TCP地址,不仅能够享受更多功能和更快的带宽,而且不用每次都重新创建隧道来访问,下面演示一下如何创建一个固定的tcp公网地址来解决这个问题。
4. 配置固定公网地址
我们接下来为CapsWriter-Offline配置固定的TCP公网地址,该地址不会变化,方便查看且无需每天重复修改访问地址。
登录cpolar官网,点击左侧的预留,选择保留的TCP地址,地区选择China VIP,填写一个备注(自己能记住就行)点击保留

保留成功后复制这个tcp地址:

返回登录Cpolar web UI管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道:123,点击右侧的编辑:

修改隧道信息,将保留成功的二级子域名配置到隧道中
- 端口类型:选择固定TCP端口
- 预留的TCP地址:填写刚才保留成功的tcp地址:
3.tcp.vip.cpolar.cn:12635
点击更新(注意,点击一次更新即可,不需要重复提交)

4.1 修改config文件
然后我们需要再次对客户端配置中的地址和端口进行修改,使用刚才配置的固定tcp公网地址3.tcp.vip.cpolar.cn替换7.tcp.vip.cpolar.cn,使用固定公网地址后的端口12635替换10906,保存文件即可。

5. 固定tcp公网地址远程访问服务端
同样在本地电脑服务端(start_server)运行的前提下,现在使用这台异地电脑双击打开客户端(start_client),现在就可以通过使用cpolar配置的固定tcp公网地址远程访问本地服务端使用它进行语音转文字啦!不用每天修改公网地址,也能获得更快的访问速度。

希望这篇文章能帮助你更好地了解CapsWriter-Offline的强大功能以及它与cpolar内网穿透技术结合后的无限可能。如果你对这款工具感兴趣或者有任何疑问,欢迎在评论区留言交流哦!别忘了分享给你的朋友们,让他们也一起来体验这种高效便捷的工作方式吧!
相关文章:
【声音转文字CapsWriter】声音随时转化为文字,CapsWriter提高工作效率
文章目录 前言1. 软件与模型下载2. 本地使用测试3. 异地远程使用3.1 内网穿透工具下载安装3.2 配置公网地址3.3 修改config文件3.4 异地远程访问服务端 4. 配置固定公网地址4.1 修改config文件 5. 固定tcp公网地址远程访问服务端 前言 今天我要给大家安利一个神器——CapsWrit…...
深入理解小波变换:信号处理的强大工具
引言 在科学与工程领域,信号处理一直是关键环节,傅里叶变换与小波变换作为重要的分析工具,在其中发挥着重要作用。本文将深入探讨小波变换,阐述其原理、优势以及与傅里叶变换的对比,并通过具体案例展示其应用价值。 一…...
人机交互系统实验三 多通道用户界面
实验目的和要求 1)了解常见的多通道用户界面 2)查找资料,熟悉一种多通道用户界面并写出综述 实验环境 Windows10 实验内容与过程 (一) 实验内容: 要求上网查找资料,熟悉一种多通道用户界面并写出综述,可以是眼动跟踪、手势识别、 三维…...
Filter -> MaskFilter遮罩滤镜详解
MaskFilter 作用对象:MaskFilter 主要用于Paint的外观效果,给用Paint绘制的内容添加模糊或者浮雕效果应用效果: MaskFilter 处理位图的遮罩效果,影响绘制的边缘或整体形状主要用于模糊处理、浮雕效果等,通过影响绘制对…...
RK3568使用QT操作LED灯
文章目录 一、QT中操作硬件设备思路Linux 中的设备文件操作硬件设备的思路1. 打开设备文件2. 写入数据到设备3. 从设备读取数据4. 设备控制5. 异常处理在 Qt 中操作设备的典型步骤实际应用中的例子:控制 LED总结二、QT实战操作LED灯设备1. `mainwindow.h` 头文件2. `mainwindo…...
python学opencv|读取图像(五十七)使用cv2.bilateralFilter()函数实现图像像素双边滤波处理
【1】引言 前序学习过程中,已经掌握了对图像的基本滤波操作技巧,具体的图像滤波方式包括均值滤波、中值滤波和高斯滤波,相关文章链接有: python学opencv|读取图像(五十四)使用cv2.blur()函数实现图像像素…...
为何实现大语言模型的高效推理以及充分释放 AI 芯片的计算能力对于企业级落地应用来说,被认为具备显著的研究价值与重要意义?
🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ AI 芯片:为人工智能而生的 “大脑” AI 芯片,又称人工智能加速器或计算卡,是专为加速人工智能应用,特别是深度学习任务设计的专用集成电路(A…...
Android 约束布局ConstraintLayout整体链式打包居中显示
Android 用约束布局ConstraintLayout实现将多个控件视作一个整体居中显示,使用 app:layout_constraintHorizontal_chainStyle"packed"实现 chain 除了链条方向有横向和竖向区分外, chain链条上的模式有 3种 spread - 元素将被展开&#…...
在C#中,Array,List,ArrayList,Dictionary,Hashtable,SortList,Stack的区别
Array Array你可以理解为是所有数组的大哥 普通数组 : 特点是长度固定, 只能存储相同类型的数据 static void Main(string[] args){//声明int[] ints;string[] strings;People[] peoples;//默认值 //int 类型是 0//string 类型是 nullint[] ints1 { 1, 2, 3 };string[] …...
微服务知识——微服务架构的演进过程
文章目录 初始架构:单机架构第一次演进:Tomcat与数据库分开部署第二次演进:引入本地缓存和分布式缓存第三次演进:引入反向代理实现负载均衡第四次演进:数据库读写分离第五次演进:数据库按业务分库第六次演进…...
Chrome 浏览器:互联网时代的浏览利器
Chrome 浏览器:互联网时代的浏览利器 引言 在互联网时代,浏览器已经成为我们日常生活中不可或缺的工具。作为全球最受欢迎的浏览器之一,Chrome 浏览器凭借其出色的性能、丰富的扩展程序和简洁的界面,赢得了广大用户的喜爱。本文…...
深入浅出 NRM:加速你的 npm 包管理之旅
文章目录 前言一、NRM 是什么?二、为什么需要 NRM?三、NRM 的优势四、NRM 的安装与使用4.1 安装 NRM4.2 查看可用的 npm 源4.3 切换 npm 源4.4 测试 npm 源速度4.5 添加自定义 npm 源4.6 删除 npm 源 五、NRM 的进阶使用六、总结 前言 作为一名 JavaScr…...
Linux——基础命令1
$:普通用户 #:超级用户 cd 切换目录 cd 目录 (进入目录) cd ../ (返回上一级目录) cd ~ (切换到当前用户的家目录) cd - (返回上次目录) pwd 输出当前目录…...
nuxt3中使用useFetch请求刷新不返回数据或返回html结构问题解决-完整nuxt3useFetchtch请求封装
前言 如果使用nuxt3写项目,可以查看nuxt3实战:完整的 nuxt3 vue3 项目创建与useFetch请求封装,此篇内容有详细步骤 但在此篇内容中useFetch请求在页面有多个请求的情况下,或者放在客户端渲染情境下是失败的,所以在此篇…...
Kubernetes 中 BGP 与二层网络的较量:究竟孰轻孰重?
如果你曾搭建过Kubernetes集群,就会知道网络配置是一个很容易让人深陷其中的领域。在负载均衡器、服务通告和IP管理之间,你要同时应对许多变动的因素。对于许多配置而言,使用二层(L2)网络就完全能满足需求。但边界网关协议(BGP)—— 支撑互联网运行的技术 —— 也逐渐出…...
C中静态库和动态库的使用
2.使用尖括号包括 如果要使用尖括号包括头文件,有两种方法 1.将头文件移动到标准头文件目录,linux为/usr/local/include.windows下为C:\MinGW\include 2.编译时指定头文件目录,gcc -I/头文件目录 … 编译时-I参数就是用于指定头文件目录 3.静态库 将文件编译为静态库,可以…...
Debian 安装 Nextcloud 使用 MariaDB 数据库 + Caddy + PHP-FPM
前言 之前通过 docker在ubuntu上安装Nextcloud,但是现在我使用PVE安装Debian虚拟机,不想通过docker安装了。下面开始折腾。 安装过程 步骤 1:更新系统并安装必要的软件 sudo apt update && sudo apt upgrade -y sudo apt install…...
【FPGA】 MIPS 12条整数指令 【3】
实现乘除 修改框架 EX:实现带符号乘除法和无符号乘除法 HiLo寄存器:用于存放乘法和除法的运算结果。Hi、Lo为32bit寄存器。电路描述与实现RegFile思想一致 仿真 代码 DataMem.v include "define.v"; module DataMem(input wire clk,input…...
Mac 部署Ollama + OpenWebUI完全指南
文章目录 💻 环境说明🛠️ Ollama安装配置1. 安装[Ollama](https://github.com/ollama/ollama)2. 启动Ollama3. 模型存储位置4. 配置 Ollama 🌐 OpenWebUI部署1. 安装Docker2. 部署[OpenWebUI](https://www.openwebui.com/)(可视化…...
蓝桥杯小白打卡第二天
789. 数的范围 题目描述 给定一个按照升序排列的长度为 n n n 的整数数组,以及 q q q 个查询。 对于每个查询,返回一个元素 k k k 的起始位置和终止位置(位置从 0 0 0 开始计数)。 如果数组中不存在该元素,则返…...
5分钟掌握:billd-desk跨平台远程控制高效解决方案
5分钟掌握:billd-desk跨平台远程控制高效解决方案 【免费下载链接】billd-desk 基于Vue3 WebRTC Nodejs Flutter搭建的远程桌面控制 项目地址: https://gitcode.com/gh_mirrors/bi/billd-desk 还在为远程办公的卡顿和限制而烦恼吗?当你急需远程…...
ResNet50人脸重建作品集:cv_resnet50_face-reconstruction在艺术创作中的人脸风格迁移底图生成
ResNet50人脸重建作品集:cv_resnet50_face-reconstruction在艺术创作中的人脸风格迁移底图生成 1. 项目介绍与核心价值 cv_resnet50_face-reconstruction 是一个基于ResNet50架构的人脸重建项目,专门为艺术创作和设计工作提供高质量的人脸底图生成服务…...
Kettle转换里‘阻塞数据’控件为啥不灵?我用这个真实ETL案例给你讲透
Kettle转换中‘阻塞数据’控件的实战解析:从失效到精准控制 在ETL工具Kettle的实际应用中,数据流的精确控制往往是决定任务成败的关键。许多中高级用户在使用"阻塞数据直到步骤都完成"控件时,都曾遇到过看似配置正确却无法生效的困…...
Linux环境下Python段错误全解析:从内存管理到线程安全的避坑手册
Linux环境下Python段错误全解析:从内存管理到线程安全的避坑手册 当你在深夜调试一个复杂的Python项目时,突然看到屏幕上跳出"Segmentation fault (core dumped)"的提示,那种感觉就像在高速公路上爆胎——明明代码逻辑看起来没问题…...
eNSP安装避坑指南:WinPcap/Wireshark/VirtualBox依赖关系解析
eNSP安装避坑指南:WinPcap/Wireshark/VirtualBox依赖关系解析 当你第一次打开eNSP安装包时,可能会疑惑为什么需要同时安装WinPcap、Wireshark和VirtualBox这三个看似不相关的软件。这就像组装一台精密仪器——少了任何一个螺丝,整台机器都无法…...
Umi-OCR:重新定义本地化文字识别的工作流范式
Umi-OCR:重新定义本地化文字识别的工作流范式 【免费下载链接】Umi-OCR OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。 …...
让你的调试日志五彩斑斓:J-Link RTT高级封装技巧(支持中文、浮点数、十六进制)
让你的调试日志五彩斑斓:J-Link RTT高级封装技巧(支持中文、浮点数、十六进制) 调试是嵌入式开发中不可或缺的一环,而高效的调试工具能显著提升开发效率。J-Link RTT(Real Time Transfer)作为一种无需额外硬…...
厦门选117E还是120E?手把手教你为你的城市选择正确的高斯克吕格投影坐标系
厦门GIS项目实战:如何精准选择高斯克吕格投影坐标系 第一次在ArcGIS里看到上百个坐标系选项时,我的鼠标指针在列表上方徘徊了整整十五分钟——就像站在自动售货机前不知道按哪个按钮的新手。特别是当项目 deadline 临近,而厦门市规划局的Shap…...
突破B站缓存限制:m4s-converter视频格式转换完全指南
突破B站缓存限制:m4s-converter视频格式转换完全指南 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 当旅行途中想离线观看缓存视频却…...
Fun-ASR语音识别新手入门:3步启动Web服务,麦克风实时转文字实测
Fun-ASR语音识别新手入门:3步启动Web服务,麦克风实时转文字实测 1. 快速认识Fun-ASR Fun-ASR是由钉钉与通义实验室联合推出的语音识别系统,专为中文场景优化设计。与市面上常见的云端语音识别服务不同,它最大的特点是支持本地化…...
