当前位置: 首页 > article >正文

为了让我爸使用 OpenClaw,我给它套上通话功能

我爸和众多中国老年人一样其实已经是豆包的忠实用户了。但作为一个 AI 博主我内心总是想让老父亲知道 OpenClaw 的牛逼之处让他开开眼。在家里给他演示一通后他得出了个结论软件不错能控制很多东西相当于有手脚了但是就是不好用。“啥不好用最近不知道有多火”“我都老花眼了还要打字人家豆包说说话就行了。你不是程序员吗干嘛不做一个。”这话我一听就来气所以这两天我就一直研究如何给OpenClaw 套上通话功能。现在先给大家看看实际的使用情况架构选择你可能以为我要短期内 vibecoding OpenClaw的插件之类的但在这个普通人30 分钟都能写一个项目的年代。我估计这个功能早就实现了。问题是如何找到这些代码呢第一是靠搜索先随便搜搜openclawvoice就会发现很多项目。第二是靠积累由于对架构的理解我很早就知道有不少做 voice AI agents接下来就是翻翻代码库看看有没有上 OpenClaw 了。经过一番搜索我选择了star 比较多比较眼熟的ten-framework。为什么这么选择呢首先他的文档比较完善部署流程清晰了我几乎不用写任何代码还有个重要的原因就是 OpenClaw 更新频繁可能几天前的代码就变得老旧了我还认识开发者到时候督促他修修 bug。基本服务购买为了让整个项目运行起来你需要注册 4 个免费的服务其中除了 DeepSeek其他都不需要付费。DeepSeek国内替代推荐国内直连OpenAI 兼容接口价格极低约 OpenAI 的 1/50。注册步骤打开 DeepSeek 开放平台点击 注册用手机号或邮箱注册充值登录后点击左侧 费用Billing最低充值 2充 10 能用很久获取 API Key点击左侧 API Keyshttps://platform.deepseek.com/api_keys点击 创建 API Key填写名称点击创建立即复制保存——只显示一次Deepgram语音识别 STT用于将用户语音实时转为文字。注册步骤打开 Deepgram 控制台点击 Sign Up支持 Google / GitHub 登录或邮箱注册首次登录会引导创建项目获取 API Key进入控制台点击左侧 API Keys点击 Create a New API Key填写名称如 openclaw权限选 Member 或 Admin点击 Create Key立即复制保存——页面关闭后无法再查看免费额度新账号赠送 $200 免费额度不需要绑信用卡个人测试用很久。ElevenLabs语音合成 TTS用于将 AI 回复文字转为语音播报。注册步骤打开 ElevenLabs点击右上角 Sign Up支持 Google / GitHub 登录或邮箱注册获取 API Key登录后点击左侧边栏最下面的 Developers选择 API Keys 标签点击 Create an API Key填写名称权限建议全部打开Access / Write点击创建立即复制保存免费额度免费计划每月10,000 字符的语音合成额度包含 API 访问权限测试够用。Agora实时音视频 RTC用于浏览器与 AI 助手之间的实时音视频通信。注册步骤打开 Agora 控制台点击注册填写邮箱/手机号完成验证创建项目登录后进入控制台点击左侧 项目管理点击 创建项目填写项目名称如 openclaw-voice使用场景选 互动直播 或 语音通话鉴权机制选 安全模式推荐点击提交获取 App ID 和 Certificate回到 项目管理 页面找到刚创建的项目点击 App ID 右侧的 复制图标点击 配置 → 找到 主要证书点击复制信令服务rtm开启打开项目详情在Signaling选择数据中心开启免费额度每月 10,000 分钟免费使用个人测试完全够用。项目配置克隆项目将项目整体克隆下来https://github.com/TEN-framework/ten-framework配置环境变量配置参考ai_agents/agents/examples/openclaw-example里面的 readme。我们在ai_agents/下创建 .env文件内容具体如下# --- 服务配置 ---LOG_PATH/tmp/ten_agentLOG_STDOUTtrueGRAPH_DESIGNER_SERVER_PORT49483SERVER_PORT8080WORKERS_MAX100WORKER_QUIT_TIMEOUT_SECONDS60# --- 前端 ---AGENT_SERVER_URLhttp://localhost:8080TEN_DEV_SERVER_URLhttp://localhost:49483NEXT_PUBLIC_EDIT_GRAPH_MODEfalse# --- Agora RTC/RTM ---AGORA_APP_ID你的 Agora App IDAGORA_APP_CERTIFICATE你的 Agora App Certificate# --- LLM (DeepSeek) ---OPENAI_API_BASEhttps://api.deepseek.comOPENAI_API_KEY你的 DeepSeek API KeyOPENAI_MODELdeepseek-chat# OPENAI_PROXY_URL# --- STT (Deepgram) ---DEEPGRAM_API_KEY你的 Deepgram API Key# --- TTS (ElevenLabs) ---ELEVENLABS_TTS_KEY你的 ElevenLabs API Key# --- OpenClaw Gateway ---OPENCLAW_GATEWAY_URLws://host.docker.internal:18789OPENCLAW_GATEWAY_PASSWORD你的 Gateway 密码OPENCLAW_GATEWAY_ORIGINhttp://host.docker.internal:18789OPENCLAW_GATEWAY_SCOPESoperator.writeOPENCLAW_GATEWAY_DEVICE_IDENTITY_PATH/data/openclaw/device_identity.jsOpenClaw配置首先将 OpenClaw 的网关改成密码模式具体步骤openclaw config set gateway.auth.mode password openclaw config set gateway.auth.password lxfater然后为了安全需要配置Control UI Allowed Origins 具体步骤如下图在 OpenClaw 的 Settings → Gateway → Control UI Allowed Origins 中添加http://host.docker.internal:18789这个值必须与 .env 中的 OPENCLAW_GATEWAY_ORIGIN 完全一致包括协议 http:// 不能写成wss://不能带路径。如果不匹配Gateway 会拒绝连接并返回 origin not allowed。修改代码扩展功能实际使用下来为了方便中国人使用需要对配置进行更改具体如下ai_agents/agents/examples/openclaw-example/tenapp/property.json — 4 行改动STT 语言 en-US → zh模型 nova-3 → nova-2LLM base_url 从硬编码https://api.openai.com/v1→ ${env:OPENAI_API_BASE}LLM model 从硬编码 gpt-4o → ${env:OPENAI_MODEL}上面主要是让 ASR 能转录中文还有去除硬编码的环境变量方便配置国内的模型。构建容器mac arm 架构下部署注意事项由于这个项目不支持arm64 架构你需要在 docker开启虚拟化具体步骤如下打开 Docker Desktop点击右上角 齿轮图标Settings左侧选 General往下找到 Virtual Machine OptionsVMM 选择 Apple Virtualization framework勾选 Use Rosetta for x86_64/amd64 emulation on Apple Silicon点击 Apply Restart然后运行如下命令# 1. 构建镜像 cd 项目所在目录/ten-framework/ai_agents # 强制build amd64 版本 docker build --platform linux/amd64 -f agents/examples/openclaw-example/Dockerfile -t openclaw-example-app .运行项目首先保持 OpenClaw 开启想看到网关的日志的话推荐使用openclaw gateway --force然后运行容器# 要在cd 项目所在目录/ten-framework/ai_agents目录下 docker run --rm -it --env-file .env -p 8080:8080 -p 3000:3000 openclaw-example-app登录到http://localhost:3000会看到如下所示界面我们复制这个命令运行进行配对使用项目打开这个项目的第一件事情是选择麦克风然后我们还要选择配置voice-assistant检查是否联通具体如下图所示现在开始就可以愉快对话了。要求他创建在桌面创建一个文件如下图所示口喷就行很快就创建好了结束接入语音对话功能后OpenClaw 开始有能力给不懂技术的普通人使用。普通人估计都没有接触过开口就能干活不废话的 AI我给我爸的 OpenClaw 套上了个修复图片的 skill他就乐呵呵地年轻时候的照片进行修复了。普通人其实对 AI 产品只有两个要求好用能干活。这篇文章希望对你有帮助喜欢我的文章可以关注我的公众号 Voice Agent 学习笔记了解最懂 AI 语音的头脑都在思考什么

相关文章:

为了让我爸使用 OpenClaw,我给它套上通话功能

我爸和众多中国老年人一样,其实已经是豆包的忠实用户了。 但作为一个 AI 博主,我内心总是想让老父亲知道 OpenClaw 的牛逼之处,让他开开眼。在家里给他演示一通后,他得出了个结论,软件不错,能控制很多东西…...

ClaudeCode武装三件套:Ghostty + Yazi + Lazygit 打造高效开发环境

引言:多终端切换之痛 在终端里深度使用 Claude Code 一段时间后,你很快会遇到一个现实问题: 场景:前后端需求同时开发,一个终端跑 Claude Code,另一个查看日志,还需要随时管理文件、提交代码……...

SEGGER的embOS也推出动态APP用法emApps

https://www.segger.com/products/virtualization/emapps/ 特点: 1、emApps将智能手机便捷灵活的应用生态引入嵌入式系统领域。作为固定固件的替代方案,emApps通过引入应用层,使开发者无需改动已验证的核心系统即可随时扩展新功能。 2、为实…...

AI产品经理核心能力全景图:从需求洞察到产品落地的全链路实战手册

AI产品经理核心能力全景图:从需求洞察到产品落地的全链路实战手册 摘要:本文基于AI产品经理核心能力模型,系统拆解五大核心模块:用户需求分析与场景挖掘、AI产品设计框架、MVP定义与验证、PRD文档撰写、用户体验优化。提供可直接…...

Prompt提示词设计工程:从原则到实战的系统性方法论(附模板与调试工具)

Prompt提示词设计工程:从原则到实战的系统性方法论(附模板与调试工具) 摘要:本文基于Prompt Engineering系统化知识框架,深度解析提示词设计的五大核心模块:从基本原则到少样本学习,从角色定义到…...

Course15:视觉大模型与多模态理解

Qwen 多模态模型中图片 Token ID 与向量的核心理解文本 Token 是 “语言的最小语义单元”,图片 Token 是 “视觉的最小特征单元”—— 两者最终都会被映射到同一维度的向量空间,让模型能 “读懂” 图文的关联语义。维度文本 Token(如 Qwen 的…...

为什么程序员群体正在疯狂安利DeepSeek-Coder?

最近打开CSDN、GitHub、技术交流群,有一个名字频繁刷屏——DeepSeek-Coder。不同于以往各类AI编程工具的“昙花一现”,这款工具几乎获得了从新手到资深工程师、从个人开发者到企业团队的一致认可,甚至出现了“人均安利”的盛况。作为每天与代…...

人形机器人行业日报 | 战场、月球、马斯克的新棋局

乌克兰前线:机器人士兵已上战场 乌克兰国家通讯社最新数据显示,今年1月份该国启动了 7495 次机器人作战行动。 大部分是后勤任务——给前线送武器、弹药、食物。但有意思的是,部分机器人已经配备了卡拉什尼科夫机枪和炸药,在前线…...

【高精度气象】一场暴雨影响多少赛事赞助?赛事保险正在依赖分钟级预报止损

对于赛事主办方而言,2026年的残酷现实是:一场突如其来的暴雨,不仅可能让数万观众扫兴而归,更可能让数百万赞助费付诸东流,让主办方面临天价索赔。但当分钟级预报与动态保险定价深度融合,一个全新的“天气止…...

【高精度气象】光伏运维的“清洗经济学”:精准辐照预报如何让每一块面板都在最佳时刻“吐纳”

2026年的春天,某光伏电站的运维经理王工,在手机屏幕上划动着一张特殊的“清洗地图”。地图上,原本需要全员出动、耗时两周的春季大清洗任务,被分解成数十个彩色区块。红色区块显示“辐照度即将达峰,建议今日优先清洗”…...

【新能源电站运维】运维无效出工减少30%、设备寿命延长3-5年:功率预测如何重构新能源场站成本结构?

2026年的春天,西北某光伏园区的运维班长张工,手机上没有收到往年的“春季大扫除”全员出动通知,取而代之的是一条来自功率预测系统的精准指令:“3月17日14:00,阵风达8级,建议优先加固7区、12区跟踪支架&…...

Java 面试题及答案整理(2026金三银四速成版)

又是一年金三银四 !纵观今年的技术招聘市场, Java 依旧是当仁不让的霸主 !即便遭受 Go 等新兴语言不断冲击,依旧岿然不动。究其原因:Java 有着极其成熟的生态,这个不用我多说;Java 在 运维、可观…...

吐血推荐! AI论文写作软件 千笔ai写作 VS PaperRed,专科生专属神器!

随着人工智能技术的迅猛迭代与普及,AI辅助写作工具已逐步渗透到高校学术写作场景中,成为专科生、本科生、研究生完成毕业论文不可或缺的辅助手段。越来越多面临毕业论文压力的学生,开始依赖各类AI工具简化写作流程、提升创作效率。但与此同时…...

专科生也能用!千笔AI,碾压级的AI论文工具

你是否曾为论文选题发愁,反复修改却仍不满意?是否在查重和格式上耗费大量时间,却收效甚微?对于专科生来说,论文写作不仅是学术挑战,更是心理压力的来源。面对繁杂的文献、复杂的格式要求和严格的查重标准&a…...

别再瞎找了!10个AI论文软件测评:全学科适配,开题报告+毕业论文全搞定

在学术研究日益数字化的今天,论文写作已成为高校师生和科研人员不可回避的核心任务。然而,从选题构思到文献检索、从初稿撰写到格式调整,每一个环节都可能成为效率的“卡点”。尤其在AI技术快速迭代的背景下,市场上涌现出大量论文…...

干货来了:本科生专属降AI率平台,千笔·专业降AI率智能体 VS 锐智 AI

在AI技术迅速发展的今天,越来越多的本科生开始借助AI工具辅助论文写作,以提高效率、优化内容。然而,随着学术审核标准日益严格,AI生成内容的痕迹越来越容易被检测出来,导致论文AI率超标成为普遍难题。许多学生在反复修…...

从此告别拖延 10个降AIGC平台全场景通用测评与推荐

在学术写作和论文创作过程中,AI生成内容的痕迹往往成为困扰作者的一大难题。随着AIGC(人工智能生成内容)技术的广泛应用,如何有效降低论文中的AI痕迹、提升原创性,已成为众多学生、研究人员乃至专业写作者的共同需求。…...

揭开Airsim仿真自动UAV巡航无碰撞源码的神秘面纱

DL00403-Airsim仿真自动UAV巡航无碰撞源码实现在无人机(UAV)的开发领域,Airsim仿真平台为我们提供了一个绝佳的测试与开发环境。今天咱们就来聊聊DL00403这个自动UAV巡航无碰撞源码实现的事儿。 前期准备与环境搭建 Airsim基于虚幻引擎&#…...

深度解析检索增强三核心:普通RAG、GraphRAG与NL2SQL

在大模型应用落地过程中,“幻觉”“知识过时”“无法对接业务数据”是三大核心痛点——大模型虽具备强大的自然语言理解与生成能力,但自身知识库固定(无法实时更新)、缺乏逻辑推理能力(尤其多跳关系)、无法…...

副业收益追踪器,记录时间投入与收入,自行算时薪,判断副业是否值得坚持。

副业收益追踪器 - 时薪计算与价值评估系统一、实际应用场景描述场景:小王是一名前端开发工程师,利用晚上和周末接私活、写技术博客、做线上课程。一个月下来,他接了3个外包项目(共收入15000元),写了2篇技术…...

_Device_Node中的ResourceList和ResourceListTranslated和BootResources

_Device_Node中的ResourceList和ResourceListTranslated和BootResources0: kd> dt _Device_Node 0x899c1008 nt!_DEVICE_NODE0x000 Sibling : (null)0x004 Child : 0x899875a8 _DEVICE_NODE0x008 Parent : 0x899c5850 _DEVICE_NODE0x00c La…...

金三银四Java 岗面试清单:分布式 +Dubbo+ 线程 +Redis+ 数据库 +JVM+ 并发

最近可能有点闲的慌,没事就去找面试面经,整理了一波面试题。我大概是分成了 Java 基础、中级、高级,分布式,Spring 架构,多线程,网络,MySQL,Redis 缓存,JVM 相关&#xf…...

Java8 HashMap高低位拆分扩容,核心逻辑一次性说清

一、Jdk7 1、扩容死锁分析 死锁问题核心在于多线程扩容导致形成的链表环 void transfer(Entry[] newTable, boolean rehash) {int newCapacity newTable.length;for (Entry<K,V> e : table) {while(null ! e) {//第一行Entry<K,V> next e.next;if (rehash) {e…...

功率波动平抑:从算法到并网标准验证

平抑功率波动&#xff0c;一分钟功率波动和十分钟功率波动 1、1min和10min满足国家并网标准 2、先用滑动平均算法或卡尔曼滤波算法进行平抑 3、求解平抑后是否满足国家并网标准 4、程序注释很详细。 有步骤的在电力系统中&#xff0c;确保功率稳定输出至关重要&#xff0c;而平…...

信息化建设-核心系统实施方法论

4.2 核心系统实施方法论4.2.1 核心系统实施的理论定位核心系统实施是企业信息化建设从规划走向现实的关键一步&#xff0c;其理论任务是将选定的软件产品通过科学的实施方法&#xff0c;成功部署到企业环境中&#xff0c;实现预期的业务价值。无论是采购成熟软件还是自研开发&a…...

信息化建设-实施路径规划与投资预算

3.5 实施路径规划与投资预算3.5.1 实施路径规划的理论价值实施路径规划是信息化建设从蓝图到现实的“施工计划”&#xff0c;其理论任务是将整体架构设计分解为可执行、可管理、可验证的阶段任务&#xff0c;明确每个阶段的目标、范围、时间、资源和预算&#xff0c;确保信息化…...

信息化整体架构设计与技术选型

规划篇——蓝图设计与路径规划3.4 整体架构设计与技术选型3.4.1 整体架构设计的理论价值整体架构设计是信息化建设的“施工蓝图”&#xff0c;其理论任务是将业务需求和功能需求转化为可落地实施的技术方案&#xff0c;明确系统的组成部分、相互关系、技术标准和演进路径。如果…...

罗姆最新碳化硅模块已登陆线上平台

基于第四代技术的模块支持小型化并减少设计工作量。罗姆&#xff08;Rohm&#xff09;已开始通过 DigiKey 等分销商在线销售新的碳化硅&#xff08;SiC&#xff09;模压模块&#xff0c;包括 TRCDRIVE pack、HSDIP20 和 DOT-247。TRCDRIVE pack 是一款 2-in-1 碳化硅模压模块&a…...

攻克三线仿真问题:经验与分享

三线仿真问题解决在开发过程中&#xff0c;三线仿真问题着实让人头疼了一阵。最近总算是把这个难题给啃下来了&#xff0c;今天就来跟大家唠唠我解决这个问题的全过程&#xff0c;希望能给遇到类似情况的小伙伴们一些启发。 问题初现 起初&#xff0c;三线仿真出现异常时&#…...

2026更新版!9个AI论文平台测评:专科生毕业论文写作与格式规范全攻略

随着人工智能技术的快速发展&#xff0c;AI写作工具在学术领域的应用越来越广泛。对于专科生而言&#xff0c;撰写毕业论文不仅是学业的重要环节&#xff0c;更是对综合能力的一次全面检验。然而&#xff0c;面对繁重的写作任务、复杂的格式规范以及内容质量把控难题&#xff0…...