当前位置: 首页 > article >正文

立创ESP-Hi:基于ESP32-C3的超低成本AI对话机器狗开源项目全解析

立创ESP-Hi基于ESP32-C3的超低成本AI对话机器狗开源项目全解析最近在开源硬件社区里一个叫“ESP-Hi”的小玩意儿挺火的。它本质上是一个能对话、能动的机器狗但最吸引人的是它的核心——一块成本极低的ESP32-C3开发板。很多朋友问我这么便宜的芯片真能跑AI对话和机器狗控制吗今天我就带大家把这个项目的里里外外彻底拆解一遍从硬件焊接、软件烧录到最终让它“活”起来手把手教你复刻这个有趣的AI玩具。简单来说ESP-Hi就是一个“大脑”加“身体”的组合。“大脑”是ESP-Hi主控板基于ESP32-C3负责听、说、想AI对话和显示表情“身体”是舵机狗底座提供四条腿和动力。两者通过一个Type-C接口连接合体后就成了一只可以语音唤醒、智能聊天、执行多种动作的机器狗。1. 项目核心硬件设计与物料准备咱们先来看看要做出这个机器狗都需要哪些硬件。我把它们分成了“大脑”本体和“身体”底座两部分。1.1 ESP-Hi本体大脑硬件详解本体是项目的核心所有智能处理都在这里完成。它的硬件框图可以帮你理解各个部分是怎么连接起来的电源管理通过USB Type-C口供电使用一颗RT9013 LDO芯片将5V电压降到3.3V给主控和音频部分供电。这里有个设计细节Wi-Fi工作时电流波动大可能会干扰敏感的麦克风电路。所以设计上特意把麦克风的供电和主控的供电用滤波电路隔离开了确保拾音清晰。主控MCU乐鑫的ESP32-C3这是一颗单核、支持Wi-Fi和蓝牙5.0的RISC-V芯片。项目充分利用了它的I2S、ADC、GPIO等外设。音频系统这是实现“对话”功能的关键分为“听”和“说”两部分。拾音听使用一个4*1.5mm的驻极体麦克风。声音信号经过一个“跨阻抗放大器”电路把麦克风输出的微小电流信号转换成电压信号再送到ESP32-C3的ADC引脚进行采集。放大倍数可以通过电路板上的电阻R18来调整以适应不同灵敏度的麦克风。放音说ESP32-C3通过I2S接口输出PDM格式的音频数字信号。为了抗干扰信号是以差分形式一正一负传输的。之后经过RC滤波电路再通过一颗NS4150B音频功率放大器放大最后驱动一个8欧1瓦的2014B方形腔体喇叭。放大倍数设定为7.2倍。显示部分使用一块0.96寸的TFT彩屏京东方插接式胶铁一体款用来显示机器狗的各种表情增加互动趣味性。其他板子上还有一个水银开关用来检测晃动实现“摇一摇”唤醒或打断对话的功能。本体物料清单BOM你需要准备以下材料来组装“大脑”序号物料名称规格/备注数量1ESP-Hi MainBoard PCB打板时注意选择板厚1.2mm1块23D打印外壳零件包括主外壳和遮光消噪件1套3亚克力前面板厚度1mm用于粘贴屏幕1块4扬声器8欧1瓦2014B方形腔体喇叭1个5显示屏0.96寸 TFT京东方插接式1块6麦克风4*1.5mm 驻极体麦克风1个7螺丝M2*4mm 自攻螺丝若干注意PCB打板时务必注明板厚为1.2mm否则可能无法严丝合缝地装入3D打印外壳。1.2 机器狗底座身体硬件详解底座负责提供运动能力它是一个独立的模块包含电源管理和四个舵机。电源管理底座内置一块702040规格的500mAh锂电池。这里有个巧妙的设计舵机直接由电池供电而给“大脑”ESP-Hi本体的供电则是先将电池电压通过升压电路稳定到5V后再输出。这样做的好处是即使四个舵机同时动作导致电池电压瞬间被拉低也不会影响到“大脑”的稳定工作。舵机驱动底座通过一块ServoDogBoard PCB板直接驱动四个180度的SG92R舵机实现机器狗的四条腿运动。智能开关舵机工作电流大普通的小型拨动开关承受不了。所以项目里用了一个小开关配合MOS管组成的电路用小电流控制大电流的通断既安全又节省空间。底座物料清单BOM组装“身体”需要以下材料序号物料名称规格/备注数量1ServoDogBoard PCB舵机控制与电源管理板1块23D打印结构件包括底壳、上盖、腿等1套3舵机180度 SG92R舵机4个4锂电池702040500mAh聚合物电池1块5Type-C母座公头贴片型型号如TC-0051个6螺丝M2规格螺丝及舵机附赠螺丝若干2. 动手组装从零件到成品物料齐备后咱们开始动手组装。建议先组装本体再组装底座。2.1 ESP-Hi本体组装步骤固定扬声器先将2014B喇叭安装到3D打印外壳指定的喇叭腔内。安装PCB主板将焊接好的ESP-Hi MainBoard PCB板装入外壳。这里有个小技巧由于USB口和外壳开孔配合较紧建议先将PCB板的左侧和顶部卡入外壳卡槽然后利用3D打印材料的轻微韧性将USB口一侧轻轻压入到位。安装遮光消噪件在PCB板和亚克力面板之间必须安装那个遮光消噪的3D打印件。它的作用是隔绝外部光线对屏幕的干扰同时填充空腔减少麦克风拾取到内部的结构噪声。粘贴屏幕这是最容易贴歪的一步。官方提供了一个屏幕辅助粘贴治具强烈建议使用它先将屏幕对准治具放好然后在屏幕背面贴上双面胶连同治具一起对准亚克力面板上的窗口粘贴最后取下治具这样就能保证屏幕完美居中。组装完成的本体应该是这样的PCB板稳固地卡在外壳内屏幕透过亚克力面板清晰显示喇叭和麦克风各就各位。2.2 机器狗底座组装步骤安装核心部件将ServoDogBoard PCB板、702040电池和四个SG92R舵机依次放入底部的3D打印外壳中。特别注意连接舵机时一定要按照PCB板上的丝印标号如S1, S2, S3, S4来插接舵机线插错了狗腿的动作会乱套。安装前盖板盖上PCB的前盖板固定好。安装上盖合上外壳的上盖。组装狗腿取出舵机配件包里最小的那个舵机臂用附带的最小螺丝将其固定到3D打印的“小腿”零件上。连接腿与身体最后将组装好的狗腿安装到对应的舵机输出轴上并用螺丝固定。至此硬件部分就全部准备好了。一只不会动的机器狗“身体”和一个聪明的“大脑”就等我们注入灵魂——软件了。3. 软件烧录与功能体验让ESP-Hi活起来需要烧录固件。项目提供了两种固件基础功能固件和集成小智AI的完整固件。3.1 基础固件烧录对于初学者我建议先从基础固件开始体验。这个固件通常已经包含了语音唤醒、舵机控制等基本功能。烧录需要一根USB数据线和一个串口烧录工具如CP2102、CH340等如果PCB板已集成则无需额外工具。烧录步骤如下进入下载模式按住设备顶部的Boot按钮不松开然后给设备上电。此时ESP32-C3会进入固件下载模式。连接与烧录用数据线连接电脑和ESP-Hi的Type-C口。使用乐鑫官方的Flash Download Tool或其他ESP32烧录工具。选择正确的串口号。在烧录地址0x00处加载提供的基础固件文件通常是.bin文件。开始烧录点击工具的“Start”按钮开始烧录。等待进度条完成显示“FINISH”或类似提示。重启运行烧录完成后松开Boot按钮然后重新给设备上电。程序就会自动运行了。3.2 小智AI固件编译与烧录如果你想体验完整的AI对话功能就需要编译并烧录集成了“小智AI”的固件。这需要一点开发环境搭建的步骤。获取源码克隆或下载xiaozhi-esp32项目仓库到你的电脑。准备环境确保你的电脑已安装好ESP-IDF开发环境乐鑫官方框架。编译固件在项目目录下运行以下命令来编译针对ESP-Hi的固件python3 scripts/release.py esp-hi这个命令会自动配置并编译出适用于ESP-Hi的完整固件。烧录固件编译完成后在生成的build目录下找到固件文件使用与基础固件相同的烧录方法和步骤地址0x00进行烧录。3.3 主要功能体验烧录好固件后你就可以尽情体验了语音唤醒与AI对话上电后对设备说“Hi乐鑫”默认唤醒词看到提示后即可开始对话。它会将你的语音上传到云端的大语言模型目前支持小智AI并将回答通过语音播放出来同时屏幕会显示可爱的表情。动作感知拿起设备摇晃内置的水银开关会检测到晃动可以用于唤醒设备或打断当前对话。变身机器狗将ESP-Hi本体通过Type-C线连接到组装好的舵机狗底座上。现在你可以通过语音命令如“走两步”、“转个圈”来控制机器狗做出行走、转身、作揖等十几种预设动作。网页遥控器这是一个非常实用的功能首先让ESP-Hi连接上你的Wi-Fi网络通常首次启动会进入配网模式。让你的手机或电脑连接到同一个Wi-Fi。在浏览器地址栏输入http://esp-hi.local或直接输入esp-hi.local或者输入ESP-Hi在路由器中获取到的IP地址。网页控制台就打开了你可以在这里基础遥控用方向按钮或直接在空白区域拖动来控制狗子前进、后退、左转、右转。动作库点击执行12种预设的趣味动作。舵机校准这是非常重要的一步新组装的狗腿可能不平通过这个功能可以精细调整每个舵机的角度让狗子站得稳稳的。务必仔细阅读网页上的校准说明。4. 复刻常见问题与优化建议在复刻过程中你可能会遇到一些问题这里有一些官方提示和我个人的经验麦克风拾音效果不佳原设计麦克风在壳体内部容易产生空腔回声。如果你对音质要求高可以尝试将麦克风直接粘贴在亚克力前面板的内部然后用细导线飞线连接到PCB的麦克风焊盘上这样可以极大提升拾音质量。舵机底座无法用C to C线充电这是因为一些Type-C线缆的识别机制问题。解决方案是在底座PCB的USB接口的CC1和CC2引脚上分别焊接一个5.1kΩ的电阻到地GND。很多开源硬件项目都会忽略这个细节导致充电兼容性问题。动作不协调或卡顿首先检查网页控制台中的舵机校准是否完成。其次确保4个舵机型号一致且供电充足电池电量足。舵机同时动作时电流很大电量不足会导致电压下降ESP32可能重启。Wi-Fi干扰音频这是嵌入式音频设备的常见问题。项目硬件上已做了电源隔离。如果仍有细微噪音可以尝试在软件上调整I2S的时钟配置或者确保设备远离路由器等强射频干扰源。这个项目的魅力在于它用一个非常廉价的ESP32-C3芯片通过精心的软硬件设计实现了语音唤醒、AI对话、电机控制、无线遥控等多个复杂功能的协同工作。它不仅是一个有趣的玩具更是一个学习嵌入式系统设计、音频处理、电机控制和物联网应用的绝佳实践平台。所有的硬件设计文件、3D模型和软件源码都已开源你可以完全复刻也可以在此基础上修改创造出属于你自己的智能机器人。

相关文章:

立创ESP-Hi:基于ESP32-C3的超低成本AI对话机器狗开源项目全解析

立创ESP-Hi:基于ESP32-C3的超低成本AI对话机器狗开源项目全解析 最近在开源硬件社区里,一个叫“ESP-Hi”的小玩意儿挺火的。它本质上是一个能对话、能动的机器狗,但最吸引人的是它的核心——一块成本极低的ESP32-C3开发板。很多朋友问我&…...

Z-Image-Turbo-辉夜巫女部署案例:高校数字艺术课程AI绘画实验平台搭建实录

Z-Image-Turbo-辉夜巫女部署案例:高校数字艺术课程AI绘画实验平台搭建实录 1. 引言:当AI绘画走进高校艺术课堂 去年秋天,我在一所高校的数字艺术系做技术分享,系主任王老师提出了一个困扰他们很久的问题:“我们的学生…...

计算机毕业设计题目Web开发实战:从选题到部署的全链路技术指南

作为一名计算机专业的过来人,我深知毕业设计(毕设)是检验四年学习成果的关键一战。尤其是Web开发方向,选题看似简单,但想做出一个结构清晰、功能完整、能拿得出手的项目,却常常让同学们感到迷茫和焦虑。今天…...

5大维度赋能企业自动化:OpenRPA开源RPA平台从部署到价值落地全指南

5大维度赋能企业自动化:OpenRPA开源RPA平台从部署到价值落地全指南 【免费下载链接】openrpa Free Open Source Enterprise Grade RPA 项目地址: https://gitcode.com/gh_mirrors/op/openrpa OpenRPA作为免费开源的企业级RPA(机器人流程自动化&am…...

Python实战:SMOTE、Borderline SMOTE与ADASYN在不平衡金融风控数据中的应用对比

1. 金融风控中的“数据失衡”困局:为什么你的模型总抓不住“坏人”? 在金融风控和反欺诈领域,我踩过最大的坑,不是模型不够复杂,而是数据本身“不公平”。想象一下,你手头有10万笔信用卡交易记录&#xff0…...

折射率匹配液与光路胶在光通信中的关键应用与选择

1. 光通信里的“隐形助手”:折射率匹配液与光路胶到底是什么? 如果你拆开过家里的光猫,或者见过工厂里那些精密的光学模块,可能会发现里面有些地方看起来“油油的”,或者有些透明的“胶水”把不同的玻璃片粘在一起。别…...

【autoDL】新手避坑指南:从文件上传到镜像克隆的实用技巧

1. 新手第一课:理解AutoDL的“无卡”与“有卡”模式 刚接触AutoDL的朋友,看到“无卡模式”和“有卡模式”这两个词,是不是有点懵?别急,这其实是平台为了帮我们省钱设计的一个非常实用的功能。我刚开始用的时候&#xf…...

Python自动购票工具:3大技术突破实现抢票效率提升300%

Python自动购票工具:3大技术突破实现抢票效率提升300% 【免费下载链接】Automatic_ticket_purchase 大麦网抢票脚本 项目地址: https://gitcode.com/GitHub_Trending/au/Automatic_ticket_purchase 在热门演出票务抢购场景中,手动操作往往因页面加…...

庐山派K230开发板MicroPython编程入门指南:从语法到硬件交互

庐山派K230开发板MicroPython编程入门指南:从语法到硬件交互 最近有不少朋友拿到了庐山派K230开发板,想用Python来玩转硬件,但又觉得从C语言入门门槛太高。别担心,今天我就带你用MicroPython上手,让你用熟悉的Python语…...

Simulink低通滤波器实战:从原理到参数调优

1. 低通滤波器:不只是“过滤”,更是信号的“美容师” 大家好,我是老张,在信号处理和控制系统这块摸爬滚打了十几年,用Simulink搭过的模型连起来能绕办公室好几圈。今天咱们不聊那些高深的理论,就说说一个几…...

CodeBuddy提示词实战指南:从零构建高效开发工作流

最近在项目里尝试用 CodeBuddy 来辅助编码,发现提示词写得好不好,效果天差地别。有时候它能精准地生成我想要的函数,有时候却答非所问,或者代码风格完全不对路。相信不少刚开始接触 AI 编程助手的同学都有类似的困扰。今天&#x…...

使用LaTeX撰写技术报告:Lingbot深度模型算法原理与实验分析

使用LaTeX撰写技术报告:Lingbot深度模型算法原理与实验分析 写技术报告或者论文,最头疼的往往不是研究本身,而是怎么把那些复杂的公式、算法、图表和参考文献,整整齐齐、漂漂亮亮地排版出来。Word虽然简单,但遇到复杂…...

阿里中文语音识别模型实测:一键部署,会议录音转文字就是这么简单

阿里中文语音识别模型实测:一键部署,会议录音转文字就是这么简单 1. 引言:告别繁琐,让语音转文字变得触手可及 你有没有过这样的经历?开完一场两小时的会议,看着手机里录下的音频文件发愁——要把里面的内…...

OFA视觉问答模型API开发指南:FastAPI高效封装教程

OFA视觉问答模型API开发指南:FastAPI高效封装教程 1. 引言 想象一下,你有一个能够看懂图片并回答问题的AI模型,现在需要让它成为人人都能使用的在线服务。这就是我们今天要解决的问题:如何用FastAPI将OFA视觉问答模型封装成高性…...

Alpamayo-R1-10B一文详解:10B参数VLA模型在物理AI AV数据集上的表现

Alpamayo-R1-10B一文详解:10B参数VLA模型在物理AI AV数据集上的表现 1. 引言:当自动驾驶学会“思考” 想象一下,你坐在一辆自动驾驶汽车里,前方是一个复杂的十字路口,有行人、自行车和变道的车辆。传统的自动驾驶系统…...

基于TI TMS320F28P550的灰度传感器ADC驱动移植与循迹应用实战

基于TI TMS320F28P550的灰度传感器ADC驱动移植与循迹应用实战 最近在准备电赛,很多同学问我怎么用TI的DSP开发板(LCKFB)来读取灰度传感器,实现小车循迹。这确实是个很实用的项目,今天我就手把手带大家走一遍完整的流程…...

Figma中文插件革新:突破语言壁垒的设计效率工具

Figma中文插件革新:突破语言壁垒的设计效率工具 【免费下载链接】figmaCN 中文 Figma 插件,设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 作为中文设计师,你是否曾因Figma全英文界面而放慢创作节奏&#…...

揭秘AI如何重塑音乐创作:AICoverGen声音转换技术全解析

揭秘AI如何重塑音乐创作:AICoverGen声音转换技术全解析 【免费下载链接】AICoverGen A WebUI to create song covers with any RVC v2 trained AI voice from YouTube videos or audio files. 项目地址: https://gitcode.com/gh_mirrors/ai/AICoverGen 在数字…...

Llama-3.2V-11B-cot部署案例:Kubernetes集群中水平扩展图文推理微服务

Llama-3.2V-11B-cot部署案例:Kubernetes集群中水平扩展图文推理微服务 想象一下,你的电商平台每天要处理上百万张用户上传的商品图片,需要自动生成描述、识别瑕疵、分析场景。如果只靠一台服务器,高峰期直接卡死,用户…...

Figma界面汉化插件让中文用户实现无障碍设计工作流

Figma界面汉化插件让中文用户实现无障碍设计工作流 【免费下载链接】figmaCN 中文 Figma 插件,设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 解决英文界面障碍的本地化方案 Figma作为主流设计工具,其全英文界面一直…...

7个秘诀掌握思源宋体CN:从免费到专业的字体应用完全指南

7个秘诀掌握思源宋体CN:从免费到专业的字体应用完全指南 【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 为什么选择思源宋体CN?破解字体使用的三大困境 在设计…...

新一代AVIF图像格式插件:Photoshop高效图像处理完整解决方案

新一代AVIF图像格式插件:Photoshop高效图像处理完整解决方案 【免费下载链接】avif-format An AV1 Image (AVIF) file format plug-in for Adobe Photoshop 项目地址: https://gitcode.com/gh_mirrors/avi/avif-format 一、为何选择AVIF?破解图像…...

第一期 立创·梁山派训练营(自由赛道)全记录:从开营到结营的项目实战与资源汇总

第一期 立创梁山派训练营(自由赛道)全记录:从开营到结营的项目实战与资源汇总 大家好,我是老张,一个在嵌入式行业摸爬滚打了十来年的工程师。最近,立创EDA和梁山派联合搞了个嵌入式训练营,我作…...

AI智能客服开发实战:从架构设计到生产环境避坑指南

最近在做一个AI智能客服的项目,从零到一,再到上线稳定运行,踩了不少坑,也积累了一些实战经验。今天就来聊聊从架构设计到生产环境部署,那些值得分享和需要避坑的地方。 根据行业报告,超过85%的智能客服差评…...

wan2.1-vae多场景落地:短视频封面/小红书配图/知识付费课程插图生成

wan2.1-vae多场景落地:短视频封面/小红书配图/知识付费课程插图生成 1. 引言:从创意到画面的新生产力 你有没有遇到过这样的场景?短视频脚本写好了,却为找不到一张吸引眼球的封面图而发愁;小红书笔记内容很精彩&…...

DeEAR开源模型效果展示:跨语种语音(中/英/日)唤醒度识别泛化能力实测

DeEAR开源模型效果展示:跨语种语音(中/英/日)唤醒度识别泛化能力实测 1. 引言:当AI能听懂你的情绪 想象一下,你刚录完一段产品介绍的语音,想快速知道自己的语气听起来是充满激情还是过于平淡。或者&#…...

工业控制场景:CYBER-VISION零号协议辅助分析STM32F103C8T6数据采集逻辑

工业控制场景:CYBER-VISION零号协议辅助分析STM32F103C8T6数据采集逻辑 最近在做一个工业现场的数据采集项目,用的就是大家都很熟悉的STM32F103C8T6最小系统板,采集温度、压力和振动信号。数据是采上来了,但看着那一串串不断刷新…...

Topit:重新定义Mac窗口管理的效率工具

Topit:重新定义Mac窗口管理的效率工具 【免费下载链接】Topit Pin any window to the top of your screen / 在Mac上将你的任何窗口强制置顶 项目地址: https://gitcode.com/gh_mirrors/to/Topit 在数字化工作环境中,专业人士每天平均需要在20个以…...

在线考试app毕业设计:从零实现一个高可用防作弊系统(新手入门实战)

作为一名计算机专业的学生,毕业设计是检验学习成果的重要环节。选择“在线考试App”作为课题,既贴近实际应用,又能综合运用前后端知识。但在实际开发中,新手们常常会陷入一些典型的困境:题库数据怎么存才方便管理&…...

2026最新!千笔·降AI率助手,MBA论文降重首选

在AI技术不断渗透学术写作的当下,越来越多的学生、研究人员和职场人士开始借助AI工具提升论文写作效率。然而,随之而来的“AI率超标”问题也日益凸显——知网、维普、万方等查重系统持续升级算法,对AI生成内容的识别愈发严格;Turn…...