当前位置: 首页 > article >正文

开源!手搓ESP-VoCat 喵伴桌面AI助手,帮你养萌宠 OpenClaw龙虾,内置豆包,会听、会动、会陪伴

模组选型ttps://item.taobao.com/item.htm?fttid1033585120956spma21dvs.23580594.0.0.4fee2c1bAqCiqcskuId6211360130611ESP-VoCat 喵伴是乐鑫携手火山引擎扣子大模型团队打造的智能 AI 开发套件适用于玩具、智能音箱、智能中控等需要大模型赋能的语音交互类产品。该设备搭载 ESP32-S3-WROOM-1 模组1.85 寸 QSPI 圆形触摸屏双麦阵列支持离线语音唤醒与声源定位算法。结合火山引擎提供的大模型能力喵伴可实现全双工语音交互、多模态识别与智能体控制为开发者打造完整的端侧 AI 应用体验提供坚实基础。数实融合 开启 AIoT能源数智化新范式ESP-VoCat 喵伴是乐鑫携手火山引擎扣子大模型团队打造的智能 AI 开发套件适用于玩具、智能音箱、智能中控等需要大模型赋能的语音交互类产品。该设备搭载 ESP32-S3-WROOM-1 模组1.85 寸 QSPI 圆形触摸屏双麦阵列支持离线语音唤醒与声源定位算法。结合火山引擎提供的大模型能力喵伴可实现全双工语音交互、多模态识别与智能体控制为开发者打造完整的端侧 AI 应用体验提供坚实基础。喵伴旋转底座是为 ESP-VoCat 喵伴开发套件量身打造的智能旋转底座采用 ESP32-C61-WROOM-1 模组支持 USB Type-C 供电并可通过磁吸接口为 ESP-VoCat 本体供电实现了高精度步进电机控制、磁吸滑动开关事件检测、 CSI 感知功能、稳定的 UART 通信等核心功能同时能够根据 ESP-VoCat 的 声源识别结果自动调整方向实现面向声源的智能旋转提供更自然、更具沉浸感的人机交互体验。 ESP-VoCat 喵伴功能介绍ESP-VoCat 喵伴主控板采用乐鑫 ESP32-S3-WROOM-1-N32R8 模组支持 2.4 GHz Wi-Fi 和 Bluetooth 5 (LE) 无线连接。存储方面整机具备 8 MB PSRAM、32 MB Flash 的存储空间同时还配备了一个可支持高达 32 GB 的 microSD 卡插槽满足语音交互和多媒体处理需求。显示方面配备 1.85 英寸圆形触摸屏360 × 360 分辨率与 ESP32-S3 原生触摸传感器提供直观丰富的交互体验。音频方面EchoEar 内置 2W 扬声器和双麦克风阵列支持本地语音唤醒和声源定位。电源系统兼容 5V DC 和 3.7V 700mAh 锂电池供电。此外还集成一个 USB-C 接口支持供电与编程下载同时预留 Pogopin 接口方便功能拓展。ESP-VoCat 喵伴套件以端到端开发为核心理念技术亮点如下全双工语音交互用户可以与设备进行连续对话而不仅仅是单次响应。多模态识别与智能体控制能够识别用户的多种输入方式并提供相应的智能响应。情绪识别与动态表情互动能够识别用户的情绪变化并通过动态表情进行互动增强设备的人格化表现。长记忆能力支持对用户对话内容的持续记录提供更具陪伴感的个性化体验。离线语音唤醒与声源定位结合电机控制实现180°范围内的方向跟踪使交互更自然。智能家居控制支持MCP协议与Function Call能力可用于远程控制家庭设备作为智能家居系统的本地中枢。离线语音唤醒与声源定位结合电机控制可实现 180° 范围内的方向跟踪使设备交互更自然、更具沉浸感。长记忆能力支持对用户对话内容的持续记录实现更具陪伴感的个性化体验。智能对讲与情绪识别能力可主动识别用户的意图与情绪变化并通过动态表情互动进行响应增强设备的人格化表现ESP-VoCat 支持 MCP 协议与 Function Call 能力可用于远程控制家庭设备作为智能家居系统的本地中枢。 ESP-VoCat 底座能力ESP-VoCat 支持声源识别功能能够实时检测环境中的声音方向和位置。系统通过麦克风阵列采集声音信号结合声强、相位等信息进行分析判断声源所在的方位角。配合基于步进电机的超静音旋转底座可以实现面向声源的智能交互。好奇环顾让底座带动喵伴进行左顾右盼配合小幅度随机偏移模拟猫咪自然观察环境的行为。鼓点律动使 ESP-VoCat 能够根据外界音乐的鼓点节奏左右摆头营造与音乐同步的互动效果。温柔蹭手模拟猫咪轻柔蹭手的动作底座缓慢扭向左侧再回到中心循环数次。动作平滑自然每次停顿都增强了真实的触感和温柔感。ESP-VoCat 底座通过磁吸式滑动开关实现多种交互控制。滑块的不同位置会改变地磁传感器周围的磁场强度底座通过实时监测这些磁场变化来识别滑块的动作。当检测到位置变化时底座会将相应事件通过串口上报给 ESP-VoCat从而实现丰富、直观的交互体验。 硬件组装主要组件描述CoreBoard核心板ESP32-S3-WROOM-1-N16R16VA主控芯片集成 16 MB Flash 和 16 MB PSRAM支持 2.4 GHz Wi-Fi 和 Bluetooth 5 (LE) 无线连接。Battery Connector电池连接器电池连接器用于连接 3.7 V 锂电池上为正极下为负极。LCD FPC Connector屏幕连接器用于连接 1.85 英寸圆形 LCD 屏幕分辨率为 360 x 360详细参数请参考 显示屏规格书。MicBoard Connector麦克风连接器MicBoard PCB 板连接器连接双麦克风阵列和状态指示 LED 灯。Touch Connector触摸连接器触摸连接器用于连接触摸铜箔实现触摸交互功能。Speaker Connector扬声器连接器2 线扬声器连接器用于连接内置 3 W 扬声器。MicBoard麦克风板Green LED绿色 LED绿色 LED 指示灯。MIC麦克风阵列双 LMA3729T381-OY3S 麦克风阵列支持本地语音唤醒和声源定位功能。BaseBoard底板BQ27220电池管理芯片电池管理芯片用于电池电量检测、充电管理和电源状态监控。TP4057锂电池充电芯片锂电池充电芯片用于为锂电池充电充电电流为 250 mA。CoreBoard ConnectorCoreBoard 连接器CoreBoard PCB 板连接器连接核心板与底板。TlV62569DCDC 芯片降压转换芯片用于将 5 V 电源转换为 3.3 V 电源为系统提供稳定供电。SAM8108开关机控制芯片开关机控制芯片用于控制设备开关机单击 POWER 按键即可切换开关机状态。Type-CUSB-C 接口USB-C 接口用于供电、编程下载和调试支持对锂电池进行充电。 写在最后ESP-VoCat 喵伴展现出的集成度、AI算力和功耗控制其应用范围可以广泛拓展至多个需要智能交互的AIoT领域便携式智能语音终端基于音频处理能力可用于开发更小巧的智能语音钥匙扣或挂件集成本地唤醒、对话和简单信息查询功能适用于旅行、户外等场景。增强型智能家居中控在实现语音控制的基础上可增加红外发射模块使其能直接控制传统非智能家电或集成Zigbee/蓝牙Mesh网关芯片成为家庭物联网的真正中枢。交互式教育或陪伴玩具利用模组的AI音频、Wi-Fi连接和驱动屏幕的能力可以开发具备丰富表情反馈 、语音互动和在线内容更新的智能教育机器人或儿童故事机提供更拟人化的体验。工业物联网语音交互界面在工业环境中操作人员双手可能被占用。基于该模组开发具备降噪功能的语音指令识别设备可以实现对设备状态查询、简单指令下达的无触控操作提升作业安全与效率。乐鑫官方开发文档https://espressif.craft.me/1gOl65rON8G8FK​

相关文章:

开源!手搓ESP-VoCat 喵伴桌面AI助手,帮你养萌宠 OpenClaw龙虾,内置豆包,会听、会动、会陪伴

模组选型:ttps://item.taobao.com/item.htm?ftt&id1033585120956&spma21dvs.23580594.0.0.4fee2c1bAqCiqc&skuId6211360130611 ESP-VoCat 喵伴是乐鑫携手火山引擎扣子大模型团队打造的智能 AI 开发套件,适用于玩具、智能音箱、智…...

Win11Debloat开源工具:焕新Windows系统体验的极简优化指南

Win11Debloat开源工具:焕新Windows系统体验的极简优化指南 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter an…...

3个实战场景×5个核心技巧:Umi-OCR本地化部署与效率提升完全指南

3个实战场景5个核心技巧:Umi-OCR本地化部署与效率提升完全指南 【免费下载链接】Umi-OCR OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置…...

你的企业还在靠人工处理重复工作?同行已经用 AI 释放人力了 | 2026企业数字化转型指南:基于实在Agent的端到端自动化解决方案

在2026年的数字化浪潮中,企业间的竞争已经从“资源规模”转向了“响应速度”。 当多数企业还在为报表合并、数据搬运、跨系统审核等重复性劳动耗费大量人力时, 领先的行业标杆已经开始通过智能体技术重构底层作业逻辑。 这种转变不仅是工具的更替&#x…...

坚定信心,顺势而为 ——中国企业出海与人工智能时代语言服务行业的新机遇

坚定信心,顺势而为——中国企业出海与人工智能时代语言服务行业的新机遇前言人工智能技术的逐步成熟以及智能体的普遍应用是最近两三年的热点和趋势,很多人说,2026年是智能体爆发的元年。春节期间,豆包、千问、元宝等50亿元的红包…...

STM32实战:sprintf格式化字符串在嵌入式LCD显示中的高效应用

1. sprintf函数在STM32开发中的基础应用 第一次在STM32上使用sprintf函数时,我被它的强大功能惊艳到了。这个看似简单的函数,却能帮我们把各种数据类型转换成整齐的字符串,这在嵌入式开发中简直是神器。记得当时我在调试一个温湿度传感器项目…...

实战指南:基于快马AI生成可部署的、支持多游戏与数据库的账号管理应用

今天想和大家分享一个实战项目:用Python开发一个支持多游戏的账号管理器(俗称"lv上号器")。这个工具特别适合游戏多开玩家,能安全存储不同游戏的账号信息,还能一键登录不同游戏客户端。 项目需求分析 首先明…...

PX4固件二次开发入门:从源码结构到第一个自定义模块(基于v1.11版本)

PX4固件二次开发实战:从源码解析到自定义模块开发(v1.11版本) 当你第一次打开PX4的源码仓库,面对数十个文件夹和数千个文件时,那种扑面而来的压迫感我深有体会。作为过来人,我想分享一套系统性的二次开发方…...

[AI/应用/MCP] MCP Server/Tool 开发指南

1. 智能软件工程的范式转移:从库集成到原生框架演进 在生成式人工智能(Generative AI)从单纯的文本生成向具备自主规划与执行能力的“代理化(Agentic)”系统跨越的过程中,.NET 生态系统正在经历一场自该平台…...

Qwen Pixel Art企业级应用:游戏公司美术外包降本提效实战路径

Qwen Pixel Art企业级应用:游戏公司美术外包降本提效实战路径 1. 游戏美术外包的痛点与机遇 游戏开发中,美术资源制作往往占据大量成本和时间。传统像素美术外包存在三个核心痛点: 成本高:资深像素画师日薪通常在800-1500元&am…...

Qwen3.5-9B企业落地:制造业BOM表识别+物料替代方案生成实战

Qwen3.5-9B企业落地:制造业BOM表识别物料替代方案生成实战 1. 项目背景与价值 在制造业生产过程中,物料清单(BOM)管理和物料替代是常见的痛点问题。传统方式需要人工核对大量表格数据,效率低下且容易出错。Qwen3.5-9B作为90亿参数的开源大语…...

一文了解嵌入式硬件通信核心:串口/CAN/以太网,底层逻辑居然全一样!

做嵌入式、工控、硬件通信开发久了,总会有一个突然顿悟的瞬间:串口、以太网、CAN、TCP、USB、蓝牙、Modbus……这些看似毫无关联、应用场景天差地别的通信方式,扒开底层逻辑才发现,居然是同一个模子刻出来的。看透这一点后&#x…...

IQR四分位数法是什么?

一、核心概念:四分位数与IQR1. 四分位数(Quartiles)将一组有序数据(从小到大排列)划分为4个相等部分的三个关键分割点,分别记为:Q1(第一四分位数,25%分位数)&…...

Phi-4-mini-reasoning Chainlit协作功能:多人审阅、批注与推理结果共享

Phi-4-mini-reasoning Chainlit协作功能:多人审阅、批注与推理结果共享 1. 模型概述 Phi-4-mini-reasoning是一个基于合成数据构建的轻量级开源模型,专注于高质量、密集推理的数据处理能力。作为Phi-4模型家族的一员,它经过专门微调以提升数…...

ANR-WatchDog源码深度剖析:从线程监控到错误抛出的完整实现

ANR-WatchDog源码深度剖析:从线程监控到错误抛出的完整实现 【免费下载链接】ANR-WatchDog A simple watchdog that detects Android ANR (Application Not Responding) error and throws a meaningful exception 项目地址: https://gitcode.com/gh_mirrors/an/AN…...

GME-Qwen2-VL-2B自动化测试:基于模型视觉理解的GUI界面测试脚本

GME-Qwen2-VL-2B自动化测试:基于模型视觉理解的GUI界面测试脚本 1. 引言 你有没有遇到过这样的场景?辛辛苦苦写了一套UI自动化测试脚本,结果软件界面稍微改个按钮颜色、挪个位置,整个测试就全挂了。维护成本高得吓人&#xff0c…...

目录中不显示标题中间的软换行符Shift+Enter

文档中的标题过长时,通常使用ShiftEnter软换行符来给标题在合适的位置换行,以实现美观的排版效果。然而,插入软换行符会造成自动产生的目录中标题文本中间出现空格,如图所示:那么,如何让目录中不显示这个软…...

智慧卤味,一码追溯:万界星空MES方案

一、行业痛点与MES目标1、主要痛点生产依赖经验:卤制时间、温度、配料比例依赖人工经验,产品口味和质量不稳定。追溯困难:一旦出现食品安全问题,难以快速精准追溯到问题源头(原料批次、生产环节、操作人员等&#xff0…...

手把手教你用VSCode给Ai-WB2-12F烧录固件(含串口调试技巧)

手把手教你用VSCode给Ai-WB2-12F烧录固件(含串口调试技巧) 在物联网开发中,固件烧录是最基础也是最重要的环节之一。对于Ai-WB2-12F这款热门Wi-Fi/BLE双模模组,掌握高效的烧录方法能显著提升开发效率。本文将详细介绍如何利用VSC…...

暗黑破坏神2存档修改实用教程:从入门到精通的d2s编辑器全攻略

暗黑破坏神2存档修改实用教程:从入门到精通的d2s编辑器全攻略 【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor d2s-editor是一款专为《暗黑破坏神2》玩家打造的开源存档编辑工具,支持角色属性调整、物品管…...

3大核心功能解放明日方舟玩家双手:MAA自动化助手全攻略

3大核心功能解放明日方舟玩家双手:MAA自动化助手全攻略 【免费下载链接】MaaAssistantArknights 《明日方舟》小助手,全日常一键长草!| A one-click tool for the daily tasks of Arknights, supporting all clients. 项目地址: https://gi…...

DeepSeek-Coder-V2-Lite-Instruct评估指标详解:代码准确率、效率与创新性

DeepSeek-Coder-V2-Lite-Instruct评估指标详解:代码准确率、效率与创新性 【免费下载链接】DeepSeek-Coder-V2-Lite-Instruct 开源代码智能利器——DeepSeek-Coder-V2,性能比肩GPT4-Turbo,全面支持338种编程语言,128K超长上下文&a…...

为什么你的Polars 2.0清洗脚本在1TB数据下突然卡死?——Lazy Execution陷阱、Chunking边界与并发泄漏三重真相

第一章:为什么你的Polars 2.0清洗脚本在1TB数据下突然卡死?——Lazy Execution陷阱、Chunking边界与并发泄漏三重真相Lazy Execution的隐式延迟引爆内存雪崩 Polars 2.0 默认启用 LazyFrame 模式,所有操作仅构建执行计划,直到调用…...

AI辅助开发进阶:让快马智能助手帮你设计与优化专业图像处理库

今天想和大家分享一个很实用的开发经验——如何用AI辅助工具来优化和扩展专业图像处理库的开发。最近我在做一个Python图像处理工具库,正好用InsCode(快马)平台的AI功能做了些尝试,效果出乎意料的好。 先说说背景。这个工具库最初只有基础的图片缩放和滤…...

构建Pixel Couplet Gen的微信小程序:让AI春联触手可及

构建Pixel Couplet Gen的微信小程序:让AI春联触手可及 1. 项目背景与价值 春节贴春联是中国传统文化的重要组成部分,但现代人往往缺乏时间和书法技能来创作个性化春联。Pixel Couplet Gen作为一款AI春联生成模型,能够根据用户输入自动生成像…...

Pixel Epic智识终端效果展示:跨领域研报生成一致性与专业性验证

Pixel Epic智识终端效果展示:跨领域研报生成一致性与专业性验证 1. 产品概览与核心价值 Pixel Epic智识终端是一款基于AgentCPM-Report大模型构建的专业研究报告生成工具。与传统AI工具不同,它创新性地采用了像素RPG游戏的美学设计,将枯燥的…...

Phi-4-mini-reasoning推理模型5分钟快速上手:数学题逻辑题一键解答

Phi-4-mini-reasoning推理模型5分钟快速上手:数学题逻辑题一键解答 1. 为什么选择Phi-4-mini-reasoning? 如果你经常需要解决数学题、逻辑题或者需要一步步分析的问题,Phi-4-mini-reasoning就是为你量身定制的AI助手。这个模型不像那些通用…...

Phi-3-mini-4k-instruct-gguf实战案例:用轻量模型替代Llama3-8B做高频短任务降本

Phi-3-mini-4k-instruct-gguf实战案例:用轻量模型替代Llama3-8B做高频短任务降本 1. 为什么选择轻量模型 在AI应用落地的过程中,我们常常面临一个困境:大模型效果虽好,但部署成本高、响应速度慢。特别是在处理大量高频短任务时&…...

源代码之下的硅基启示录——Claude Code“核泄漏”事件的深度剖析与时代回响

引言 公元2026年3月30日,一个看似平常的春日,硅基世界却迎来了一场史无前例的地震。 一家以“安全”为最高信条的AI公司,以一种最荒诞的方式,亲手打开了潘多拉的魔盒。Anthropic,这家估值高达3800亿美元的AI新贵&#…...

Java边缘容器化部署卡顿难题(2024最新LTS版HotSpot深度调优白皮书)

第一章:Java边缘容器化部署卡顿难题(2024最新LTS版HotSpot深度调优白皮书)在边缘计算场景下,资源受限的ARM64设备(如Jetson Orin、Raspberry Pi 5)运行JDK 21.0.3 LTS(2024年4月发布&#xff09…...