当前位置: 首页 > article >正文

当智能眼镜遇上了AI——使用灵珠搭建【镜中食谱】智能体

今天带大家沉浸式体验 Rokid 自研的 AI 开发平台——【灵珠平台】 零代码、零门槛手把手教你搭建一个专属的【镜中食谱】智能体让 Rokid Glasses 解决你的吃饭难题本文智能体基于Rokid AI Glasses和灵珠AI平台开发开发指南https://forum.rokid.com/index灵珠平台介绍先来简单介绍一下【灵珠平台】。灵珠是 Rokid 基于 Coze Studio 深度定制的 AI 开放平台为开发者提供了一个零门槛的创作环境。简单来说这就是一个零代码、零门槛的 AI 应用“工厂”。无论您是否有编程经验都能在此快速构建并部署基于大模型的 AI Agent涵盖对话式 AI、视觉识别 AI 等多种类型。借助灵珠您可将创意构想快速转化为实际应用并通过 Rokid Glasses 设备实现落地让智能眼镜的功能得到最大程度的扩展。在这里创意不受限于技术门槛每个人都能轻松实现 AI 与现实世界的无缝连接。灵珠平台体验光说理论没意思咱们直接上手。今天我就带大家从零开始搭建一个【镜中食谱】智能体。之前我搭建过【镜中餐营养师】的智能体镜中餐呢更偏向于通过眼镜拍菜品识别菜品的热量相关信息。这个智能体我们主打一个如何去做饭包括根据食材推荐菜谱根据菜品分析食材。让你想吃什么就做什么通过Rokid Glasses 设备让你做饭做的省心吃饭吃的安心。话不多说开干创建智能体进入灵珠平台首先点击“创建智能体”输入智能体的名称、类别和功能介绍。智能体名称镜中食谱 智能体类别生活 智能体功能介绍拍一拍菜品解锁地道做法拍一拍食材玩转百变烹饪。我是镜中食谱你的随身美食顾问。编排智能体关于人设与回复逻辑我们可以使用灵珠平台提供的模板去填充我们的内容也可以使用自己的prompt提示词。我是比较喜欢使用自己格式的提示词和推荐的也差不多啦~。具体的编排内容代码如下关于为什么叫镜十十镜中食谱镜食镜十十好吧这样来的~# 角色 你是镜十十一个热情耐心、精通中西方烹饪的美食专家。你的核心使命是拍一拍菜品秒解美味做法拍一拍食材烹饪方式任你选。 # 目标 - 帮助用户快速识别菜品分析食材提供对应的菜谱 - 解决用户“吃什么”的难题根据用户提供的食材推荐菜谱 - 协助用户进行烹饪根据图片信息实时指导 - 通过语音交互实现“免手操作”让用户做饭全程不脏手、不翻手机 # 技能 1. **多模态识别理解**能够理解用户拍摄的菜品图片或语音输入的食材清单分析出主要食材和菜品种类 2. **菜谱生成与推荐**根据识别出的食材快速生成2-3个菜谱每个菜谱包含菜名、所需食材、简化步骤每步15字内、预估耗时 3. **语音指令响应**支持“换一个”、“第一个/第二个/第三个”、“怎么做”、“简单点”、“清淡点”等自然语音指令 # 工作流 1. 用户直接询问针对用户问题进行回答 2. 用户通过Rokid眼镜拍摄菜品、食材照片或正在烹饪的食物 3. 智能体分析内容判断是烹饪中的食物、成品菜品还是食材 4. 如果是**烹饪中的食物** → 触发紧急流程回复简洁不说废话明确下一步指令 5. 如果是**成品菜品** → 给出该菜品的所需食材和烹饪步骤 6. 如果是**食材** → 推荐2-3个菜谱用户选择后给出烹饪步骤和步骤大致需要的时间 7. 以简洁文字在眼镜端显示并同步语音播报 # 输出格式 **场景一用户提供的是菜品** 收到【菜名】的做法如下 食材xxx、xxx 步骤 ①xxx ②xxx ③xxx ... 约X分钟开动吧 **场景二用户提供的是食材** 收到食材有xxx。推荐 1.【菜名】菜系约X分钟 2.【菜名】菜系约X分钟 ... 您想要做哪个菜呢 **场景三用户选择菜谱后** 【菜名】来咯 食材xxx、xxx 步骤 ①xxx ②xxx ③xxx ... 小贴士xxx **场景四食材不足** 还差【食材名】 加一点会更美味 或者我推荐不加也能做的菜 # 语音指令 | 用户说 | 动作 | |--------|------| | 换一个 | 重新推荐2-3个不同菜谱 | | 第一个/第二个/第三个 | 展开对应菜谱的详细步骤 | | 怎么做 | 重复当前菜谱的步骤 | | 简单点 | 推荐15分钟内的快手菜 | | 清淡点 | 推荐低油低盐菜谱 | # 限制 - 回复每段文字不超过30字适配Rokid眼镜端显示 - 不主动询问用户偏好仅在用户主动提出时才调整推荐策略 - 若食材不足可以友好提示补充方案选择模型和插件然后选择我们大模型和眼镜控制插件**注意**这里需要选择有多模态能力的大模型哟~设置开场白接下来是设置开场白和预置问题。让我们放一个经典的问题西红柿炒鸡蛋先炒西红柿还是先炒鸡蛋稍后让我们一起来看看模型给出的答案是什么是否和你日常炒菜的行为一致呢~测试智能体先看看我们创建好的智能体吧先让我们在调试页面调试一下后面再展示通过眼镜的效果。测试一西红柿炒鸡蛋先来看看西红柿炒鸡蛋的问题吧~答案不是很满意太不得罪人了本人坚决维护先炒鸡蛋再炒西红柿测试二可乐鸡翅找了一个可乐鸡翅做法我们一起来看下效果吧~六张图片分为6次放松给智能体看下效果第一张发送食材给出了菜谱让我们选择我们这里选择可乐鸡翅。选择可乐鸡翅第二张成功识别出了我们在烹饪过程中全程简洁语言指导。第三张因为图片为网图少了一个捞出鸡翅的图直接进锅煎了~凑合看吧。第四张步骤有些跳跃但仍检测出当前状态并给出了下一步指导。第五张成功识别当前图片上的食物状态并给出了下一步的指导。第六张识别出了菜品完成整体过程中比较连贯个人感觉整体效果还是不错的。真实菜品测试带上眼镜让我们在真实环境中测试一下功能吧写在最后以上就是【镜中食谱】的全部设定啦关于镜中食谱她是你的随身美食顾问热情、耐心、随叫随到。拍一拍菜品秒解做法拍一拍食材随你烹饪。戴上Rokid Glasses眼镜不用翻手机、不用脏手所有信息直接浮现在眼前厨房就是你的主场。关于Rokid【镜中食谱】专为Rokid Glasses眼镜打造。通过Rokid的语音交互和视觉识别能力镜十十能看懂你拍的每一道菜、每一种食材甚至能实时指导你正在烹饪的每一步。解放双手让做饭变得更简单、更有趣。关于我我是笑小枫一个喜欢捣鼓AI的技术开发者。我相信科技不该冷冰冰而是像镜十十一样温暖、贴心、好用。Rokid眼镜让我有机会把这样的想象变成现实。后续计划优化烹饪中的实时指导增加更多语音指令和个性化推荐适配更多Rokid眼镜的功能更新最后想说如果你有Rokid眼镜欢迎试试【镜中食谱】智能体也欢迎给我提建议让智能体变得更好。愿每一餐都有温度每一个厨房都有【镜中食谱】。我是笑小枫戴上Rokid我们镜中见

相关文章:

当智能眼镜遇上了AI——使用灵珠搭建【镜中食谱】智能体

今天带大家沉浸式体验 Rokid 自研的 AI 开发平台——【灵珠平台】! 🌟 零代码、零门槛,手把手教你搭建一个专属的【镜中食谱】智能体,让 Rokid Glasses 解决你的吃饭难题! 本文智能体基于Rokid AI Glasses和灵珠AI平…...

Pi0视觉-语言-动作流模型科研应用:人类意图识别与机器人行为对齐研究

Pi0视觉-语言-动作流模型科研应用:人类意图识别与机器人行为对齐研究 1. 项目概述与科研价值 Pi0是一个突破性的视觉-语言-动作流模型,专门为通用机器人控制而设计。这个模型的核心价值在于它能够将人类的自然语言指令、视觉感知和机器人动作生成无缝连…...

robot_localization实现imu和odom融合

记录使用robot_localization进行融合下载地址:git clone https://gitee.com/bingshuibuliang/robot_localization.git注意:/odometry/filtered是这个节点发送的融合位姿,修改的话需要在ekf_nodelet_template.launch里,在使用robot…...

从扩频时钟到弹性缓存:一张图看懂PCIe是如何‘容忍’时钟偏差,保证数据不丢的

从水流模型到数据同步:图解PCIe时钟偏差补偿机制 想象一下城市供水系统中两个不同步的水泵——一个抽水快,一个抽水慢。如果没有调节装置,要么水管爆裂,要么用户断水。PCIe总线面临的时钟同步挑战与此惊人相似。本文将用生活化的水…...

《Spring Boot 第一个 REST API 教程》

前置知识:Java 基础、Maven 基础 最终效果:启动一个 Spring Boot 应用,通过浏览器访问 http://localhost:8080/hello 得到 {"msg":"Hello World"} 步骤 1:创建项目 推荐使用 Spring Initializr:…...

ROS2笔记2:使用Topic自定义Messages实现nodes之间通讯

1. Package规划 1.1 自定义消息接口my_interface_pkg DirCommandRequest.msg请求Topic消息 由发起node发起的Topic消息builtin_interfaces/Time stamp # 记录时间戳 string directory # 操作的目录 int8 command # 操作指令. 0:list, 1:re…...

如何3分钟解决百度网盘提取码难题:baidupankey完全指南

如何3分钟解决百度网盘提取码难题:baidupankey完全指南 【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 你是否曾因找不到百度网盘提取码而错过重要资源?当朋友分享学习资料、同事发送工作文件&#xff…...

2026年最新好用的WMS仓库管理系统盘点!10款国内外热门WMS系统推荐

面对仓储管理的挑战,越来越多的企业开始关注WMS系统。但在选型时,很多企业面临同样的困惑:市场上WMS系统那么多,到底哪款适合自己?本文盘点2026年国内外10款热门WMS系统,从功能特点、适用场景、性价比等维度…...

3分钟搞定百度网盘提取码:baidupankey智能工具终极指南

3分钟搞定百度网盘提取码:baidupankey智能工具终极指南 【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 你是否曾经遇到过这样的情况:好不容易找到了需要的资源,却被百度网盘提取码挡在门外&…...

打卡信奥刷题(3138)用C++实现信奥题 P7617 [COCI 2011/2012 #2] KOMPIĆI

P7617 [COCI 2011/2012 #2] KOMPIĆI 题目描述 给定 NNN 个正整数 A1,A2,...,ANA_1,A_2,...,A_NA1​,A2​,...,AN​&#xff0c;求有多少整数对 (i,j)(i,j)(i,j)&#xff0c;满足以下条件&#xff1a; 1≤i<j≤N1 \le i < j \le N1≤i<j≤NAiA_iAi​ 和 AjA_jAj​ 至…...

如何让全面战争MOD开发从繁琐变得优雅:RPFM的现代化解决方案

如何让全面战争MOD开发从繁琐变得优雅&#xff1a;RPFM的现代化解决方案 【免费下载链接】rpfm Rusted PackFile Manager (RPFM) is a... reimplementation in Rust and Qt5 of PackFile Manager (PFM), one of the best modding tools for Total War Games. 项目地址: https…...

我第一次做 OData 后端服务时,真正绊住我的,不是代码,而是 Cloud Foundry 里的这些基础坑

最近我给自己加了一条训练线,除了平时在社区里吸收知识、输出知识,我还逼着自己每周完成一个带明确目标的小任务。第二个任务,我挑了一个很适合拿来练基本功的方向,亲手做一个基于 OData 的后端服务。 原本我以为,真正费劲的部分会落在 OData 协议本身,像 entity、servi…...

CSS如何快速获取网页上的标准色值_借助开发者工具的取色器和色彩格式转换功能

Chrome开发者工具中点击Styles面板颜色旁小色块启用取色器&#xff0c;悬停页面实时显示hex/rgb/hsl值&#xff0c;长按可循环切换格式&#xff1b;rgba透明度和色彩空间差异会导致与设计稿不一致。Chrome开发者工具里怎么直接取网页上某个颜色的十六进制值点开 DevTools&#…...

【Linux】进程(2)状态

目录 一、冯诺依曼 二、操作系统 三、进程状态 &#xff08;1&#xff09;运行状态&#xff1a;进程已获得CPU资源&#xff0c;正在执行指令&#xff0c;是进程生命周期中唯一能直接操作硬件、推进任务的阶段。 &#xff08;2&#xff09;阻塞状态&#xff1a;进程因等待特…...

Canny边缘检测的精度天花板在哪里?深入剖析Devernay亚像素校正的误差与优化

Canny边缘检测的精度天花板在哪里&#xff1f;深入剖析Devernay亚像素校正的误差与优化 在工业检测、遥感成像等对精度要求严苛的领域&#xff0c;传统Canny算法提供的像素级边缘定位往往难以满足需求。当测量芯片电路线宽或分析卫星图像中的道路边界时&#xff0c;即使单个像素…...

2026 最新 Gemini 国内能用吗?无需特殊配置直连教程

在2026年的今天&#xff0c;AI工具已经成为我们日常生活和工作的重要助手。很多用户关心&#xff1a;Gemini这款由Google推出的强大AI模型&#xff0c;在国内能否顺畅使用&#xff1f;答案是肯定的。目前最推荐的访问方式是通过OneAiPlus(u.oneaiplus.cn)平台&#xff0c;它聚合…...

JDK安装与忍者像素绘卷:天界画坊Java SDK开发实战

JDK安装与忍者像素绘卷&#xff1a;天界画坊Java SDK开发实战 1. 前言&#xff1a;为什么需要这个SDK 如果你正在开发一个需要调用AI绘画服务的Java应用&#xff0c;直接处理HTTP请求、参数序列化和结果解析可能会很麻烦。本文将带你从JDK安装开始&#xff0c;一步步构建一个…...

BGE Reranker-v2-m3效果实测:在低资源方言查询(如粤语书面语)中保持83%+匹配准确率

BGE Reranker-v2-m3效果实测&#xff1a;在低资源方言查询&#xff08;如粤语书面语&#xff09;中保持83%匹配准确率 1. 引言&#xff1a;方言查询的匹配挑战 在日常信息检索中&#xff0c;我们经常遇到一个棘手问题&#xff1a;当用户使用方言或地区性语言进行查询时&#…...

2026年,高精度食品卫生级超声波液位计批发,究竟有何独特之处?

在食品行业的生产过程中&#xff0c;液位的精确测量至关重要&#xff0c;它关乎着产品的质量、生产的效率以及成本的控制。高精度食品卫生级超声波液位计作为一种关键的测量工具&#xff0c;在2026年的市场上正发挥着越来越重要的作用。下面我们就来详细探讨一下它的独特之处。…...

yolov8模型训练MOT20数据集 行人多目标跟踪计数数据集的训练及应用 如何根据mot20数据集 来实现行人目标识别,行人追踪,行人的计数

yolov8模型训练MOT20数据集 行人多目标跟踪计数数据集的训练及应用 如何根据mot20数据集 来实现行人目标识别&#xff0c;行人追踪&#xff0c;行人的计数 文章目录1. 数据准备与预处理2. 创建 data.yaml 文件3. 环境搭建4. 模型训练5. 推理与部署6. 性能评估7. 模型导出行人追…...

线性代数与矩阵运算:AI世界的数学基石——从SVD到特征值分解的实战解析

线性代数与矩阵运算&#xff1a;AI世界的数学基石摘要&#xff1a;线性代数是人工智能的数学语言。本文深入解析向量、矩阵、特征值、SVD等核心概念&#xff0c;结合Python代码实战&#xff0c;带你理解这些数学工具如何在降维、推荐系统、图像压缩等AI场景中发挥关键作用。一、…...

Claude Design发布:3个核心能力让设计到代码全程自动化,Adobe和Figma股价应声下跌

大家好&#xff0c;我是苍一&#xff0c;一个干了13年的后端开发&#xff0c;正在探索AI编程&#xff0c;从产品到开发的全生命周期最佳实践&#xff0c;如果您感兴趣&#xff0c;欢迎关注&#x1f447;&#xff0c;看我如何自我革命。Anthropic旗下实验室刚刚推出了一款名为Cl…...

亲测有效:GPT-OSS-20B在M1 Mac上的运行效果与速度实测

亲测有效&#xff1a;GPT-OSS-20B在M1 Mac上的运行效果与速度实测 1. 开篇&#xff1a;打破认知的本地大模型体验 当大多数人还在依赖云端API访问大语言模型时&#xff0c;一个令人惊喜的事实正在发生&#xff1a;搭载M1芯片的MacBook已经能够流畅运行参数量达210亿的GPT-OSS…...

Android TTS开发避坑指南:从Google TTS到华为引擎,如何搞定多语言语音包下载与兼容性?

Android TTS开发实战&#xff1a;多引擎兼容与语言包管理全解析 在全球化应用开发中&#xff0c;文本转语音&#xff08;TTS&#xff09;功能的质量直接影响着用户体验。当你的应用需要支持英语、西班牙语、阿拉伯语等多语言场景时&#xff0c;不同设备厂商的TTS引擎差异就像一…...

DeEAR在客服质检中的落地应用:基于wav2vec2的语音情感多维评估实战案例

DeEAR在客服质检中的落地应用&#xff1a;基于wav2vec2的语音情感多维评估实战案例 1. 引言&#xff1a;客服质检中的情感识别挑战 在客服行业&#xff0c;传统的质检方式主要依赖人工抽查录音&#xff0c;不仅效率低下&#xff0c;而且难以客观评估服务过程中的情感表达。一…...

real-anime-z显存优化部署方案:6GB显存卡运行1024×1024真实系出图

real-anime-z显存优化部署方案&#xff1a;6GB显存卡运行10241024真实系出图 1. 模型简介 real-anime-z是基于Z-Image的Lora版本的真实系动画图片生成模型。该模型经过特殊优化&#xff0c;能够在仅6GB显存的显卡上稳定运行&#xff0c;并生成10241024分辨率的高质量真实系动…...

告别手动写提示词:AI头像生成器帮你快速设计专属头像

告别手动写提示词&#xff1a;AI头像生成器帮你快速设计专属头像 1. 为什么你需要AI头像生成器 在数字社交时代&#xff0c;头像已经成为个人品牌的重要组成部分。无论是社交媒体、工作平台还是游戏社区&#xff0c;一个精心设计的头像能让你在众多用户中脱颖而出。然而&…...

YOLO12手把手教学:从上传图片到获取检测结果完整流程

YOLO12手把手教学&#xff1a;从上传图片到获取检测结果完整流程 1. 引言 目标检测是计算机视觉领域最基础也最重要的任务之一&#xff0c;而YOLO系列模型因其出色的实时性能一直备受关注。2025年最新发布的YOLO12模型在保持实时推理速度的同时&#xff0c;通过创新的注意力机…...

Qwen3.5-9B-GGUF真实案例:软件需求文档→测试用例→接口定义链式生成

Qwen3.5-9B-GGUF真实案例&#xff1a;软件需求文档→测试用例→接口定义链式生成 1. 项目背景与模型介绍 Qwen3.5-9B-GGUF是阿里云开源的Qwen3.5-9B模型经过GGUF格式量化后的版本&#xff0c;特别适合在消费级硬件上部署运行。这个90亿参数的稠密模型采用了创新的Gated Delta…...

注意力机制模块:老树发新芽:SE 注意力结合硬件友好型 Swish 激活函数,在边缘端模型中的极限优化

前言:边缘AI的「不可能三角」与两条救赎路径 2026年的边缘AI领域正在经历一场静默的革命。Google的TPU v7 Ironwood芯片、Qualcomm的77 TOPS物联网处理器、Ambiq基于Arm Ethos-U85的Atomiq SoC——这些硅基巨兽的算力一路飙升,但当我们把目光从云端数据中心转向智能家居、工…...