当前位置: 首页 > article >正文

高德联合千问开源AGenUI:让Agent UI同时跑在iOS、安卓和鸿蒙上

近日高德与阿里千问C端应用团队联合发布了AGenUI——这是行业首个覆盖iOS、Android、HarmonyOS三端的端云一体原生A2UI开源框架。开发者接入SDK后即可将Agent的输出直接渲染为可交互的原生卡片无需为不同平台分别写UI代码。AGenUI基于Google A2UI协议构建补全了这些描述如何在手机上跑起来的端侧原生渲染能力两者结合推动AI应用从文本式交互走向生成式UI交互。目前已正式开源访问genui.amap.com或GitHub即可参与。一、痛点Agent很聪明但界面很原始在大语言模型能力不断突破的今天Agent早已不只是简单的问答机器——它具备了规划、记忆、工具调用等复杂能力。无论是LangChain、LangGraph还是AutoGen开发者都能构建出足够聪明的智能体。但与此同时Agent与用户之间的交互方式却始终停留在最基础的聊天框模式。举个例子当你想让Agent帮你完成一个多步骤操作比如订机票传统模式下Agent只能输出一段冗长的文字请选择出发日期、选择航班、填写乘客信息……然后你得手动完成所有步骤再把结果反馈给Agent。这种低效的交互方式不仅让用户疲于应对也浪费了Agent的智能算力。问题的根源在于Agent知道要什么样的界面但没有办法直接生成并呈现给用户——它只能输出文本把搭界面这件事推给用户自己完成。这就是A2UI协议诞生的背景。二、Google A2UI协议让Agent描述界面而不是编写界面Google在去年年底提出了并开源了A2UIAgent-to-User Interface协议。这套协议定义了Agent与前端之间的通信标准让Agent能够用统一的方式描述界面需求前端则按照标准将其渲染为真实的UI组件。A2UI的核心设计哲学是声明式UI——Agent只描述不编码。传统的Agent交互中若想实现界面展示往往需要Agent生成HTML、JSX等前端代码再由前端解析执行。这种方式不仅要求Agent具备前端编码能力还会带来兼容性和安全性问题。A2UI采用了完全不同的思路Agent不再输出前端代码而是输出一套结构化的JSON数据用于描述需要什么界面组件“组件有什么属性”“组件之间的层级关系”。比如Agent想要一个姓名输入框只需要输出这样的JSONjson复制{ surfaceUpdate: { surfaceId: main, components: [ { id: name, component: { type: TextField, props: { label: 姓名 } } } ] } }这段JSON清晰地告诉前端需要在ID为main的界面上添加一个文本输入框组件标签为姓名。前端负责将这种结构化描述映射成真实的本地UI组件至于用React、Vue还是其他框架实现完全由前端决定Agent无需关心。A2UI的四大核心特性1.声明式UIAgent输出结构化JSON描述界面需求不输出可执行代码2.安全可控Agent输出的是数据而非代码前端只渲染白名单组件从根源上解决安全性问题3.跨平台渲染Agent只需描述我要一个输入框一个按钮无需关心这个输入框在不同平台的技术实现4.模型解耦不绑定特定LLM任何能够输出符合规范的JSON的模型都可以接入2026年4月Google正式推出A2UI 0.9版本搭载共享Web核心库与官方React渲染器同时完成对Flutter、Lit、Angular等主流开发框架的渲染器更新并推出支持Python环境安装的Agent SDK进一步降低了AI智能体接入与开发门槛。三、A2UI的三层架构协议层、渲染层、数据层A2UI的核心架构分为三层每一层都有清晰的分工1. 协议层Agent-to-UI Communication这是A2UI的核心定义了Agent与前端之间的通信格式和标准。Agent通过输出符合A2UI协议的JSON数据向前端传递界面描述信息这部分数据被称为surfaceUpdate界面更新。一个典型的协议层示例——餐厅搜索界面json复制{ surfaceUpdate: { surfaceId: restaurant-search, components: [ { id: search-form, component: { type: Form, children: [ {type: TextField, props: {placeholder: 搜索餐厅...}}, {type: Button, props: {text: 搜索}} ] } } ] } }三个核心字段surfaceId标识界面唯一IDcomponents是组件数组每个组件包含type组件类型、props属性、children子组件等字段。2. 渲染层Framework-Agnostic Rendering渲染层的核心职责是将协议层的结构化JSON数据映射成各个前端框架能够识别的本地UI组件。渲染层是框架无关的——无论前端使用React、Vue、Angular还是SwiftUI、Compose都可以实现A2UI的渲染逻辑平台渲染方式WebReact / Angular / LitiOSSwiftUIAndroidComposeFlutterWidget本质上渲染层就是一个翻译器将A2UI协议定义的抽象组件翻译成各个平台原生的具体组件。3. 数据层双向数据同步在实际交互中前端也需要向Agent反馈用户操作的数据比如用户输入的文本同时Agent也可能需要向前端推送动态数据比如搜索结果。数据层通过dataModelUpdate数据模型更新字段来实现双向数据同步。这意味着Agent与前端之间不仅能实现界面交互还能实现数据的实时同步为复杂交互场景表单提交、动态列表、状态更新等提供了坚实的技术支撑。四、AGenUI让A2UI在手机上真正跑起来Google的A2UI协议定义了模型如何描述界面但并没有解决这些描述如何在手机上跑起来的问题——它主要面向Web端。AGenUI正是来解决这个问题的。高德与阿里千问C端应用团队联合发布的AGenUI是行业首个覆盖iOS、Android、HarmonyOS三端的端云一体原生A2UI开源框架。它在Google A2UI协议的基础上补全了移动端的端侧原生渲染能力。AGenUI的端云一体架构•云侧通过Agent Skill生成AI原生的A2UI JSON。这一步降低了大模型的Token消耗——Agent不需要输出大段文本说明只需要输出结构化的界面描述同时降低了输出不确定性——JSON格式比自然语言的界面描述更稳定、更易于解析•端侧依托跨平台C Core统一处理协议解析、状态管理与布局计算在iOS、Android和鸿蒙三端直接渲染为原生组件从底层保证了多端体验一致这是关键的一点AGenUI不是通过JavaScript或WebView来实现跨平台而是用C核心在三个平台各自渲染原生组件。这意味着性能更高、体验更接近原生应用。Streaming-first流式架构是AGenUI的核心设计之一•“边生成边呈现”组件到达即刻挂载不需要等完整JSON生成完毕才开始渲染•最小化节点差分更新只更新变化的部分不重新渲染整个界面•独立线程异步渲染渲染操作在独立线程执行高频增量更新也不会卡主线程这三个机制结合确保了即使Agent在流式生成复杂界面时用户也能获得流畅的交互体验——不会出现等Agent说完才显示界面的尴尬。开发者资源•内置22个基础组件覆盖按钮、表单、卡片、列表等常见场景•45项CSS属性支持细粒度的样式定制•Theme系统支持Design Token模型只需输出语义描述如蓝色主色调端侧即可自动映射为符合品牌规范的具体样式官网genui.amap.comGitHubhttps://github.com/AGenUI/AGenUI五、高德千问为什么是这个组合AGenUI的诞生背后是复杂场景与AI交互的结合。高德长期深耕地图导航、本地生活等真实世界复杂服务积累了大量的多设备协同场景经验。地图应用是一个典型的复杂场景——它涉及实时数据更新、多层级界面、复杂的用户交互模式。高德在端侧工程能力上有深厚的积累包括跨平台渲染、性能优化、原生组件开发等。千问则在大规模AI应用入口、Agent交互与开发者生态上持续投入。千问的C端应用团队在AI交互探索上有丰富经验对Agent与用户之间的交互模式有深入理解。高德的端侧工程能力加上千问的AI交互探索才有了这套面向开发者的生成式UI基础设施。这个组合很合理一个懂如何把东西在手机上跑好一个懂如何让Agent和用户交互更顺畅。六、生成式UI的下一步从文本到卡片A2UI AGenUI的结合推动AI应用从文本式交互走向生成式UI交互。传统的文本式交互Agent输出文字说明用户自己理解、自己操作。Agent很聪明但用户必须翻译Agent的文字意图并转化为操作。生成式UI交互Agent直接生成并呈现可交互的界面组件用户可以直接操作、实时反馈形成真正的对话式交互。一个典型的场景对比•文本式Agent说请在下方选择您的出发城市然后选择目的地城市点击搜索按钮——用户得自己找到下拉框、自己选择•生成式UIAgent直接把城市选择器渲染出来用户直接点击选择这不只是体验的提升更是Agent能力的真正释放。当Agent不需要用文字教用户怎么操作它可以把更多算力放在真正重要的决策和执行上。目前高德与千问C端应用团队已完成了生成式UI链路的Demo验证将进一步推动其在真实应用场景中落地上线。文章来源AITOP100原文链接https://www.aitop100.cn/infomation/details/33810.html

相关文章:

高德联合千问开源AGenUI:让Agent UI同时跑在iOS、安卓和鸿蒙上

近日,高德与阿里千问C端应用团队联合发布了AGenUI——这是行业首个覆盖iOS、Android、HarmonyOS三端的端云一体原生A2UI开源框架。开发者接入SDK后,即可将Agent的输出直接渲染为可交互的原生卡片,无需为不同平台分别写UI代码。 AGenUI基于Go…...

基于RAG的代码知识库构建:从原理到本地部署实战

1. 项目概述:当代码库成为知识库,我们如何精准“提问”?最近在跟几个做AI应用开发的朋友聊天,大家普遍有个痛点:项目代码越堆越多,文档要么不全要么过时,新来的同事想了解某个模块的逻辑&#x…...

《2026 年生成电商主图最好的 5 个软件,实测后我只留了这几款》

做电商 5 年,从淘宝做到亚马逊,我用过的主图设计工具不下 20 款。2026 年 AI 工具爆发后,很多老软件其实已经被淘汰了。这篇把我目前还在用的 5 款整理出来,都是真金白银测过的,不是广告。先说结论:如果你只看一句话——想一键出主图详情页全套:选潮际好麦只做白底主图:选佐糖要…...

构建Discord与GitHub知识库:llmcord项目实战与RAG应用

1. 项目概述与核心价值 最近在折腾一些AI应用,发现一个挺有意思的现象:很多开发者习惯在Discord上讨论技术、分享进度,但Discord本身的消息流是“实时”且“瞬时”的,有价值的讨论很容易被淹没。同时,像GitHub Issues…...

(int *p)

f(&i) 是「把地址送进去」printf(" p%p\n", p); 是「把地址打印出来」送什么,就打印什么!完全对应!2. 一步步走一遍流程① main 函数里:c运行f(&i);&i 取变量 i 的地址这句话的意思:把 i 的地址…...

短视频去重怎么做才有效?2026年AI工具对比与实操指南

在短视频平台算法日益严格的背景下,简单搬运或轻微修改的视频越来越难获得流量推荐。尤其对于电商带货、知识博主和矩阵号运营者而言,“如何有效去重”已成为内容能否过审、账号能否存活的关键问题。许多创作者尝试手动调色、加滤镜、裁剪画面&#xff0…...

Turbo模式究竟值不值得升级?20年AIGC架构师给出硬核答案:当并发请求>17qps时,ROI暴跌41%——附压测脚本与决策矩阵

更多请点击: https://intelliparadigm.com 第一章:Turbo模式究竟值不值得升级?20年AIGC架构师给出硬核答案:当并发请求>17qps时,ROI暴跌41%——附压测脚本与决策矩阵 Turbo模式在LLM服务网关中常被宣传为“…...

手机黑屏怎么导出微信

手机突然黑屏,屏幕完全无法点亮,而微信里还存着重要的聊天记录、工作文件或亲友照片——这种“数据被困”的焦虑,几乎每位智能手机用户都可能遇到。很多人第一反应是“手机坏了,数据肯定也没了”,但事实真的如此吗&…...

从代码到知识图谱:构建交互式源码可视化分析工具

1. 项目概述:从“代码仓库”到“知识图谱”的跃迁在软件开发领域,我们每天都要面对海量的代码库。无论是为了复用轮子、学习最佳实践,还是为了理解一个庞大项目的架构,我们通常的做法是:克隆仓库、打开IDE、在文件和目…...

独家披露:某头部出版社用ElevenLabs量产2000+小时有声书的私有TTS工作流(含情感锚点注入、方言音色迁移、章节过渡衰减算法)

更多请点击: https://intelliparadigm.com 第一章:ElevenLabs有声书效果语音 ElevenLabs 凭借其基于扩散模型与音素级韵律建模的 TTS 架构,在有声书制作领域展现出远超传统语音合成系统的自然度与情感表现力。其语音输出具备细微的呼吸停顿、…...

HC9615高精度、高纹波抑制比、低噪声、超快响应LDO

HC9615系列是以CMOS工艺制造的高精度,高纹波抑制比,低噪音,超快响应低压差线性稳压器。HC9615系列稳压器内置固定的参考电压源,误差修正电路,限流电路,相位补偿电路以及低内阻的MOSFET,达到高纹…...

高颜值、免费又好用的Linux命令速查神器:TUX星球,强烈推荐给大家!!

Linux 命令总是记不住?比死背更重要的是先学会“怎么查” 很多人刚开始接触 Linux 时,都会遇到一个很真实的问题:命令太多,参数太多,今天刚查过的 tar、grep、find,过两天又忘了;线上排查问题时…...

开源知识管理工具Mindolph:文件优先的跨平台笔记聚合器

1. 项目概述:一个为思考者设计的全平台知识管理工具 如果你和我一样,每天需要在不同设备上处理海量的笔记、代码片段、待办事项和零散想法,并且对市面上那些要么功能臃肿、要么平台锁死的笔记软件感到厌倦,那么今天聊的这个开源项…...

进程池(C/C++)

C语言实现 /** 进程池示例* 使用消息队列进行任务分发*/#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <sys/wait.h> #include <sys/msg.h> #include <string.h>#define WORKER_NUM 3 // 进程池中工作进…...

ChatAllAI2开源项目:一站式多模型AI对话平台部署与二次开发指南

1. 项目概述与核心价值最近在折腾AI应用开发&#xff0c;发现一个挺有意思的现象&#xff1a;很多开发者想快速体验不同大语言模型的能力&#xff0c;或者想给自己的项目集成一个多模型对话的前端界面&#xff0c;但往往被繁琐的环境配置、复杂的API调用和界面开发给劝退。我自…...

开源AI Agent项目MatchClaws:用LLM重塑社交匹配与对话体验

1. 项目概述&#xff1a;当AI遇见约会&#xff0c;一个开源智能体如何重塑社交连接最近在GitHub上闲逛&#xff0c;发现了一个挺有意思的项目&#xff1a;jessastrid/matchclaws-ai_agent_dating。光看名字&#xff0c;你可能会觉得这又是一个蹭AI热度的概念玩具&#xff0c;但…...

VSCode配置C++开发环境:OpenCV跨平台实战指南

1. 为什么选择VSCode进行C开发&#xff1f; 很多刚接触C开发的同学都会纠结该用什么开发工具。我在刚入门时也试过各种IDE&#xff0c;从Visual Studio到CLion&#xff0c;最后发现VSCode才是最适合跨平台开发的轻量级选择。VSCode不仅免费开源&#xff0c;而且通过插件系统可以…...

【运维必备软件安装教程】

文章目录一、VMware Workstation Pro二、MobaXterm一、VMware Workstation Pro 安装虚拟机&#xff08;VMware&#xff09;保姆级教程&#xff08;附安装包&#xff09; 二、MobaXterm MobaXterm&#xff08;终端工具&#xff09;下载&安装&使用教程...

一个开源免费的轻量Blazor UI控件库

bit BlazorUI组件原生、易于定制,并且在所有交互式Blazor模式(WASM、服务器、混合、预渲染)中无缝运行,节省时间,使开发过程更愉快。 bit BlazorUI是一个专为 Blazor 开发的高性能原生 UI 组件库,可以帮助开发者高效构建高质量应用。它拥有 80 多个高性能组件,总体体积…...

解决kali服务器ssh登陆受限

1. 给服务器配置 ssh 端口映射&#xff08;默认22&#xff09;&#xff0c;并开放相应的端口防火墙 2. 安装并为一般用户&#xff08;这里以 kali 用户为例&#xff09;配置 sudo 命令 (在 root 用户下) apt update apt install -y sudo usermod -aG sudo kali # 测试确认一下 …...

在线水印去除怎么做?2026年在线水印去除工具推荐与方法盘点

在日常工作和生活中&#xff0c;我们经常需要处理带有水印的图片、视频或文档。无论是工作素材整理、内容创作还是个人资料处理&#xff0c;了解如何使用在线水印去除方法都能显著提升效率。本文将系统梳理2026年主流的在线水印去除工具&#xff0c;并详细介绍各类去水印方法的…...

BMJ Open与Perplexity深度耦合实验(仅限2024Q3授权机构访问的私有检索协议曝光)

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;BMJ Open与Perplexity深度耦合实验的背景与授权边界界定 BMJ Open 作为开放获取、同行评审的综合性医学研究期刊&#xff0c;其元数据 API&#xff08;v2&#xff09;支持结构化查询与批量文献摘要拉取…...

【ElevenLabs情绪模拟技术深度解密】:20年AI语音工程师亲测的5大情感建模陷阱与避坑指南

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;ElevenLabs情绪模拟技术深度解密 ElevenLabs 的情绪模拟并非简单调节语调或语速&#xff0c;而是通过多维度声学特征建模——包括基频&#xff08;F0&#xff09;动态包络、能量分布、共振峰偏移、微停…...

长期使用Taotoken服务在模型稳定性与账单透明度方面的综合反馈

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 长期使用Taotoken服务在模型稳定性与账单透明度方面的综合反馈 作为一名长期将大模型能力集成到开发工作流中的开发者&#xff0c;…...

从4G到5G再到6G:分集与合并技术(SC/MRC/EGC)是如何演进的?一份给工程师的对比指南

从4G到6G&#xff1a;分集与合并技术的演进与工程实践指南 在移动通信领域&#xff0c;信号传输质量始终是工程师们面临的核心挑战。随着通信技术从4G向5G乃至6G演进&#xff0c;分集与合并技术作为对抗信道衰落的关键手段&#xff0c;其实现方式和应用场景也发生了深刻变革。…...

Veo 2与Sora、Pika、Runway ML v4终极横评:18项指标实测(含时长支持、物理仿真、多主体追踪)

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;Veo 2视频生成技术全景概览 Veo 2 是 Google DeepMind 推出的下一代原生视频扩散模型&#xff0c;支持长达 60 秒、1080p 分辨率、24fps 的高质量视频生成&#xff0c;显著超越前代在时序一致性、物理…...

2026年AI大模型API中转站深度测评:谁能成为生产环境下的最优解决方案?

2026年&#xff0c;AI模型的迭代速度进一步加快。从年初在技术社区引起轰动的OpenClaw架构&#xff0c;到GPT - 5.4、Claude 4.6等性能领先的通用模型&#xff0c;再到视频生成领域的Sora2与Veo3&#xff0c;模型之间的竞争愈发激烈。然而&#xff0c;国内开发者在调用这些模型…...

2026年OpenAI接口中转站真实测评:哪款平台能为开发者带来极致体验?

跨国网络延迟、复杂的支付方式以及分散的接口协议&#xff0c;让开发者调用OpenAI API的体验变得支离破碎。而一个智能中转平台&#xff0c;能让这一切变得像调用本地服务一样简单。通过API中转平台&#xff0c;可以一站式解决国内外主流OpenAI模型在价格、网络连通性以及支付方…...

CloakBrowser 拆机:57 个 C++ 补丁能不能撑起“30/30 通过“的承诺?

路易乔布斯 2026-05-14 AI Daily 深度拆解 数据时间锚点&#xff1a;本文写作时 CloakHQ/CloakBrowser 数据为 10.4k stars / wrapper v0.3.28 / Chromium 146 / 57 个 C 补丁&#xff08;Linux/Win&#xff09;/ 16 个 release。一、又一个 &#x1f525; 重磅&#xff0c;但…...

191k Star 的 Superpowers:把 AI 从“会写代码“改造成“守纪律的工程师“

路易乔布斯 2026-05-14 AI Daily 深度拆解 数据时间锚点&#xff1a;本文写作时 obra/superpowers 数据为 191k stars / v5.1.0 (2026-04-30) / 8 个编码代理平台已支持。一、那条让我点进去的 AI 日报 今早翻 AI 日报&#xff0c;第 9/10 条标着 &#x1f525; 重磅&#xf…...