当前位置: 首页 > article >正文

Android 智能操作系统: 通过 AppFunctions 与界面自动化构建智能体生态

作者 / 产品管理副总裁、Android 开发者 Matthew McCullough用户对设备上 AI 的期望正在从根本上改变他们与应用交互的方式。相较于打开应用按部就班地执行任务用户现在更倾向于将繁杂的操作交由 AI 代劳。在这种新的交互模式中成功的定义正在从 让用户打开您的应用 转变为 成功完成各种任务并帮助他们更高效地达成目标。为了帮助您打造适应智能体未来发展的应用我们推出了早期开发者能力以打通您的应用与智能体应用以及个性化助手 (如 Google Gemini) 之间的壁垒。虽然我们正处于这一进程的早期测试阶段在探索应用生态系统这一范式转变的第一步中我们依然将隐私和安全作为这些设计的核心。使用 AppFunctions 助力应用开发Android AppFunctions 允许应用直接向 AI 智能体和助手开放数据和功能。借助 AppFunctions Jetpack 库和平台 API开发者可以创建自描述函数供智能体应用通过自然语言发现和执行。AppFunctions 为 Android 应用提供了一套端侧解决方案。它借鉴了 MCP 云服务器声明后端能力的机制并且与 WebMCP 类似——所有函数均在设备本地运行而非依赖服务器。AppFunctionshttps://developer.android.com/ai/appfunctionsJetpack 库https://developer.android.com/jetpack/androidx/releases/appfunctions平台 APIhttps://developer.android.com/reference/android/app/appfunctions/package-summaryWebMCPhttps://developer.chrome.com/blog/webmcp-eppGalaxy S26 系列上已集成 Gemini 的 Samsung 相册展示了 AppFunctions 的实际应用。比如您现在无需手动浏览相册只需对 Gemini 发出指令 从 Samsung 相册中找找我猫咪的照片Gemini 会接收用户查询智能识别并触发相应的函数并直接在 Gemini 应用中呈现从 Samsung 相册返回的照片这样用户就无需离开当前界面。这种体验是多模态的可以通过语音或文字完成。用户甚至可以在后续对话中使用返回的照片例如通过短信发送给朋友。此集成目前可在 Galaxy S26 系列上使用并将很快扩展到运行 OneUI 8.5 及更高版本的 Samsung 设备。通过 AppFunctionsGemini 已经可以在多个制造商的设备上实现日历、备忘录和任务等应用类别的自动化操作。无论是协调日历活动、整理备忘录还是设置待办事项提醒用户都可以集中简化日常活动管理。日历https://support.google.com/gemini/answer/15305236?hlenref_topic16695931sjid2355454043249888712-NCcoGENIE.Platform%3DAndroidoco1备忘录https://support.google.com/gemini/answer/15230597?hlenref_topic16695931sjid2355454043249888712-NCcoGENIE.Platform%3DAndroidoco1任务https://support.google.com/gemini/answer/15230285?hlenref_topic16695931sjid2355454043249888712-NCcoGENIE.Platform%3DAndroidoco1通过智能界面自动化为智能体应用赋能虽然 AppFunctions 为应用与 AI 智能体和助手之间的通信提供了结构化的框架和更多的控制权但我们知道并非所有交互都已拥有专属的集成方案。我们还在为 AI 智能体和助手开发一套界面自动化框架以便智能地在用户安装的应用上执行通用任务并内置了用户透明度和控制权机制。此平台承担了繁杂的工作开发者无需编写代码即可实现各种智能体功能。这是一种低成本的方式无需在当下进行大规模的工程开发即可扩展其覆盖范围。为了在改进此框架时获得反馈我们将首先在 Galaxy S26 系列及部分精选的 Pixel 10 设备上推出早期预览版用户只需长按电源按钮即可将多步骤任务委托给 Gemini。在 Gemini 应用中推出的测试版功能将率先支持美国和韩国地区在外卖、杂货及网约车等领域的精选应用。无论用户需要为口味各异的家庭成员订购复杂的披萨订单、与同事协调有多个下车点的网约车行程还是复购上次的杂货商品Gemini 都可以利用应用中已有的信息来协助完成任务无需开发者进行任何额外工作。当任务通过界面自动化在后台执行时用户始终拥有控制权。对于任何自动化操作用户都可以选择通过通知或 实时视图 来监控任务的进度并可以随时切换到手动控制模式以接管任务。Gemini 也被设计为在完成敏感任务 (比如进行购买) 之前提醒用户。展望未来在 Android 17 中我们希望扩展这些能力以覆盖更多用户、开发者和设备制造商。我们目前正与一些应用开发者协作打造这些体验随着生态系统的发展我们将专注于提供高质量的用户体验并计划在今年晚些时候分享有关如何使用 AppFunctions 和界面自动化为您的应用集成智能体的更多详细信息。欢迎您关注 谷歌开发者 微信公众号及时了解更多开发技术和产品更新等资讯动态

相关文章:

Android 智能操作系统: 通过 AppFunctions 与界面自动化构建智能体生态

作者 / 产品管理副总裁、Android 开发者 Matthew McCullough用户对设备上 AI 的期望正在从根本上改变他们与应用交互的方式。相较于打开应用按部就班地执行任务,用户现在更倾向于将繁杂的操作交由 AI 代劳。在这种新的交互模式中,成功的定义正在从 "…...

告别触摸失灵!合泰BS8116A-3灵敏度与低功耗休眠实战调优指南

合泰BS8116A-3触摸芯片实战调优:从灵敏度到低功耗休眠的工程化解决方案 在智能家居和消费电子领域,触摸控制已成为人机交互的主流方式之一。合泰BS8116A-3作为一款高性价比的电容式触摸芯片,广泛应用于各类触控面板设计中。然而,许…...

SlickGPT:专为开发者设计的轻量级AI助手工具链

1. 项目概述:一个为开发者打造的“智能副驾”最近在GitHub上看到一个挺有意思的项目,叫slickgpt。初看这个名字,你可能会觉得这又是一个基于GPT API的简单封装,或者是一个聊天界面。但如果你点进去,仔细看看它的README…...

表格数据特征工程中的词嵌入技术应用与优化

1. 表格数据特征工程中的词嵌入技术解析在传统机器学习项目中,我们常常会遇到包含文本字段的结构化表格数据。比如电商领域的商品描述、金融领域的客户备注信息,或是医疗领域的病历摘要。这些文本字段如果直接用One-Hot或TF-IDF处理,往往会面…...

从天气预报API实战解析:手把手教你用cJSON处理嵌套JSON数组数据(C语言版)

从天气预报API实战解析:手把手教你用cJSON处理嵌套JSON数组数据(C语言版) 天气预报API返回的JSON数据往往包含多层嵌套结构,这对C语言开发者来说是个不小的挑战。上周我接手一个气象站项目时,就遇到了需要解析未来7天天…...

别再搞混了!DBC里描述负数信号,Unsigned和Signed到底怎么选?(附CANdb++实操)

DBC信号定义实战:Signed与Unsigned的精准选择指南 在汽车电子工程领域,DBC文件作为CAN通信的"字典",其信号定义的准确性直接关系到整车通信的可靠性。温度传感器显示的-10℃究竟是乱码还是真实数据?电流方向的正负如何准…...

使用Python快速接入Taotoken并调用多款主流大模型

使用Python快速接入Taotoken并调用多款主流大模型 1. 准备工作 在开始编写代码之前,您需要完成两项准备工作。首先,登录Taotoken控制台创建一个API Key。这个Key将作为您调用API的身份凭证。其次,访问模型广场查看可用的模型ID,…...

KEDA(K8s Event-Driven Autoscaling)介绍(基于事件自动伸缩开源项目、ScaledObject、事件驱动、增强版HPA、kedacore、Serverless无服务场景)

文章目录KEDA(Kubernetes Event-Driven Autoscaling)详解一、什么是 KEDA?二、KEDA 解决了什么问题?三、KEDA 架构解析1. Operator2. Metrics Adapter四、核心概念1. ScaledObject2. ScaledJob3. Scaler(触发器&#x…...

斯坦福大学竟然开了个 AI 编程课?!我已经学上了

1.安装环境准备 1.1.查看物理内存 [rootaiserver ~]# free -m 1.2.操作系统版本 [rootaiserver ~]# cat /etc/redhat-release 1.3.操作系统内存 [rootaiserver ~]# df -h /dev/shm/ 1.4.磁盘空间 [rootaiserver ~]# df -TH [rootaiserver ~]# df -h /tmp/ [rootaiserver ~]# d…...

Spring AI 2.0 开发Java Agent智能体 - 新建 HelloWorld 项目

大家好,我是小锋老师,最近更新《2027版本 Spring AI 2.0 开发Java Agent智能体 视频教程》专辑,感谢大家支持。 本课程主要介绍和讲解Spring AI 2.0简介,Spring AI 2.0 HelloWorld搭建,Advisors — 拦截器模式增强AI能…...

高维离散视觉生成:立方离散扩散模型原理与实践

1. 高维离散视觉生成的技术背景视觉生成领域近年来经历了从传统GAN到扩散模型的范式转变。在图像生成任务中,离散扩散模型因其在文本到图像生成中的出色表现而备受关注。然而,当我们将问题扩展到更高维度的离散空间时(如视频生成、3D体素建模…...

计算机视觉中小物体图像编辑的技术挑战与解决方案

1. 项目背景与核心挑战在计算机视觉领域,基于指令的图像编辑技术近年来取得了显著进展。这类模型能够根据自然语言描述直接修改图像内容,极大降低了专业图像处理的准入门槛。然而在实际应用中,我们发现现有模型对小物体(如纽扣、首…...

为 OpenClaw 配置 Taotoken 作为 OpenAI 兼容后端的详细步骤

为 OpenClaw 配置 Taotoken 作为 OpenAI 兼容后端的详细步骤 1. 准备工作 在开始配置前,请确保已安装 OpenClaw 工具并拥有有效的 Taotoken API Key。API Key 可在 Taotoken 控制台的「API 密钥」页面生成。同时建议在模型广场查看当前支持的模型 ID,例…...

Taotoken 用量看板如何帮助个人开发者管理 API 成本

Taotoken 用量看板如何帮助个人开发者管理 API 成本 1. 用量看板的核心功能 Taotoken 用量看板为个人开发者提供了多维度的 API 调用数据可视化能力。在控制台的「用量分析」页面,用户可以按时间范围筛选查看各模型服务的调用次数、输入输出 Token 总量以及对应费…...

AI代码生成工具genaicode:基于项目上下文的智能编程引擎实战指南

1. 项目概述:一个真正能理解你代码库的AI编程伙伴如果你和我一样,每天都要在编辑器、终端和浏览器之间来回切换,一边查文档一边写代码,那今天要聊的这个工具可能会让你眼前一亮。它不是另一个简单的代码补全插件,也不是…...

统计方法与机器学习融合的10大实战场景

1. 统计方法与机器学习融合的价值统计方法在机器学习项目中的应用,就像给工程师配备了一套精密的手术刀。我在2016年参与电商用户行为预测项目时,第一次深刻体会到描述性统计对特征工程的决定性作用。通过分析2000万条用户浏览记录的分布特征&#xff0c…...

关于IPSec 虚拟私有云网络连接异常的处理

​ 一、问题描述 现场使用云能的融合网络产品与异地机房的设备建立IPSec tun实现内网是连通,它是一款基于Internet,通过加密通道实现本地数据中心或客户端入云访问VPC资源和不同地域VPC之间互联能力的服务。支持IPsec、SSL和Smart方式,现场使…...

观察 Taotoken 账单详情追溯各项目 API 调用明细

观察 Taotoken 账单详情追溯各项目 API 调用明细 1. 账单概览与访问入口 Taotoken 控制台提供了完整的账单记录功能,用户可以在「账单」页面查看所有历史消费记录。该页面默认展示最近 30 天的消费趋势图表,下方列出按日汇总的消费金额。点击任意日期或…...

独立开发者如何利用Taotoken模型广场为不同任务选择性价比最优模型

独立开发者如何利用Taotoken模型广场为不同任务选择性价比最优模型 1. 理解模型广场的核心价值 Taotoken模型广场是开发者接入多模型服务的统一入口。通过聚合多家厂商的模型资源,开发者可以在一个平台上完成模型发现、测试和接入的全流程操作。对于独立开发者或小…...

开源职业发展AI技能包Career-Ops:四阶段引擎驱动,告别AI废话

1. 项目概述与核心价值如果你正在用 Claude Code、Cursor 这类 AI 编程助手,并且恰好也在找工作、想优化简历或者准备面试,那么你很可能已经发现了一个尴尬的现实:这些强大的 AI 工具在生成通用建议时很在行,但一旦涉及到你个人职…...

为AI智能体注入认知:ScallopBot生物启发式架构部署与实战

1. 项目概述:一个为个人AI智能体注入“认知”的架构 如果你和我一样,折腾过不少开源的个人AI助手项目,比如大名鼎鼎的OpenClaw,你可能会发现一个普遍的问题:它们确实很能干,能调用各种工具,执行…...

Relay:为AI编码助手构建团队共享记忆库,解决知识重复浪费

1. 项目概述:为AI编码代理构建团队共享记忆层如果你和你的团队正在使用Claude Code、Cursor这类AI编码助手,大概率遇到过这个场景:你花了大半天时间,终于让AI搞明白某个云服务的特定区域不支持某项功能,或者某个开源库…...

如何快速上手Atmosphere大气层:Switch开源自定义固件终极指南

如何快速上手Atmosphere大气层:Switch开源自定义固件终极指南 【免费下载链接】Atmosphere-stable 大气层整合包系统稳定版 项目地址: https://gitcode.com/gh_mirrors/at/Atmosphere-stable Atmosphere大气层是任天堂Switch游戏机的开源自定义固件解决方案&…...

AI治理实践:平衡技术价值与社会责任

1. 人工智能治理的核心矛盾当算法开始决定谁获得贷款、医疗资源如何分配、甚至刑事判决的量刑建议时,我们不得不面对一个根本性问题:如何在释放AI技术价值的同时,确保其发展不脱离人类社会的责任框架?过去三年参与金融风控AI落地的…...

告别模拟器!APK Installer:在Windows上直接安装安卓应用的终极方案

告别模拟器!APK Installer:在Windows上直接安装安卓应用的终极方案 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否厌倦了笨重的安卓模拟…...

如何在5分钟内为Unity游戏安装实时翻译插件:XUnity.AutoTranslator完全指南

如何在5分钟内为Unity游戏安装实时翻译插件:XUnity.AutoTranslator完全指南 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 你是否曾因为语言障碍而错过心爱的日本RPG游戏?是否因为…...

实时对话与APP播报首选:tts-1-1106 模型场景适配指南

1. 引言与模型概述 1.1 模型背景与定位 tts-1-1106 是OpenAI于2024年11月6日发布的标准音质级文本转语音(TTS)模型,属于其第一代闭源TTS系列(tts-1)的迭代快照版本。作为OpenAI在语音合成领域的核心基础模型&#xf…...

Docker 27认证新规强制生效倒计时90天,你的PACS/DICOM容器已过期?——2024医疗云平台合规自查清单

更多请点击: https://intelliparadigm.com 第一章:Docker 27医疗容器合规认证新规核心解读 Docker 27于2024年Q3正式发布《医疗健康领域容器化应用合规认证实施细则(V1.0)》,首次将容器镜像签名、运行时完整性校验、H…...

Cesium三维管网可视化实战:手把手教你封装可显示水位的垂直与水平管道实体

Cesium三维管网可视化实战:从零封装动态水位管道组件 城市地下管网如同人体的血管系统,错综复杂却又至关重要。传统二维平面图难以直观展示管道空间关系,更无法呈现水位变化等动态信息。Cesium作为领先的地理空间可视化引擎,为这类…...

终极VLC鼠标点击控制插件:一键暂停播放的完整解决方案

终极VLC鼠标点击控制插件:一键暂停播放的完整解决方案 【免费下载链接】vlc-pause-click-plugin Plugin for VLC that pauses/plays video on mouse click 项目地址: https://gitcode.com/gh_mirrors/vl/vlc-pause-click-plugin 你是否曾想过,只需…...