当前位置: 首页 > article >正文

【GUI-Agent】阶跃星辰 GUI-MCP 解读---()---论文

一、 什么是 AI Skills从工具级到框架级的演化AI SkillsAI 技能 的概念最早在 Claude Code 等前沿 Agent 实践中被强化。最初Skills 被视为“工具级”的增强如简单的文件读写或终端操作方便用户快速实现各种操作。然而在以 Solon AI 为代表的现代应用开发框架中AI Skills 已演化为一种更高维度的封装用于智能体应用开发。工具级Tool-level解决的是“手”的问题是具体的执行函数。框架级Framework-level解决的是“脑”的问题。它是工具Tools、指令Instruction与元数据Metadata的聚合体。它不仅包含执行逻辑还包含了准入检查、指令增强及工具染色能力。二、 AI Skills 应有的核心特性为了解决传统 Tool 模式下的上下文噪音、权限真空和行为失控一个成熟的 AI Skill 必须具备以下特质智能准入isSupported 只有满足特定意图、租户或环境条件时可称为提示词上下文技能才会被激活。避免无效工具对模型上下文的干扰和 Token 浪费。指令注入getInstruction 根据当前上下文为模型提供“行为准则”解决模型“该怎么做”的问题。工具路由getTools 根据当前上下文动态分发工具高度自治 技能内部闭环处理特定领域的逻辑对外部输出标准化的结果。三、 MCPAI 时代的万维网协议随着技能需求的爆发MCPModel Context Protocol模型上下文协议 应运而生。它是连接 AI 模型与外部数据/工具的标准协议。MCP 之于 AI正如 HTTP 之于万维网。在互联网时代HTTP 协议让任何浏览器都能访问任何服务器上的资源在 AI 时代MCP 协议让任何智能体都能无缝调用分布在不同物理位置、由不同厂商提供的技能。这种标准化彻底打破了“智能体”与“外部世界”之间的硬编码枷锁。四、 Tool 的分布式进化MCP Tool 的诞生Tool 的形态正在经历本质的变化从本地单体进化为 MCP Tool分布式 Tool。它具有物理位置透明性不再是内存中的一个函数而是一个个独立的分布式能力节点。这种“能力节点化”是 AI 走向微服务架构的第一步。传统 Tool 代码级耦合运行在 Agent 进程内部难以跨语言、跨环境复用。MCP Tool分布式 Tool 通过 MCP 协议暴露具有物理位置透明性。它不再是内存中的一个函数而是一个个独立的分布式能力节点。五、 架构映射从分布式的 MCP Tool 到 MCP SkillsTool 的分布式化为 AI Skills 的分布式化提供了自然的路径参考。当我们将一组具备业务逻辑、指令指导和工具集的 Skill 借助 MCP 协议进行发布时它便进化成了 MCP Skills。我们可以将 AI Agent 的分布式蓝图清晰地映射为传统架构MCP 相当于 RPC远程过程调用 它定义了模型与能力节点之间如何通信是智能体世界的底座管道。MCP Skills 相当于微服务Microservices 每个 Skill 就是一个独立的、具备业务语义的业务单元。题外之话Distributed AI Skills也可以借助传统 RPC 体系实现做的工作会更多些。六、 如何实现 MCP SkillsClient 与 Server 的协同实现 MCP Skills 的核心在于将 Skill 的生命周期语义映射到 MCP 协议的端点上。1. McpSkillClient远程技能的本地代理McpSkillClient 作为本地代理其职责是与远程服务握手并将网络调用包装成 Skill 接口。感知元数据通过约定路径同步远程元数据。动态映射在运行时将本地的 isSupported 或 getInstruction 调用转化为远程 MCP Tool 调用。工具过滤自动剔除标记为 hide 的管理类工具只给 LLM 呈现此时该看的业务工具。应用示例// 1. 构建 MCP 客户端提供者负责协议通信与 Schema 缓存McpClientProvider mcpClient McpClientProvider.builder().channel(McpChannel.STREAMABLE).url(http://localhost:8081/skill/order).build();// 2. 将 MCP 客户端进化为 Skill 代理McpSkillClient skillClient new McpSkillClient(mcpClient);// 3. 构建带有业务上下文的 PromptPrompt prompt Prompt.of(这个订单A001请查询订单详情。).attrPut(tenant_id, 1) // 注入租户上下文.attrPut(user_role, admin); // 注入角色权限// 4. 调用大模型技能将根据 Prompt 自动完成远程准入、指令获取、工具过滤chatModel.prompt(prompt).options(o - o.skillAdd(skillClient)).call();2. McpSkillServer具备感知的技能服务端通过继承 McpSkillServer开发者可以将本地业务逻辑导出为远程技能。生命周期暴露利用 ToolMapping 和 ResourceMapping 将 isSupported、getInstruction 等逻辑导出。智能感知服务端能通过传入的 Prompt 状态感知意图。例如根据角色权限决定 getToolsName 返回哪些工具。安全标记通过给管理端点添加 hide:1 标记确保系统级指令不会泄露给模型。应用示例McpServerEndpoint(channel McpChannel.STREAMABLE_STATELESS, mcpEndpoint /skill/order)public class OrderManagerSkillServer extends McpSkillServer {Overridepublic String description() {return 提供订单查询与取消的专业技能;}//智能准入根据 Prompt 内容与属性决定是否响应Overridepublic boolean isSupported(Prompt prompt) {// 语义检查意图是否相关boolean isOrderTask prompt.getUserContent().contains(订单);// 安全检查必须有租户 IDboolean hasTenant prompt.attr(tenant_id) ! null;return isOrderTask hasTenant;}//动态指令根据上下文为大模型注入实时“行为准则”Overridepublic String getInstruction(Prompt prompt) {String tenantName prompt.attrOrDefault(tenant_name, 未知租户);return 你现在是[ tenantName ]的订单主管。请只处理该租户下的订单数据禁止跨租户查询。;}//挂载钩子技能被激活时触发可用于注入初始化消息或记录日志Overridepublic void onAttach(Prompt prompt) {// 可以在此处通过 prompt.addMessage() 注入 Few-shot 或背景知识System.out.println(订单技能已挂载当前租户 prompt.attr(tenant_id));}/*** 动态能力发现根据用户权限决定暴露哪些工具* return null 表示暴露所有业务工具Empty 表示禁用所有工具List 表示精准暴露。*/Overridepublic List getToolsName(Prompt prompt) {List tools new ArrayList();// 基础权限所有合规用户可见tools.add(OrderQueryTool);// 细粒度权限仅 ADMIN 角色可见“取消订单”工具if (ADMIN.equals(prompt.attr(user_role))) {tools.add(OrderCancelTool);}return tools;}ToolMapping(description 根据订单号查询详情)public String OrderQueryTool(String orderId) {return 订单 orderId 状态已发货;}ToolMapping(description 取消指定订单)public String OrderCancelTool(String orderId) {return 订单 orderId 已成功取消;}}七、 必然性总结AI Skills 走分布式道路是不可逆转的解耦与复用 复杂技能如法律审计、专业代码重构不再需要在每个项目中重写而是作为服务独立存在。安全边界 敏感数据处理技能可以部署在专用的、受保护的内网环境中仅通过受控的 MCP 协议与公网 Agent 通信。异构生态 不同语言、不同算力环境下的能力都可以通过统一的 MCP 接口连接形成一个真正的“智能体微服务网络”。亓乒岛湛

相关文章:

【GUI-Agent】阶跃星辰 GUI-MCP 解读---()---论文

一、 什么是 AI Skills:从工具级到框架级的演化 AI Skills(AI 技能) 的概念最早在 Claude Code 等前沿 Agent 实践中被强化。最初,Skills 被视为“工具级”的增强,如简单的文件读写或终端操作,方便用户快速…...

Game Performance Profiler - 开箱即用的游戏性能分析工具

Game Performance Profiler - 开箱即用的游戏性能分析工具项目地址:https://github.com/zhangxuhan/game-performance-profiler纯开源,仅供学习参考,逐步迭代。一、项目背景与定位 在游戏开发过程中,性能优化始终是一个核心话题。…...

Agentic AI时代程序员必备算法思想详解(附实战案例)

一、前言:什么是 OFA VQA 模型? OFA(One For All)是字节跳动提出的多模态预训练模型,支持视觉问答、图像描述、图像编辑等多种任务,其中视觉问答(VQA)是最常用的功能之一——输入一…...

别再手动拼接Excel了!SAP ABAP内表数据转储技巧:利用CL_HTTP_RESPONSE实现服务器端文件缓存与直接下载

别再手动拼接Excel了!SAP ABAP内表数据转储技巧:利用CL_HTTP_RESPONSE实现服务器端文件缓存与直接下载 在SAP ABAP开发中,数据导出是日常开发中最常见的需求之一。许多开发者仍然沿用传统的字符串拼接方式生成CSV或Excel文件,这种…...

告别模式困惑:深入解读Mellanox VPI网卡的LINK_TYPE_P1参数与网络协议栈选择

告别模式困惑:深入解读Mellanox VPI网卡的LINK_TYPE_P1参数与网络协议栈选择 在数据中心和云计算环境中,网络性能往往是决定整体系统效率的关键因素。Mellanox的VPI(Virtual Protocol Interconnect)网卡以其独特的双模设计&#x…...

5分钟搭建Testsigma:零代码自动化测试的完整解决方案

5分钟搭建Testsigma:零代码自动化测试的完整解决方案 【免费下载链接】testsigma Testsigma is an agentic test automation platform powered by AI-coworkers that work alongside QA teams to simplify testing, accelerate releases and improve quality across…...

STM32F103+ESP8266做智能开关?手把手教你从硬件接线到APP远程控制(附完整工程)

STM32F103ESP8266物联网智能开关实战指南 从零构建远程控制系统的完整方案 想象一下,当你还在回家的路上,就能提前打开家里的空调;或者躺在床上就能关掉忘记关闭的客厅灯——这些场景现在通过一个简单的DIY物联网项目就能实现。本文将带你用最…...

第38篇:AI在金融领域的应用实战——智能投顾、风控与量化交易初探(项目实战)

文章目录项目背景技术选型架构设计核心实现踩坑记录效果对比项目背景 干了这么多年AI,我见过最“卷”也最“壕”的落地场景,金融绝对排前三。几年前,我参与过一个智能投顾的早期项目,当时大家还在争论AI模型能不能跑赢大盘。如今…...

深入HTTP/2帧层:手把手用Wireshark抓包分析GOAWAY帧与gRPC连接管理

深入HTTP/2帧层:手把手用Wireshark抓包分析GOAWAY帧与gRPC连接管理 当你在深夜调试一个分布式系统时,突然发现gRPC客户端频繁报错"transport is closing",而服务端日志却显示一切正常——这种场景下,协议层的可视化分析…...

从SGL到XSimGCL:图对比推荐中的“简化”革命与性能跃迁

1. 图对比学习推荐算法的演进之路 推荐系统领域近年来最令人兴奋的突破之一,就是图对比学习技术的引入。作为一名长期跟踪推荐算法发展的从业者,我亲眼见证了从传统协同过滤到图神经网络的演进,再到如今对比学习带来的性能飞跃。这就像是从手…...

关于星际争霸1的录屏时卡顿问题(未解决)| 最后附Xbox更改视频保存目录的方法

电脑是笔记本电脑,thinkbook14 2024版。 星际1重置版,联机。不录屏的时候玩得很流畅。 试过obs录屏,开启录屏后打游戏会变得非常卡(猜测是核显超负荷了)。 系统自带的Xbox确实不卡,但是有两个个很大的问…...

从‘软件危机’到‘敏捷开发’:一张图看懂主流软件工程方法论的演变与选择

软件工程方法论演进史:从瀑布到敏捷的思维革命 上世纪60年代,IBM System/360操作系统的开发团队在耗费5000人年工作量后,交付的产品仍存在上千个严重缺陷——这个标志性事件揭开了"软件危机"的序幕。当我们今天讨论DevOps流水线或S…...

别再只用Hilbert变换了!用MATLAB的`instfreq`和`tfridge`搞定多分量信号瞬时频率分析

突破Hilbert局限:MATLAB时频分析工具箱实战指南 在振动监测、语音识别或雷达信号处理中,工程师们常常需要从复杂信号中提取各分量的瞬时频率轨迹。传统Hilbert变换虽然简单直接,但面对实际工程中常见的多分量信号时,其输出结果往往…...

【编码译码】信道编译码仿真(含RS BCH turbo LDPC RSBCH级联)【含Matlab源码 15360期】

💥💥💥💥💥💥💥💥💞💞💞💞💞💞💞💞💞Matlab领域博客之家💞&…...

2026届学术党必备的十大降重复率平台推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 于学术写作跟科研发表进程当中,重复率过高属于常见阻碍。降重网站当作辅助工具&a…...

[已解决] 苍穹外卖实战:别再手动改 YAML 了!从配置地狱到一键切换的环境管理最佳实践

😫 深夜痛点:你还在手动注释 application.yml 吗? 凌晨 1 点,公司生产环境紧急上线。 刚下班的你突然接到电话:“老王,生产数据库连不上了!报错显示连的是 localhost:3306!” 你心里…...

Phi-3-mini-4k-instruct-gguf行业落地:法律合同条款简写、医疗报告口语化转述

Phi-3-mini-4k-instruct-gguf行业落地:法律合同条款简写、医疗报告口语化转述 1. 模型简介与应用价值 Phi-3-mini-4k-instruct-gguf是微软推出的轻量级文本生成模型,特别适合处理专业领域的文本改写任务。这个模型虽然体积小,但在法律和医疗…...

告别VNC和TeamViewer?用向日葵命令行版远程管理Linux服务器的另类思路

Linux服务器远程管理新选择:向日葵命令行版深度评测与实战指南 在Linux服务器管理领域,远程控制工具的选择往往决定了运维效率的高低。传统方案如VNC和TeamViewer虽然广为人知,但它们在资源占用、连接稳定性以及功能完整性方面存在明显短板。…...

抖音批量下载神器:如何用Python实现高效去水印视频采集?

抖音批量下载神器:如何用Python实现高效去水印视频采集? 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser f…...

不到百元捡漏乐视Astra Pro深度摄像头,手把手教你用Python+OpenCV玩转深度图与彩色图

不到百元捡漏乐视Astra Pro深度摄像头,手把手教你用PythonOpenCV玩转深度图与彩色图 去年在二手平台淘到一台乐视Astra Pro深度摄像头时,我完全没想到这个不到百元的小设备能带来这么多可能性。作为一款曾经售价数千元的专业设备,它现在以极…...

从输入URL到网页打开:彻底搞懂 IP、ARP、ICMP 是如何分工协作的

很多人学过 OSI 七层、TCP/IP、IP、ARP、ICMP,却依然说不清:浏览器里敲下一个网址,数据包到底是怎么一步步走到服务器的?MAC 地址在哪儿变?IP 地址又在哪儿改?ICMP 什么时候插一脚?这篇文章用一…...

WAS Node Suite图像批量处理终极指南:5种高效解决Load Image Batch节点异常的实战方案

WAS Node Suite图像批量处理终极指南:5种高效解决Load Image Batch节点异常的实战方案 【免费下载链接】was-node-suite-comfyui An extensive node suite for ComfyUI with over 210 new nodes 项目地址: https://gitcode.com/gh_mirrors/wa/was-node-suite-comf…...

LightOnOCR-2-1B惊艳OCR成果:中文繁体+日文平假名+英文混合识别

LightOnOCR-2-1B惊艳OCR成果:中文繁体日文平假名英文混合识别 你有没有遇到过这样的场景?拿到一份混合了中文繁体、日文平假名和英文的文档或图片,想提取里面的文字,却发现常规的OCR工具要么识别不全,要么错误百出。手…...

倍福PLC编程避坑指南:TwinCAT 2里那些新手容易搞混的功能块(R_TRIG、TON、CASE详解)

倍福PLC编程实战避坑:TwinCAT 2三大核心功能块深度解析 第一次在TwinCAT 2环境中完成控制逻辑编程后,发现状态机跳转异常、定时器不按预期工作?这可能是许多倍福PLC开发者共同的经历。本文将聚焦三个最易引发困惑的功能块——R_TRIG边沿检测、…...

如何5分钟完成杀戮尖塔模组加载器安装:ModTheSpire完整指南

如何5分钟完成杀戮尖塔模组加载器安装:ModTheSpire完整指南 【免费下载链接】ModTheSpire External mod loader for Slay The Spire 项目地址: https://gitcode.com/gh_mirrors/mo/ModTheSpire 如果你是一位《杀戮尖塔》的忠实玩家,想要体验更多角…...

AMD Ryzen 电源管理终极指南:轻松掌握RyzenAdj调优技巧

AMD Ryzen 电源管理终极指南:轻松掌握RyzenAdj调优技巧 【免费下载链接】RyzenAdj Adjust power management settings for Ryzen APUs 项目地址: https://gitcode.com/gh_mirrors/ry/RyzenAdj RyzenAdj是一款专为AMD Ryzen移动处理器设计的开源电源管理工具&…...

ITK-SNAP医学图像分割:从入门到精通的完整指南

ITK-SNAP医学图像分割:从入门到精通的完整指南 【免费下载链接】itksnap ITK-SNAP medical image segmentation tool 项目地址: https://gitcode.com/gh_mirrors/it/itksnap ITK-SNAP是一款功能强大的开源医学图像分割工具,专为医生、研究人员和医…...

如何免费将视频硬字幕转为SRT文件?本地OCR工具终极指南

如何免费将视频硬字幕转为SRT文件?本地OCR工具终极指南 【免费下载链接】video-subtitle-extractor 视频硬字幕提取,生成srt文件。无需申请第三方API,本地实现文本识别。基于深度学习的视频字幕提取框架,包含字幕区域检测、字幕内…...

从数据库索引到社交网络:用5个真实案例吃透离散数学的‘关系’与‘图’

从数据库索引到社交网络:用5个真实案例吃透离散数学的‘关系’与‘图’ 离散数学常被学生视为抽象难懂的"天书",但当你拆开数据库索引、社交网络推荐、编译器优化的黑匣子,会发现这些技术奇迹的底层正是离散数学的精妙运用。本文将…...

别再让电机乱跑了!用Arduino和A4950给直流减速电机做个‘速度管家’(附完整代码)

用Arduino和A4950打造直流减速电机精准调速系统 当你在制作机器人底盘或自动化装置时,是否遇到过电机转速飘忽不定的困扰?明明设置了50%的PWM占空比,电机却时而快时而慢,完全不受控制。这种问题在负载变化或电池电压波动时尤为明显…...