当前位置: 首页 > article >正文

从对话到协作:深度解析 WebMCP —— 开启浏览器端的 AI 智能体新时代

在 2024 年底Anthropic 推出了MCP (Model Context Protocol)试图为 AI 模型与外部数据源之间构建一条“通用数据总线”。然而对于广大的前端开发者和 Web 生态来说传统的 MCP 更多是在后端或桌面端发力。2025 年初由 Google 和 Microsoft 工程师联合发起的WebMCP提案正式进入 W3C Web 机器学习社区组WebML CG的视野。它标志着 AI 智能体Agent正式获得了与 Web 页面进行“结构化对话”的官方绿卡。本文将为你深度拆解 WebMCP 的前世今生、核心机制以及它将如何重塑前端开发者的技能图谱。一、 为什么我们需要 WebMCP在 WebMCP 出现之前AI 智能体访问网页的方式极其原始。1.1 “脆弱”的旧世界屏幕抓取Screen Scraping现在的 AI 智能体如各种浏览器助手通常通过解析 DOM 树、截图并发送给多模态模型来“理解”网页。痛点网页结构稍有变动如 CSS 类名修改智能体就会“迷路”成本频繁截图和发送长文本 DOM 导致 Token 消耗巨大响应延迟高权限智能体很难在复杂的认证环境下如登录后的 Session稳定工作。1.2 MCP 的局限性虽然 Anthropic 的 MCP 解决了数据接入的标准问题但它主要是为Server-to-Server场景设计的。如果你想让 AI 访问你当前打开的购物页面并执行“加入购物车”在传统 MCP 下你需要搭建一套后端代理逻辑还要处理复杂的跨域和身份同步。1.3 WebMCPAI 的“浏览器原住民”方案WebMCP 的核心思想是让网页自己告诉浏览器和智能体它能做什么。它将网页抽象为两个层人类层Human Layer传统的 HTML/CSS/JS供人类视觉交互。机器层Machine Layer由 WebMCP 定义的结构化工具契约供 AI 直接调用。二、 什么是 WebMCPWebMCP (Web Model Context Protocol)是一个正在标准化的浏览器原生 API目前已在 Chrome 146 Canary 版本中作为早期预览版提供。它允许开发者直接在前端代码中定义“工具Tools”这些工具可以被智能体发现浏览器能通过特定的 API 告诉 AI“这个页面可以查询库存、可以提交表单”。被智能体调用AI 不需要模拟点击而是直接以 JSON 参数调用网页暴露的 JavaScript 函数。共享上下文由于工具运行在页面运行环境下它们天然拥有当前的登录状态、Cookie 和内存状态。三、 WebMCP 的核心架构与机制WebMCP 引入了一个全新的全局对象navigator.modelContext。3.1 两个核心组件宿主Host/ 智能体Agent通常是浏览器内置的 AI如 Gemini Nano或侧边栏助手。页面Web Page充当“微型服务器”通过 WebMCP 接口提供工具、资源和提示词Prompts。3.2 两种实现路径为了让不同难度的项目都能接入WebMCP 设计了两种 API 模式A. 声明式 APIDeclarative API —— 低代码接入如果你的页面已经有现成的 HTML 表单你只需要添加几个属性它就能变身 AI 工具。form toolnamesearch_flights tooldescription查询往返航班信息 input nameorigin typetext placeholder出发地 required input namedestination typetext placeholder目的地 required button typesubmit搜索/button /form浏览器会自动解析这个表单生成一个 AI 能够读懂的 JSON Schema。当 AI 需要查询航班时它会向浏览器发送请求浏览器代为填充表单并提交。B. 命令式 APIImperative API —— 深度集成对于复杂的逻辑你可以直接注册 JavaScript 函数// 注册一个查询天气工具 navigator.modelContext.registerTool( get_weather, 获取指定位置的当前天气情况, { location: { type: string, description: 城市名 } }, async (args) { const data await fetchWeather(args.location); return { content: [{ type: text, text: 当前温度${data.temp}度 }] }; } );四、 动手实践如何体验 WebMCP目前WebMCP 处于快速演进阶段。想要尝鲜的开发者可以通过以下方式4.1 开启浏览器支持下载Chrome Canary(版本号 146);进入chrome://flags;搜索并启用#experimental-web-platform-features或#webmcp-test-api具体名称随版本波动建议查看 W3C 最新文档。4.2 使用现有的库如果你不想等浏览器原生普及可以使用 Jason McGhee 维护的 WebMCP 开源库。它通过一个轻量级的 WebSocket 桥接方案让你现在就能在普通浏览器里体验“页面即 MCP Server”的效果。代码示例使用 WebMCP SDKimport { WebMCP } from webmcp-sdk; const mcp new WebMCP(); // 暴露一个添加待办事项的方法给 AI mcp.registerTool(add_todo, 在当前页面添加一条任务, { text: { type: string } }, (args) { window.myTodoApp.addItem(args.text); return 已成功添加任务; });五、 WebMCP 的核心价值为什么开发者要关注对于内卷严重的 AI 赛道WebMCP 提供了几个降本增效的杀手锏5.1 隐私与安全端侧处理国内政企客户对数据出域非常敏感。WebMCP 的工具是在用户本地浏览器中执行的。AI 智能体调用的是本地函数敏感数据如用户当前的 Session 信息不需要发送到云端。这符合“数据不出域”的合规大趋势。5.2 AI 时代的 SEO从“被看到”到“被调用”过去我们做 SEO 是为了让百度/谷歌抓取我们的关键词。在 AI 时代SEO 将进化为“Agent Optimization”。通过 WebMCP 声明工具你的网站将变成一个“可编程的节点”。当用户问 AI“帮我订一张去北京的票”AI 会直接调用你网页暴露的book_ticket工具而不是带用户去搜链接。5.3 跨平台一致性WebMCP 磨平了不同 AI 平台Gemini, Claude, GPT-4o-tools与不同前端框架Vue, React, Svelte之间的鸿沟。你只需要写一套registerTool任何支持 WebMCP 的 AI 助手都能无缝使用。六、 最新动态与未来展望6.1 W3C 标准化进程2025 年 2 月W3C WebML 社区组发布了最新的 WebMCP 草案。Intel、Google 和 Microsoft 正在推动将navigator.modelContext固化到 Web IDL 中。这意味着它未来将像fetch或navigator.geolocation一样成为 Web 开发的基础设施。6.2 框架集目前React 和 Next.js 的社区已经出现了针对 WebMCP 的自定义 Hook如useWebMCPTool。// 假设的未来用法 useWebMCPTool(checkout, (cart) { // AI 触发结账逻辑 }, schema);6.3 商业机会AI 插件的终结者以往我们为了给 AI 提供能力需要写 Chrome Extension。WebMCP 普及后网站本身就是插件。只要用户打开你的网页AI 就能立刻学会在该网页内操作。这对 SaaS 类产品、电商和企业内部工具是巨大的利好。七、 结语WebMCP 不仅仅是一个 API它代表了“Agentic Web智能体化 Web”的到来。作为一个资深开发者现在开始在你的项目中尝试 WebMCP意味着你正在为你的网站准备一张进入“机器友好型互联网”的入场券。不要再让你的 AI 智能体去辛苦地“抠”DOM 树了给它一个标准的接口让它像调用函数一样调用你的业务逻辑。参考资源W3C WebMCP 草案 (webmachinelearning.github.io/webmcp)Codely: What is WebMCP and how to use itThe New Stack: Control AI Agents with JS作者注如果你对 WebMCP 的安全性如权限确认弹窗或具体的 React 封装感兴趣欢迎在评论区留言交流

相关文章:

从对话到协作:深度解析 WebMCP —— 开启浏览器端的 AI 智能体新时代

在 2024 年底,Anthropic 推出了 MCP (Model Context Protocol),试图为 AI 模型与外部数据源之间构建一条“通用数据总线”。然而,对于广大的前端开发者和 Web 生态来说,传统的 MCP 更多是在后端或桌面端发力。 2025 年初&#xf…...

java基础面试知识点

java基础 1. Java面试核心概念 Java三大特点 :平台无关性、面向对象、内存管理。 平台无关性:通过JVM(Java虚拟机)实现。源代码编译成字节码(.class文件),可在任何安装了相应JVM的操作系统上运行…...

安装虚拟机详细教程!!!

...

【ASP.NET CORE】 11. SignalR

本系列专栏基于杨中科老师的《ASP.NET Core技术内幕与项目 实战》,本人记录梳理的学习笔记,有部分的增补和省略。更全面系统的讲解,请看杨老师的视频课:【.NET教程,.Net Core视频教程,杨中科主讲】。 一、…...

openclaw本地部署实践复盘 openclaw本地部署案例分享 openclaw本地部署亲测记录 openclaw本地部署实践分享 openclaw本地部署经验复盘 openc

在 openclaw本地部署 的实际项目推进中,环境依赖复杂、权限控制难统一以及插件生态缺乏标准化管理,往往成为工程团队普遍面临的技术挑战。围绕这一问题,行业中通常会通过更系统化的架构设计与部署流程来降低不确定性,北京万维速达…...

mac M芯片安装pytorch

用 conda 创建一个 arm64 的 Python 环境 在这个 conda 环境里用 pip 安装 PyTorch 用 MPS 验证是否启用了 Apple GPU 这是因为 PyTorch 官方当前在 macOS 上推荐的包管理方式是 pip,并注明最新稳定版要求 Python 3.10;macOS 安装页也直接给出了 pip3 in…...

灭菌柜集中监控管理平台解决方案

某工厂要求对研发实验室的多个灭菌柜进行集中监控与在线管理,需要监控的数据量包括干燥开始时间/结束时间、灭菌开始时间/结束时间、升温开始时间/结束时间等,便于统计实验结果与设备性能。对此,通过本地部署数据中台,能够实现多个…...

重置root密码!

mountmount -o remount,rw /sysroot(这里需要注意空格哦!!!)chroot /sysrootpasswd输入新密码,输入的时候没有提示的哦再次输入设置的新密码touch /.autorelableexitexit注意哦,小编改的是root用…...

JavaScript性能优化实战迸礁

JavaScript性能优化实战技术文章大纲 性能优化的核心原则 减少代码执行时间 降低内存占用 优化网络请求 提升用户体验 代码层面的优化 避免全局变量污染,使用模块化或闭包 减少DOM操作,批量更新或使用文档片段 使用事件委托减少事件监听器数量 优化循环结…...

JavaScript性能优化实战枚徽

JavaScript性能优化实战技术文章大纲 性能优化的核心原则 减少代码执行时间 降低内存占用 优化网络请求 提升用户体验 代码层面的优化 避免全局变量污染,使用模块化或闭包 减少DOM操作,批量更新或使用文档片段 使用事件委托减少事件监听器数量 优化循环结…...

第3章 矩阵:系统、变换与结构的表达

底层数学四部曲第四部 线性代数:入门与全领域展开 第3章 矩阵:系统、变换与结构的表达 矩阵的本质,是线性关系的“容器”,是向量变换的“规则”,是复杂系统的“浓缩表达”。 上一章我们掌握了向量——线性世界的基本单…...

Thinkphp和Laravel框架都支持基于小程序的民宿预订系统-web pc 手机端

目录ThinkPHP与Laravel框架实现多端民宿预订系统的方案技术选型与架构设计核心功能模块实现数据库设计要点性能优化策略部署与监控跨端适配方案安全防护措施项目技术支持可定制开发之功能创新亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可…...

《C++实战项目-高并发内存池》8. 最终性能优化与测试

💡Yupureki:个人主页 ✨个人专栏:《C》 《算法》《Linux系统编程》《高并发内存池》 🌸Yupureki🌸的简介: 目录 1. 使用基数树进行优化 2. 性能测试 完整项目链接https://github.com/Yupureki-code/ConcurrentMemoryPool 1. 使用基数树进行…...

网络安全--Windows操作系统

(新手小白入门网络安全,学习Windows操作系统基础知识,如有错误,欢迎批评指正!)一、初识操作系统操作系统(Operating System,简称OS)是管理和控制计算机硬件与软件资源的计…...

刷招聘软件时的迟疑?AI大模型才是程序员的新底气

刷着招聘APP的你,是否也曾突然陷入迟疑? 屏幕上密密麻麻的“大模型工程师”“AIGC应用开发工程师”岗位,技能要求写得愈发细致具体,从模型微调、Prompt工程到落地部署,条条直指AI领域。反观自己简历上引以为傲的“微服…...

2026 AI风口下,普通人(含程序员/小白)可落地的高薪岗位指南

国家统计局1月19日最新发布的数据,相信不少人都刷到了:2025年全国居民人均可支配收入达43377元,同比增长5.0%。这个数字看似稳健增长,但懂行的人都清楚,收入差距正被新一轮行业风口悄悄拉大,而2026年最具爆…...

从零开始构建Agentic RAG系统:LangGraph+Qwen打造智能自适应RAG

本文详细介绍Agentic RAG系统的构建方法,该系统融合动态查询分析和自我纠错机制,能够根据查询复杂度自适应选择检索与生成策略。文章基于LangGraph和Qwen模型,从状态管理、查询路由、文档检索、网络搜索到幻觉检测等11个步骤,完整…...

‌智慧校园系统价格解析:如何看懂报价背后的逻辑与选择适合自己的方案?

✅作者简介:合肥自友科技 📌核心产品:智慧校园平台(包括教工管理、学工管理、教务管理、考务管理、后勤管理、德育管理、资产管理、公寓管理、实习管理、就业管理、离校管理、科研平台、档案管理、学生平台等26个子平台) 。公司所有人员均有多…...

别再死磕 Python 了!这 4 款低代码工具也能做深度数据分析!

目录 一、FineBI 二、活字格 BI 插件 三、钉钉宜搭 QuickBI 四、Power BI 五、工具总结与对比 常见问答 想用数据驱动业务,却被代码给困住了? 业务那边急着要数据,你还在和Python库的版本兼容问题较劲……卡在脚本报错里寸步难行。 …...

计科-Linux4-中文件查看命令的详细介绍「整理」

...

妥妥的豪华局 —— 让 AI 来做照片分析

虽然 AI 无法给出所有的准确分析。 尝试使用 AI 分析一张照片,照片上的不少细节 AI 都注意到了,尤其是对中美使用餐具的情况做了对比。 同时,口味判断是准确的。 同时,给出的照片中,删除了所有的 EXIF 信息&#xff…...

静止同步调相机——01 无功补偿原理

无功补偿原理...

黄金悖论:无用的巅峰

“僭越者”的冠冕:黄金的终极悖论这一次,黄金的暴涨显得如此理所当然,甚至带着一丝命定的傲慢。然而,在其君临天下的价格曲线之下,涌动着一个深刻而古老的悖论:它正因其“无用”,而达至了“大用…...

仓库管理五大法:收、管、存、发、盘

目录 头条标题:仓库管理必看:收、管、存、发、盘5大方法 一、收:入库管理,把好物料入口关 1、单据到达 2、实物核对 3、办理入库 4、信息更新 二、管:在库管理,做好物料日常管控 1、分区分类 2、货…...

基于有源阻尼的PMSM高阻尼复矢量电流控制仿真、有参考文献

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室🍊个人信条:格物致知,完整Matlab代码及仿真咨询…...

【独家原创】基于(蜜獾算法)HBA-Transformer单变量时序预测(单输入单输出) Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室🍊个人信条:格物致知,完整Matlab代码及仿真咨询…...

【独家原创】基于(黏菌算法)SMA-Transformer多变量回归预测(多输入单输出) Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和…...

基于DE-Transformer多变量时序预测 (多输入单输出)Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和…...

【路径规划】基于Q-Learning实现的多机器人路径规划演示附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和…...

风电SCADA数据采集物联网解决方案

风电SCADA能够实时采集风电机组的运行数据,并对风力发电机组进行监视和控制,确保风电场安全高效地运行。现要求将SCADA数据采集到云服务器中,实现远程化的管理和应用。对此,物通博联(WideIOT)提供高效可靠的…...