当前位置: 首页 > article >正文

Claude Code桌面控制实战:macOS开启Computer Use指南

Claude Code 的 computer use 功能是 2026 年 3 月正式上线的原生 macOS 桌面控制能力让 Claude 可以打开 App、点击、输入、截图直接在你的真实桌面上完成 GUI 任务。它以内置 MCP 服务器的形式集成到 Claude Code CLI 中通过/mcp命令启用无需 Docker 或虚拟机。需要 Claude Code v2.1.85 及以上版本、macOS 系统、以及 Pro 或 Max 订阅计划。Computer Use 能做什么Claude Code 一直以来的边界是终端和代码文件——它能写代码、跑命令、改文件但碰到需要 GUI 操作的环节就只能让你自己去手动点。computer use 打通了这个缺口。典型用途构建并验证原生 App让 Claude 写 Swift 代码、xcodebuild编译、启动 App、点击每个控件截图反馈异常状态——全程不用离开终端。端到端 UI 测试指向一个本地 Electron 应用说测试注册流程Claude 打开 App、点击注册、截图每一步无需写 Playwright 配置。复现视觉 Bug告诉 ClaudeModal 在小窗口下被截断Claude 自己缩小窗口、复现 Bug、截图然后检查 CSS 并验证修复结果。驱动无 API 的工具设计工具、iOS Simulator、硬件控制面板、企业内部无 CLI 的专有软件——只要能点Claude 就能操作。工具选择优先级Claude Code 会先用最精准的工具——有 MCP Server 的用 MCP是 Shell 命令的用 Bash是浏览器任务且装了 Claude in Chrome 就用 Chrome 扩展——以上都不适用时才启用 computer use 控制屏幕。如何启用Step 1确认前置条件claude--version# 需要 v2.1.85 或更高版本同时确认系统为macOS不支持 Linux 和 Windows已登录claude.ai 的 Pro 或 Max 账户不支持 Bedrock / Vertex AI / Foundry 等第三方 provider当前在交互式会话中-p非交互模式不可用Step 2在 /mcp 菜单中启用在 Claude Code 交互式会话中运行/mcp找到列表中的computer-use服务器选择Enable。此设置按项目持久化每个项目只需设置一次。Step 3授权 macOS 权限首次使用时 macOS 会弹出权限申请需要授权两项权限用途辅助功能Accessibility允许 Claude 点击、输入、滚动屏幕录制Screen Recording允许 Claude 看到屏幕内容按提示在系统设置中开启再选择Try again。授权屏幕录制后可能需要重启 Claude Code。Step 4使用示例启用后直接在对话中描述任务编译 MenuBarStats target启动 App打开偏好设置窗口 验证时间间隔滑块能正常更新标签。完成后截图偏好设置窗口。Claude 会运行xcodebuild、启动 App、交互 UI 并报告结果。Claude 如何操控你的屏幕逐 App 会话审批启用computer-use服务器并不代表 Claude 可以访问你机器上的所有 App。每次会话首次需要访问某个 App 时终端会弹出提示显示Claude 想要控制哪些 App是否请求了剪贴板等额外权限操作期间哪些 App 会被隐藏选择Allow for this session或Deny。审批仅对当前会话有效。对以下高权限 App系统会额外显示警告提示警告标签适用 App等同 Shell 访问权限Terminal、iTerm、VS Code、Warp 等终端/IDE可读写任意文件Finder可修改系统设置系统设置操作期间其他 App 会被隐藏Claude 开始控制屏幕时其他可见 App 会被自动隐藏确保 Claude 只与已审批的 App 交互。终端窗口始终保持可见且不会出现在截图中避免屏幕上的提示词注入反馈回模型。Claude 完成当次任务后隐藏的 App 自动恢复。随时按 Esc 终止Claude 获取屏幕控制权时macOS 通知栏会提示“Claude is using your computer · press Esc to stop”。任何时候按Esc或终端内按CtrlC都可立即中止Claude 释放控制权并恢复所有隐藏 App。全局互斥锁computer use 持有机器级别的互斥锁——同一时间只有一个 Claude Code 会话可以控制屏幕。如果另一个会话正在使用新的尝试会报错提示当前持锁会话。不同类型 App 的控制权限级别Claude 对不同类别 App 的控制程度不同App 类别控制级别浏览器、交易平台仅查看view-only终端、IDE仅点击click-only其他应用完整控制截图 点击 输入安全边界说明重要与 Claude Code 的沙箱 Bash 工具不同computer use 运行在你的真实桌面上访问的是你实际批准的 App。Anthropic 官方安全建议使用低权限账户运行敏感任务避免意外改动系统文件每次只审批必要的 App不要无差别放行全部权限请求注意提示词注入风险屏幕上的文字内容可能被 Claude 读取并影响行为内置的注入检测会在发现可疑内容时暂停并请求确认终端窗口不会被截图这是系统保证Claude 永远看不到自己的输出CLI 版与 Desktop 版的差异computer use 在 CLI 和 Desktop App 中共享同一底层引擎部分管理功能仅 Desktop 版目前支持功能Desktop AppCLI启用方式Settings Desktop app General 开关/mcp菜单启用computer-use黑名单 App 配置可在 Settings 中配置暂不支持自动恢复隐藏 App可选关闭始终开启Dispatch 集成Dispatch 会话可使用不适用常见问题Qcomputer use 为什么不支持 Bedrock / Vertex / Foundrycomputer use 依赖 claude.ai 账户的 Pro/Max 订阅权益第三方 provider 路由的 API 调用不含此权益。如果你的 Claude Code 配置走的是第三方 provider需要单独创建一个 claude.ai 账户来使用此功能。Qcomputer use 和在 Claude Code 里手写 Playwright 测试有什么区别Playwright 需要专门的测试配置只适用于 Web 应用。computer use 可以驱动任何 GUI 应用原生 App、模拟器、设计工具且不需要编写测试脚本直接用自然语言描述任务即可。QEsc 终止后 App 会恢复吗会。按Esc或CtrlC后Claude 立即释放屏幕控制权所有被隐藏的 App 自动恢复到原始状态不会留下残留影响。Q同一台机器能同时运行多个 Claude Code 会话用 computer use 吗不行。computer use 持有机器级别互斥锁同一时间只能有一个会话控制屏幕。新的会话尝试会收到错误提示需要等前一个会话结束后才能启动。Qv2.1.85 之前的版本能用吗不行。/mcp列表中只有满足 v2.1.85、macOS、Pro/Max 计划三个条件时才会出现computer-use选项。运行claude --version检查当前版本。结语Claude Code 上线 computer use标志着 AI 编程助手完成了从代码层到界面层的打通。原来写完代码还要手动启动 App 验证的环节现在可以一并交给 Claude。目前仅限 macOS 的 Pro/Max 用户功能仍在持续迭代中。据 Anthropic 官方文档computer use 是 Claude Code v2.1.85 起随 CLI 内置的 MCP 服务器无需额外安装。如需在国内环境下通过兼容 Anthropic 接口的服务调用 Claude API 用于开发可参考七牛云的 Claude Code 配置指南但需注意 computer use 本身不支持第三方 provider 路由。本文基于 Claude Code 官方文档2026 年 3 月版本建议结合官方最新文档同步更新。延伸资源Claude Code computer use 官方文档Computer use 安全使用指南Claude Code Desktop 版 computer use

相关文章:

Claude Code桌面控制实战:macOS开启Computer Use指南

Claude Code 的 computer use 功能,是 2026 年 3 月正式上线的原生 macOS 桌面控制能力,让 Claude 可以打开 App、点击、输入、截图,直接在你的真实桌面上完成 GUI 任务。它以内置 MCP 服务器的形式集成到 Claude Code CLI 中,通过…...

Univer:企业级协作平台开发实战

Univer:企业级协作平台开发实战 【免费下载链接】univer Build AI-native spreadsheets. Univer is a full-stack framework for creating and editing spreadsheets on both web and server. With Univer Platform, Univer Spreadsheets is driven directly throug…...

5分钟掌握PESQ:Python语音质量评估终极指南

5分钟掌握PESQ:Python语音质量评估终极指南 【免费下载链接】PESQ PESQ (Perceptual Evaluation of Speech Quality) Wrapper for Python Users (narrow band and wide band) 项目地址: https://gitcode.com/gh_mirrors/pe/PESQ 想要客观评估语音处理算法效果…...

ISO/SAE 21434:2021 逐条审核判定表

A 章节号|B 条款|C 要求内容|D 符合性|E 证据 / 说明|F:不符合整改项符合性选项:符合 / 部分符合 / 不符合 / 不适用章节号条款审核要求内容符合性证据 / 备注整改项44.1建立网络安全生命周…...

Mermaid Live Editor:用代码绘制专业图表的终极免费工具

Mermaid Live Editor:用代码绘制专业图表的终极免费工具 【免费下载链接】mermaid-live-editor Edit, preview and share mermaid charts/diagrams. New implementation of the live editor. 项目地址: https://gitcode.com/GitHub_Trending/me/mermaid-live-edit…...

从RTL到GDSII:用Design Compiler优化时序的关键20个命令详解

从RTL到GDSII:用Design Compiler优化时序的关键20个命令详解 在先进工艺节点下,时序收敛已成为ASIC设计中最具挑战性的环节之一。当我们从RTL代码出发,最终生成满足PPA(性能/功耗/面积)目标的GDSII布局布线文件时&…...

基于SpringBoot + Vue的校园流浪动物救助平台

文章目录前言一、详细操作演示视频二、具体实现截图三、技术栈1.前端-Vue.js2.后端-SpringBoot3.数据库-MySQL4.系统架构-B/S四、系统测试1.系统测试概述2.系统功能测试3.系统测试结论五、项目代码参考六、数据库代码参考七、项目论文示例结语前言 💛博主介绍&#…...

新手福音:用快马生成交互式cad安装指南,轻松跨过第一道坎

作为一名CAD初学者,第一次安装软件时确实容易手忙脚乱。记得我当初光是找官方下载链接就花了半小时,安装过程中还差点勾选了捆绑软件。后来发现用InsCode(快马)平台可以快速生成交互式安装指南,整个过程变得特别顺畅。今天就把这个实用方法分…...

基于SpringBoot + Vue的校园论坛交流系统

文章目录前言一、详细操作演示视频二、具体实现截图三、技术栈1.前端-Vue.js2.后端-SpringBoot3.数据库-MySQL4.系统架构-B/S四、系统测试1.系统测试概述2.系统功能测试3.系统测试结论五、项目代码参考六、数据库代码参考七、项目论文示例结语前言 💛博主介绍&#…...

Ubuntu下Minicom与Kermit串口工具对比:哪个更适合你的嵌入式开发?

Ubuntu下Minicom与Kermit串口工具深度评测:嵌入式开发者的终极选择指南 在嵌入式开发领域,串口通信如同开发者的"听诊器",是调试硬件、监控系统状态的核心工具。Ubuntu作为最受开发者欢迎的Linux发行版之一,其生态中Mi…...

AugmentCode无限续杯插件:突破登录限制的自动化解决方案

AugmentCode无限续杯插件:突破登录限制的自动化解决方案 【免费下载链接】free-augment-code AugmentCode 无限续杯浏览器插件 项目地址: https://gitcode.com/gh_mirrors/fr/free-augment-code 痛点解析:开发者的账户管理困境 在软件开发与测试…...

AI辅助开发Playwright脚本:处理文件上传与iframe交互难题

AI辅助开发Playwright脚本:处理文件上传与iframe交互难题 最近在做一个Web自动化测试项目时,遇到了两个特别头疼的问题:文件上传和iframe内的富文本编辑器交互。作为一个刚接触Playwright不久的开发者,这些复杂交互让我卡了好几天…...

肿瘤免疫微环境解析:8大免疫浸润工具实战指南

1. 肿瘤免疫微环境分析的核心价值 当你拿到一份肿瘤样本的转录组数据时,最令人兴奋的莫过于揭开它的免疫面纱——那些隐藏在肿瘤组织中的免疫细胞究竟在做什么?这就是免疫浸润分析的价值所在。想象一下,肿瘤组织就像一座复杂的城市&#xff0…...

用Matlab模拟大气湍流和相机抖动:从模糊照片到清晰图像的完整复原实战

用Matlab模拟大气湍流和相机抖动:从模糊照片到清晰图像的完整复原实战 当你在高空航拍或长焦拍摄时,是否遇到过图像模糊不清的问题?这种模糊往往源于大气湍流或相机抖动。本文将带你深入理解这些退化现象的数学模型,并手把手教你用…...

实战指南:借鉴vmware官网混合云方案,用快马平台生成高可用应用部署模板

今天在VMware官网上研究混合云方案时,发现他们的企业级架构设计特别值得借鉴。正好最近在用InsCode(快马)平台做项目部署,就尝试把官网的混合云方案转化成可落地的模板。整个过程比想象中顺利,分享下我的实战经验。 架构设计思路 VMware官网…...

从信息收集到密码爆破:如何用DictGenerate定制你的专属社工字典?

从信息收集到密码爆破:如何用DictGenerate定制你的专属社工字典? 在授权渗透测试和安全评估中,社会工程学攻击往往是最难防御的一环。攻击者通过收集目标的个人信息,精心构造符合目标习惯的密码字典,能够显著提高暴力…...

从嵌入式到云原生:手把手教你根据项目规模选对MQTT Broker(EMQX vs Mosquitto实战避坑)

从嵌入式到云原生:手把手教你根据项目规模选对MQTT Broker(EMQX vs Mosquitto实战避坑) 当你在设计一个物联网系统时,选择正确的MQTT Broker就像为你的房子选择合适的地基。选得太轻量级,系统可能无法承载未来的增长&…...

当生物黑客入侵脑机接口:安全测试救了我们公司

在脑机接口(Brain-Computer Interface, BCI)技术飞速发展的今天,软件测试从业者正面临前所未有的安全挑战。作为一名资深测试工程师,我亲历了一场惊心动魄的生物黑客入侵事件——一场针对我们公司脑机接口产品的攻击险些导致灾难性…...

区块链+AI的致命组合:深扒某DeFi项目的测试黑幕

在数字经济浪潮中,区块链与人工智能(AI)的融合被视为金融创新的“致命组合”,尤其在去中心化金融(DeFi)领域,它承诺了前所未有的效率和智能决策能力。然而,这一组合也带来了隐蔽的测…...

Linux环境下Oracle 19C补丁安装保姆级教程:从下载到验证的完整流程

Linux环境下Oracle 19C补丁安装全流程实战指南 在数据库运维工作中,补丁管理是确保系统安全稳定运行的关键环节。Oracle 19C作为当前长期支持版本,其补丁安装过程虽然标准化程度高,但实际操作中仍存在不少容易踩坑的细节。本文将基于实战经验…...

投资组合优化中的常见陷阱:如何用LINGO和MATLAB避免风险计算错误

投资组合优化中的常见陷阱:如何用LINGO和MATLAB避免风险计算错误 在金融投资领域,优化投资组合是实现收益最大化和风险最小化的关键手段。然而,许多金融分析师和量化投资爱好者在实际操作中常常陷入各种计算陷阱,导致结果偏离预期…...

PDFMathTranslate:突破语言障碍的学术文档翻译终极解决方案

PDFMathTranslate:突破语言障碍的学术文档翻译终极解决方案 【免费下载链接】PDFMathTranslate PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务&…...

Deep-Live-Cam实时换脸诊断指南:从启动失败到流畅运行的快速修复方案

Deep-Live-Cam实时换脸诊断指南:从启动失败到流畅运行的快速修复方案 【免费下载链接】Deep-Live-Cam real time face swap and one-click video deepfake with only a single image 项目地址: https://gitcode.com/GitHub_Trending/de/Deep-Live-Cam Deep-L…...

AssetStudio终极指南:快速免费提取Unity游戏模型、纹理与音频资源

AssetStudio终极指南:快速免费提取Unity游戏模型、纹理与音频资源 【免费下载链接】AssetStudio 项目地址: https://gitcode.com/gh_mirrors/asse/AssetStudio AssetStudio是一款功能强大的开源工具,专为Unity游戏资源提取设计,能够轻…...

GRACE/GRACE-FO数据下载全攻略:从零开始搞定三大机构数据源(含最新FTP地址)

GRACE/GRACE-FO数据获取与处理全流程指南:2024年三大机构最新数据源解析 对于刚接触地球物理学和气候研究领域的研究人员来说,获取和处理GRACE/GRACE-FO卫星数据往往面临诸多挑战。本文将系统介绍2024年三大主流数据机构(JPL、GFZ、CSR&…...

别再死记硬背了!用74HC系列CMOS芯片,手把手带你理解逻辑门电平与噪声容限

74HC系列CMOS芯片实战:从数据手册到面包板的逻辑门电平全解析 当你在深夜调试一块74HC04反相器搭建的振荡电路时,示波器上本该清晰的方波却出现了毛刺和畸变——这种场景对电子爱好者来说再熟悉不过。本文将以74HC系列CMOS芯片为核心,通过五…...

ChatGPT_JCM跨平台方案:一次开发,多端运行的实现方法

ChatGPT_JCM跨平台方案:一次开发,多端运行的实现方法 【免费下载链接】ChatGPT_JCM 项目地址: https://gitcode.com/gh_mirrors/ch/ChatGPT_JCM ChatGPT_JCM是一款基于Electron和Vue.js构建的跨平台AI应用,通过"一次开发&#x…...

EmbeddingGemma-300m与MySQL结合:大规模向量存储方案

EmbeddingGemma-300m与MySQL结合:大规模向量存储方案 1. 引言 想象一下这样的场景:你的电商平台每天新增数万条商品描述,需要快速实现语义搜索功能;或者你的内容平台有百万篇文章,想要根据用户兴趣智能推荐相关内容。…...

5大核心功能深度解析:Umi-OCR开源离线文字识别工具的技术实现与应用指南

5大核心功能深度解析:Umi-OCR开源离线文字识别工具的技术实现与应用指南 【免费下载链接】Umi-OCR OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二…...

FRP内网穿透实战:5分钟搞定Linux服务器+Docker部署(含HTTPS配置)

FRP内网穿透实战:Linux服务器与Docker部署全指南 引言 在当今分布式开发和远程办公的浪潮中,内网穿透技术已成为开发者工具箱中不可或缺的一部分。想象一下这样的场景:你正在本地开发一个Web应用,需要让远方的同事实时预览效果&am…...