当前位置: 首页 > article >正文

为什么钉钉、飞书、企微都在做 CLI?这个开源项目给出了最极致的答案

❝AI Agent 很聪明但面对真实的专业软件它就是个睁眼瞎。CLI-Anything 说我来治。❞先说一个扎心的事实2026年了AI Agent 能写代码、能做分析、能聊天能画画——但你让它打开 Blender 建个模让它用 GIMP 修张图让它在 LibreOffice 里排个版「抱歉臣妾做不到。」目前的AI操控软件方案大多是这样的「GUI自动化RPA」截图、找按钮、点鼠标。界面一更新就全崩。「有限的API」只覆盖10%的功能剩下的自己想办法。「重新造轮子」用Python重写一遍软件的核心逻辑。好不容易写完原软件90%的专业功能没了。这就是 AI Agent 世界里最大的断裂带——「推理能力爆表软件操控能力约等于零」。CLI-Anything一行命令让任何软件变成 Agent 的原生工具「CLI-Anything」是一个来自香港大学数据科学实验室HKUDS的开源项目GitHub 地址https://github.com/HKUDS/CLI-Anything。它的核心理念只有一句话❝「不重写软件不模拟GUI不阉割功能——直接生成一套结构化的CLI接口让AI Agent像用命令行一样操控任何专业软件。」❞怎么理解举个例子。你有一份 Blender 的源码或者从 GitHub clone 下来也行在 Claude Code 里敲一行命令/cli-anything ./blender接下来全自动的 7 阶段流水线开始工作「分析源码」→ 把GUI操作映射到API「架构设计」→ 规划命令分组和状态模型「代码实现」→ 生成完整的 Click CLI带 REPL、JSON输出、撤销/重做「规划测试」→ 自动生成测试计划「编写测试」→ 实现单元测试 端到端测试「生成文档」→ 写入测试结果「打包发布」→pip install即可全局使用整个过程「零人工干预」。完成后你会得到一个cli-anything-blender命令Agent 可以这样用它# 创建场景 cli-anything-blender scene new --name ProductShot # 添加物体 cli-anything-blender object add-mesh --type cube --location 0 0 1 # 渲染——调用的是真正的 Blender 引擎 cli-anything-blender render execute --output render.png --engine CYCLES注意最后一行「它调用的是真正的 Blender 渲染引擎」输出的是真正的渲染图片不是什么Pillow糊弄事的替代品。为什么是CLI不是MCP不是API很多人第一反应是MCP 不香吗为什么要走CLI这条路CLI-Anything 的选择有深层逻辑「1. CLI 是人和 AI 的最大公约数」命令行是纯文本输入、纯文本输出——这恰好是大语言模型最擅长的格式。不需要协议适配不需要序列化/反序列化的开销一个--help就能让 Agent 自动发现所有能力。「2. 零依赖零配置」不需要启动MCP Server不需要配置OAuth不需要安装SDK。pip install -e .之后which cli-anything-blender就能找到它。Agent 发现工具的方式和人类完全一样。「3. 确定性和可组合性」同样的命令永远产出同样的结果。命令之间可以自由组合成流水线这对 Agent 的行为可预测性至关重要。「4. 实战验证」Claude Code 每天通过命令行执行数以千计的真实任务。CLI 不是理论上可行而是已经在跑了。1917 项测试100% 通过率覆盖 21 款软件空口白话没意义直接上硬数据。CLI-Anything 目前已经为「21款」不同领域的专业软件生成了完整的 CLI 接口软件领域测试数Blender3D建模与渲染208Inkscape矢量图形202Audacity音频制作161LibreOffice办公套件158Kdenlive视频剪辑155Shotcut视频剪辑154OBS Studio直播与录制153Draw.io图表绘制138GIMP图像编辑107Ollama本地LLM推理98Mubu知识管理96ComfyUIAI图像生成70RenderDocGPU帧捕获分析59MuseScore乐谱编辑56AnyGenAI内容生成50AdGuardHome网络广告拦截36Zoom视频会议22NotebookLMAI研究助手21SketchUI设计19FreeCAD参数化3D CAD新增Browser浏览器自动化新增「合计」「1917」「全部 1917 项测试100% 通过。」这里面不只有跑通了的单元测试还有硬核的端到端验证LibreOffice 导出 PDF → 检查%PDF-魔术字节Blender 渲染 → 验证输出 PNG 的像素内容Audacity 处理音频 → 检查 RMS 电平和时长「不是mock不是stub是真刀真枪调用真实软件。」五分钟上手指南方式一Claude Code推荐# 1. 添加插件市场 /plugin marketplace add HKUDS/CLI-Anything # 2. 安装插件 /plugin install cli-anything # 3. 对准任何软件一键生成 /cli-anything ./gimp # 4. 觉得覆盖不够迭代优化 /cli-anything:refine ./gimp 我要更多滤镜和批处理功能方式二OpenClaw / OpenCode / Codex / Copilot CLICLI-Anything 不绑定任何单一平台。它为「6 个主流 AI 编程工具」提供了原生接入Claude Code插件OpenCode斜杠命令OpenClawSKILL.mdCodexSkillQodercli插件GitHub Copilot CLI插件挑你顺手的装上就用。方式三直接使用生成好的CLI社区已经生成了 20 个即装即用的 CLI全在「CLI-Hub」上# 比如安装 Ollama 的 CLI pip install githttps://github.com/HKUDS/CLI-Anything.git#subdirectoryollama/agent-harness # 直接用 cli-anything-ollama --help cli-anything-ollama model list --json一行pip installAgent 立刻拥有操控对应软件的全部能力。它比GUI Agent强在哪最近 GUI AgentComputer Use 类方案很火但 CLI-Anything 走了一条完全不同的路。来做个对比维度GUI AgentCLI-Anything交互方式截图 点击坐标结构化文本命令稳定性界面一改就崩命令行接口稳定速度截图→识别→操作数秒级直接命令调用毫秒级功能覆盖能看到的按钮才能点完整API能力包括隐藏功能输出格式非结构化截图结构化JSONToken消耗每步都要发截图巨贵纯文本交互极省可组合性几乎不可能串联天然支持管道和脚本不是说 GUI Agent 没价值——但在专业软件操控这个场景CLI 方案碾压级优于截图点击。CLI-Hub让 Agent 自己找工具CLI-Anything 还做了一件很酷的事「CLI-Hub 元技能」。装上这个元技能后你的 Agent 不需要知道要用什么CLI它会自己去 CLI-Hub 浏览目录找到合适的工具自动安装然后使用。# 安装元技能 openclaw skills install cli-anything-hub # 然后直接甩任务 帮我用合适的工具把这段音频降噪并导出为 MP3Agent 会自己发现 cli-anything-audacity、自动安装、调用降噪命令、导出文件。「全程零人工介入。」这才是 Agent 真正该有的样子——不是我告诉你用什么工具而是你自己去找。架构上的几个硬核设计如果你是技术人这几个设计值得关注1. 真实软件集成零妥协CLI 生成合法的项目文件ODF、MLT XML、SVG然后调用真实软件后端渲染。如果后端缺失测试直接「fail」而不是 skip。这意味着每一个通过的测试都经过了真实软件的验证。2. 双模交互每个 CLI 都支持两种模式「子命令模式」适合脚本和流水线cli-anything-gimp --json project new「REPL 模式」适合交互式 Agent 会话直接输入命令名即进入3. 统一的 REPL 皮肤所有 CLI 共享repl_skin.py——统一的品牌横幅、风格化提示符、命令历史、进度指示器。无论操控哪个软件交互体验一致。4. SKILL.md 自动生成每个 CLI 自动附带一份SKILL.md包含 YAML 元数据、命令文档、使用示例和 Agent 专用指南。这让任何 Agent 框架都能即时发现和使用这个 CLI。适用场景远比你想的广不只是创意软件。CLI-Anything 的射程覆盖了几乎所有有源码的软件类型「创意与媒体」Blender、GIMP、Inkscape、Audacity、Kdenlive、Shotcut、Krita、OBS Studio「办公与生产力」LibreOffice、Mubu、Zotero「AI平台」ComfyUI、Ollama、NotebookLM、AnyGen、Novita「开发工具」iTerm2、RenderDoc、Browser「图表与可视化」Draw.io、Mermaid、FreeCAD「通信协作」Zoom「网络基础设施」AdGuardHome、Teltonika RMS「UI设计」Sketch而且这个列表每天都在增长。社区贡献者来自全球最近两周就新增了 FreeCAD258个命令、iTerm2、Zotero、RenderDoc、Browser 等多个 CLI。局限性实话实说任何项目都有局限CLI-Anything 也不例外「依赖强大的基座模型」。要可靠地生成 CLI你需要 Claude Opus 4.6、Sonnet 4.6 或 GPT-5.4 这个级别的模型。小模型可能产出不完整的 CLI。「需要源码」。如果目标软件只有编译后的二进制效果会大打折扣。「可能需要多次迭代」。一次/cli-anything不一定能覆盖所有功能通常需要跑几次/refine来补齐。但在我看来这些更像是当前阶段的限制而非根本性缺陷——模型能力在快速提升逆向工程工具在进化迭代优化本身也是自动化的。一句话总结「CLI-Anything 做了一件看起来简单但极其深远的事它让AI Agent操控真实专业软件这件事从理论上可行变成了一行命令就能用。」21款软件、1917项测试、6个平台支持、全球社区贡献——这不是一个实验室demo是一个正在快速成长的生态。如果你是 AI 开发者强烈建议你花 5 分钟试一下。如果你维护一款开源软件考虑用 CLI-Anything 给它加一层 Agent 接口——这可能是你的软件进入 AI 时代最快的方式。

相关文章:

为什么钉钉、飞书、企微都在做 CLI?这个开源项目给出了最极致的答案

❝AI Agent 很聪明,但面对真实的专业软件,它就是个"睁眼瞎"。CLI-Anything 说:我来治。❞先说一个扎心的事实2026年了,AI Agent 能写代码、能做分析、能聊天能画画——但你让它打开 Blender 建个模?让它用 G…...

手把手教你用PyTorch复现YOLOv8的Pose Head:从零搭建关键点检测模块

手把手教你用PyTorch复现YOLOv8的Pose Head:从零搭建关键点检测模块 在计算机视觉领域,目标检测与姿态估计的结合正成为工业界和学术界的热点。YOLOv8作为YOLO系列的最新成员,其姿态估计模块(Pose Head)的设计尤为精妙…...

告别黑屏和错位!Uniapp视频轮播最佳实践:巧用v-if与swiper事件实现无缝切换

Uniapp视频轮播组件深度优化:从黑屏错位到无缝体验的全链路解决方案 在移动应用开发中,视频轮播组件已经成为提升用户参与度的关键元素。然而,当Uniapp开发者尝试在swiper组件中嵌入视频时,常常会遇到视频位置偏移、黑屏闪现、自动…...

快速验证汽车电子创意:用快马AI十分钟搭建CAN总线通信原型

在汽车电子和工业控制领域,CAN总线通信是最基础也最重要的技术之一。最近我在做一个车载设备的小项目,需要快速验证CAN通信功能。传统开发方式往往要花大量时间搭建底层驱动,但这次我尝试用InsCode(快马)平台的AI辅助功能,居然十分…...

OpenClaw跨平台实战:千问3.5-9B在mac与Windows的自动化对比

OpenClaw跨平台实战:千问3.5-9B在mac与Windows的自动化对比 1. 为什么需要跨平台对比 去年我在团队内部推广自动化工具时,遇到一个典型问题:同事们的开发环境分散在macOS和Windows两大平台。当我们尝试用OpenClaw千问3.5-9B构建统一自动化流…...

手把手教你用STM32F103C8T6+DHT11做个智能加湿器(附完整代码和PCB文件)

从零打造智能加湿器:STM32F103C8T6与DHT11的完美组合 在干燥的秋冬季节,一台能够自动调节湿度的智能加湿器不仅能提升生活舒适度,更是电子爱好者展示技能的绝佳项目。本文将带你从元器件选型开始,逐步完成一个基于STM32F103C8T6单…...

ai辅助部署openclaw:让快马智能适配ubuntu环境与反爬策略

AI辅助部署OpenClaw:让快马智能适配Ubuntu环境与反爬策略 最近在尝试用OpenClaw抓取一些动态加载的网站数据,发现直接部署基础版本根本行不通。目标网站不仅有动态渲染的内容,还设置了各种反爬机制。好在发现了InsCode(快马)平台的AI辅助开发…...

热门AI命理工具盘点:星座、运势、排盘工具一次看

很多朋友对传统命理文化感兴趣,却怕找不对专业靠谱的工具,今天我们就整理了10款不同方向的AI命理相关工具,涵盖星座、面相、运势测算、专业排盘等不同需求,大家可以按需选择。 一、专业命理首选:天府 Agent 链接&#…...

CDN 无法播放音视频?流媒体回源与 Range 配置修复

流媒体应用现在越来越普及,CDN(内容分发网络)早已成为音视频流畅播放的核心支撑——靠边缘节点就近分发,既能降低延迟,又能减轻源站压力,让用户不用长时间等待就能看高清内容。但实际运维中,“C…...

ROS2开发环境搭建避坑指南:Win11 + WSL2 + Ubuntu 22.04 从安装到测试的完整记录

ROS2开发环境搭建实战:Win11与WSL2深度适配指南 环境准备与系统调优 在Windows 11上搭建ROS2开发环境,选择WSL2作为Linux子系统是最佳实践方案。不同于传统虚拟机方案,WSL2提供了接近原生Linux的性能表现,同时完美集成Windows桌…...

AI命理推理实测:用专业数据集验证大模型命理能力

提到AI命理相关的评测,就不得不说之前看到的,我们团队最近也沿着这个方向做了针对性测试,不是网上那种随便给大模型发个prompt就喊“准到离谱”的营销玩法,而是用有标准答案的盲测来验证AI命理推理的真实水平。 我们的评测是怎么…...

GCC编译选项详解与优化技巧

1. GCC编译选项核心功能解析作为Linux环境下最常用的编译器套件,GCC的编译选项直接影响着代码的生成质量与运行效率。在实际开发中,合理配置编译选项往往能达到事半功倍的效果。本文将系统梳理GCC的核心编译选项,重点解析那些容易被忽视但极具…...

Pixel Couplet Gen基础教程:Streamlit+ModelScope零配置环境搭建步骤详解

Pixel Couplet Gen基础教程:StreamlitModelScope零配置环境搭建步骤详解 1. 项目介绍与准备 Pixel Couplet Gen是一款融合了传统春节文化与现代像素艺术风格的AI春联生成器。它基于ModelScope大模型驱动,通过Streamlit构建了独特的8-bit复古游戏界面&a…...

实战指南:利用快马ai为django项目生成开箱即用的vscode python开发环境

作为一个长期使用Python开发Django项目的程序员,我深知配置开发环境是个既基础又容易踩坑的环节。最近尝试用InsCode(快马)平台生成配置方案,发现能省去大量重复劳动。下面分享我的实战经验: 项目结构规范化 平台生成的Django项目骨架严格遵循…...

OpenClaw节日营销助手:gemma-3-12b-it自动生成祝福语与发送邮件

OpenClaw节日营销助手:gemma-3-12b-it自动生成祝福语与发送邮件 1. 为什么需要节日营销自动化? 去年端午节前夜,我盯着电脑屏幕上的200多个客户邮箱地址发呆。每个客户都需要个性化的节日祝福,但手动编写和发送至少需要6小时。当…...

如何用UAV-Flow实现语音控制无人机?手把手教你搭建环境与避坑指南

如何用UAV-Flow实现语音控制无人机?从环境搭建到实战避坑全指南 当无人机遇上自然语言处理,会擦出怎样的火花?去年接触UAV-Flow时,我正为一个农业巡检项目头疼——传统摇杆控制需要专业飞手,而农户们更习惯说"绕着…...

CPython AOT编译器模块全图谱,从_pycompile.c到aot_codegen.cc的17个关键函数逐行注释与性能拐点分析

第一章:CPython AOT编译器模块全图谱概览与演进脉络CPython 的 Ahead-of-Time(AOT)编译能力并非原生内建,而是近年来通过社区驱动的实验性项目逐步构建起模块化支撑体系。其核心演进路径始于 PEP 698 提出的字节码预编译增强机制&…...

数据库运维与数据安全:备份恢复、日志分析与故障排查

下面的内容大家根据实际情况,公司的业务还有重点择机选择,不是所有的蓝翔都有挖掘机 如果说之前的索引优化是“飙车”,那么今天的主题就是“系安全带”和“买保险”。 在运维的世界里,没有“如果”,只有“万一”。当…...

OpenClaw对话日志分析:Qwen3-14B挖掘用户真实需求

OpenClaw对话日志分析:Qwen3-14B挖掘用户真实需求 1. 为什么需要分析对话日志? 作为一个长期使用OpenClaw的开发者,我发现自己陷入了一个典型的技术陷阱:花大量时间开发新功能,却很少回头审视用户实际如何使用这些功…...

漫画脸描述生成企业级安全方案:私有化部署保障原创角色数据不出域

漫画脸描述生成企业级安全方案:私有化部署保障原创角色数据不出域 1. 项目背景与核心价值 在二次元创作领域,角色设计是核心创作环节。传统的角色设计需要专业画师投入大量时间,从概念设计到细节刻画都需要反复修改。随着AI技术的发展&…...

雪花算法:分布式世界的“身份证号”

嘿,朋友!想象一下,你是一家拥有几千台服务器的互联网大厂架构师。现在有个小麻烦:你的订单系统每秒钟要生成几万个订单号。如果让数据库自己搞(自增ID),几台数据库凑在一起,肯定会出…...

从零到一:阿里云天池街景符号识别Baseline实战指南

从零到一:阿里云天池街景符号识别Baseline实战指南 街景符号识别是计算机视觉领域一项极具挑战性的任务,它要求模型能够准确识别并理解街道场景中的各类符号信息。对于刚接触深度学习实战的开发者来说,如何从零开始构建一个完整的识别系统往往…...

intv_ai_mk11 GPU部署教程:A10显卡下intv_ai_mk11服务健康检查脚本编写与自动化监控

intv_ai_mk11 GPU部署教程:A10显卡下intv_ai_mk11服务健康检查脚本编写与自动化监控 1. 环境准备与快速部署 在开始编写健康检查脚本之前,我们需要确保intv_ai_mk11服务已经正确部署在A10显卡服务器上。以下是快速部署步骤: 系统要求&#…...

OpenClaw对话式编程:Qwen3-4B模型解释代码与生成示例

OpenClaw对话式编程:Qwen3-4B模型解释代码与生成示例 1. 为什么需要对话式编程? 作为一名长期与代码打交道的开发者,我经常遇到这样的困境:面对一段复杂代码时,需要反复查阅文档;学习新框架时&#xff0c…...

从原理到代码:固高GTS控制卡SmartHome回零功能完整开发指南(附C#示例)

从原理到代码:固高GTS控制卡SmartHome回零功能完整开发指南(附C#示例) 在工业自动化领域,运动控制系统的精度和可靠性往往取决于一个看似简单却至关重要的功能——回零操作。作为固高GTS系列控制卡的核心功能之一,Smar…...

三菱现代自动擦窗机器人PLC软件:后发产品介绍及技术细节

三菱 现代自动擦窗机器人PLC软件 我们主要的后发送的产品有,带解释的梯形图接线图原理图图纸,io分配,组态画面 界面多种组态可供选择上周刚帮一个三菱现代贴牌擦窗机的小客户把新软件迭代完,顺便攒了一套带人话解释的梯形图、不…...

Z-Image-GGUF惊艳效果:运动模糊、景深虚化、镜头畸变等摄影级效果模拟

Z-Image-GGUF惊艳效果:运动模糊、景深虚化、镜头畸变等摄影级效果模拟 1. 项目简介:当AI学会“拍照” 想象一下,你告诉AI:“给我一张黄昏时分,一个女孩在樱花树下奔跑的照片,要有那种风吹过发丝的动感&am…...

Beyond Compare许可证获取与激活全攻略

1. Beyond Compare简介与许可证类型解析 Beyond Compare作为一款老牌文件对比工具,已经陪伴开发者走过了20多个年头。我第一次接触它是在2015年做代码合并时,当时就被它直观的三栏式对比界面惊艳到了——左右两侧显示对比内容,中间实时标注差…...

AI人体骨骼关键点检测:5分钟快速部署,33个关节点一键可视化

AI人体骨骼关键点检测:5分钟快速部署,33个关节点一键可视化 1. 引言:快速体验人体姿态检测 人体骨骼关键点检测技术正在改变我们与计算机交互的方式。想象一下,你的电脑能够实时理解你的每一个动作——从简单的举手到复杂的舞蹈…...

RAGFlow与Dify共存方案:同一台Win11机器如何用Docker隔离部署

RAGFlow与Dify共存方案:同一台Win11机器如何用Docker隔离部署 在AI应用开发领域,RAGFlow和Dify作为两款热门工具,分别擅长知识库构建和AI应用编排。许多开发者面临一个现实挑战:如何在本地开发环境中同时运行这两个系统&#xff1…...