当前位置：首页 > article >正文

我抓包了 Cline 与模型的通信，发现了一件有趣的事

article 2026/3/21 0:03:32

# MCP 规定了工具怎么注册和调用但没规定工具信息怎么传给 LLM。Cline 是怎么做的通过搭建一个中间人服务器抓包完整的通信协议暴露在眼前。从一个问题开始学完 MCP 基础之后你可能会有一个疑问“MCP 定义了 Host 和 Server 之间的通信但是 Host 怎么把工具信息传递给 LLM”官方文档语焉不详。不同的 Host 实现方式不一样Cline 怎么做的只有一种方法能知道——抓包。搭建中间人服务器思路很简单在 Cline 和真实 LLM API 之间插入一个代理服务器记录所有流量。正常流程 Cline → OpenRouter/Claude API 抓包流程 Cline → 本地代理服务器记录流量→ OpenRouter/Claude API实现代理服务器FastAPI httpx# proxy.pyfromfastapiimportFastAPI,Requestfromfastapi.responsesimportStreamingResponseimporthttpximportjsonimporttime appFastAPI()TARGET_APIhttps://openrouter.ai/api/v1LOG_FILEllm.logapp.post(/v1/chat/completions)asyncdefproxy_chat(request:Request):bodyawaitrequest.json()headersdict(request.headers)# 记录请求withopen(LOG_FILE,a,encodingutf-8)asf:f.write(f\n{*60}\n)f.write(f[{time.strftime(%H:%M:%S)}] REQUEST\n)f.write(json.dumps(body,ensure_asciiFalse,indent2))f.write(\n)# 转发给真实 APIasyncdefgenerate():asyncwithhttpx.AsyncClient()asclient:asyncwithclient.stream(POST,f{TARGET_API}/chat/completions,jsonbody,headers{Authorization:fBearer{YOUR_API_KEY},Content-Type:application/json},timeout120.0)asresponse:full_responseasyncforchunkinresponse.aiter_text():full_responsechunkyieldchunk# 记录响应withopen(LOG_FILE,a,encodingutf-8)asf:f.write(f[{time.strftime(%H:%M:%S)}] RESPONSE\n)f.write(full_response[:5000])# 只记录前 5000 字符f.write(\n)returnStreamingResponse(generate(),media_typetext/event-stream)if__name____main__:importuvicorn uvicorn.run(app,host0.0.0.0,port8000)配置 Cline 使用代理在 Cline 的 API 设置中ProviderOpenAI CompatibleBase URLhttp://localhost:8000API Key任意字符串代理会替换抓包结果Cline 发送了什么启动代理在 Cline 里输入一个需要调用 MCP 工具的任务“帮我查一下纽约今天的天气”日志文件里出现了一段令人震惊的内容System Prompt 长达数万字符Cline 发送给 LLM 的 System Prompt不是你想象中简单的几句话而是一个数万字符的庞然大物包含角色定义你是一个高度熟练的软件工程师…工具调用格式XML 标签规范所有内置工具的说明read_file、write_to_file、execute_command…所有 MCP 工具的说明来自已配置的 MCP Server详细的行为规范何时询问用户、如何处理错误…!-- System Prompt 片段极度简化 --你是 Cline一位高度熟练的软件工程师能够使用各种工具完成各种任务。 ## 工具使用格式你可以通过 XML 标签格式使用工具tool_nameparameter_nameparameter_value/parameter_name/tool_name## 可用工具 ### read_file 读取文件内容read_filepath目标文件路径/path/read_file### use_mcp_tool 使用 MCP 工具use_mcp_toolserver_name服务器名/server_nametool_name工具名/tool_namearguments{参数: 值}/arguments/use_mcp_tool## 已配置的 MCP 服务器 ### weather天气查询服务 - get_forecast获取指定经纬度的天气预报参数latitude纬度、longitude经度用户消息被包装成 XMLtask帮我查一下纽约今天的天气/taskenvironment_details当前时间2026-03-16 21:00:00 操作系统macOS 14.0 打开的文件无/environment_detailsLLM 的响应也是 XML 格式thinking用户想知道纽约的天气。我需要使用 get_forecast 工具。纽约的坐标大约是纬度 40.71经度 -74.01。/thinkinguse_mcp_toolserver_nameweather/server_nametool_nameget_forecast/tool_namearguments{latitude: 40.7128, longitude: -74.0060}/arguments/use_mcp_toolCline 解析到use_mcp_tool标签执行工具调用把结果返回给 LLMtool_result纽约今天晴气温 18°C偏北风 2 级紫外线指数中等。/tool_resultLLM 收到工具结果后输出最终答案并用attempt_completion标记任务完成attempt_completionresult纽约今天天气晴好气温 18°C偏北风 2 级适合出行。紫外线指数中等建议出门涂防晒。/result/attempt_completion这揭示了什么核心发现一Cline 用 XML 而非 Function CallingOpenAI 定义了标准的 Function Calling 格式JSON Schema但 Cline 没有用——它自己发明了一套 XML 格式。这说明MCP 协议不规定 Host 如何与 LLM 交互每个 Host 可以自行设计。CherryStudio 用 Function CallingCline 用 XML——这是两种完全不同的实现但都能工作因为 MCP 只管 Host 和 Server 之间的通信。核心发现二ReAct 模式的工程化实现Cline 的整个交互流程就是ReActReasoning Acting模式的工程落地Thought思考→ Action行动→ Observation观察→ 重复通过thinking标签强制模型先思考再行动通过 XML 结构化输出解析工具调用通过工具结果反馈推动下一轮推理。核心发现三System Prompt 是 Agent 的真正配置文件Cline 的 System Prompt 动辄数万 Token占整个 Context 的相当大一部分。这个巨大的 System Prompt包含了 Agent 的所有规则和能力清单。这也解释了为什么Cline 的启动成本高每次对话都要发送这个巨大的 System PromptCline 的 Agent 能力强工具使用规范非常详细模型很少用错能学到什么抓包分析的实践价值1. 调试工具调用失败当 LLM 不调用工具或者调用参数错误看日志能快速定位是 Tool 的 description 写得不够好还是 LLM 理解错了。2. 自定义 Agent 开发参考Cline 的 XML 格式是一种可以借鉴的设计思路。如果你要开发自己的 Agent可以参考这种先思考、再行动的 Prompt 结构。3. 成本控制看到 System Prompt 多大你就知道每次对话基础成本是多少可以合理规划 Context 预算。动手试一试代码仓库里有完整的中间人代理代码gitclone https://github.com/MarkTechStation/VideoCodecdVideoCode/MCP终极指南-番外篇 pipinstallfastapi uvicorn httpx python proxy.py配置完 Cline随便问一个需要工具的问题然后打开llm.log——你会看到比任何文档都更真实的 MCP 工作原理。

我抓包了 Cline 与模型的通信，发现了一件有趣的事

相关文章：

我抓包了 Cline 与模型的通信，发现了一件有趣的事

液晶接口系列——MIPI(四)DSI信号完整性测试与优化实战

零基础学Python：从搭建环境到第一行代码

乙巳马年·皇城大门春联生成终端W模型安全与内容过滤配置教程

CYBER-VISION零号协议Java集成实战：构建企业级AI微服务应用

Qwen2.5-7B快速体验：网页推理服务的搭建与使用

Qwen3.5-9B保姆级教程：Conda环境隔离+torch.compile加速Qwen3.5-9B推理性能

LiveKit Agents主题定制终极指南：打造个性化AI语音代理的5个步骤

Phi-3-vision-128k-instruct 安全与权限设计：基于API密钥和CCSwitch的访问控制

Qwen-Image镜像详细步骤：RTX4090D上Qwen-VL与Qwen2-VL性能对比实测

Erigon数据库设计：LevelDB和MDBX的优化使用指南

Qwen-Image镜像多场景扩展：接入LangChain+Qwen-VL构建多模态RAG系统

RexUniNLU零样本NLU惊艳效果：中文直播脚本中角色、动作、道具、情绪标注

OSX-KVM高并发场景测试：同时运行10台macOS虚拟机的终极指南

告别显存不足！GPT-oss:20b在普通电脑上的8个实用玩法

disposable-email-domains的监控告警系统：异常域名检测与实时通知

场景应用：将Qwen3-VL:30B接入飞书，实现图片识别与智能对话的办公新体验

圣女司幼幽-造相Z-Turbo实战教程：Gradio界面中ControlNet兼容性验证

Neeshck-Z-lmage_LYX_v2算力适配：Jetson Orin Nano边缘设备初步验证

如何构建实时多模态AI应用：LiveKit Agents完整指南 [特殊字符]

超越猫狗图：用Grad-CAM给你的自定义PyTorch模型做一次‘视觉CT’（以YOLO/Transformer为例）

3步彻底解决魔兽争霸3帧率卡顿：WarcraftHelper实战优化指南

MapLibre Native插件开发指南：扩展地图功能的完整教程

影响大模型输出的手段-prompt篇

ONIE 项目推荐

效果惊艳！通义千问3-Embedding-4B实测：32k长文语义搜索准确率大幅提升

Qwen3-14B量化版效果展示：实测文本生成，流畅自然堪比原版

mPLUG模型解释性：可视化注意力机制

VisionMaster4.2使用OpenCV

AgentKit智能钱包灾备方案：多区域数据备份与恢复策略终极指南