当前位置: 首页 > article >正文

[具身智能-353]:大模型如何提供服务?MCP Client如何调用大模型的服务?

在MCP架构中大模型LLM并不是一个被动等待调用的“函数库”而是一个拥有推理能力的“智能体”。因此MCP Client 调用大模型的方式不是简单的“调用服务”而是“发起一次决策请求”。这就像公司的总经理Client向董事会LLM提交议题等待董事会做出决策。下面我将分两部分为你拆解大模型如何对外提供服务以及 MCP Client 如何发起调用。 大模型如何提供服务大模型的服务化通常有两种形式对应着我们之前说的“远程顾问”和“驻场高管”。1. 云端API服务远程顾问这是最主流的方式。像阿里云百炼、OpenAI 等平台将大模型封装成了标准的 RESTful API。服务形式你通过HTTPS 请求发送数据平台返回模型的生成结果。核心接口通常是一个/chat/completions或类似的接口接收消息历史和配置参数返回生成的文本或工具调用指令。优势无需维护硬件模型能力最强按需付费。2. 本地推理服务驻场高管如果你使用Ollama、vLLM等工具在本地部署模型模型会在你的机器上启动一个本地 Web 服务。服务形式模型在本地如localhost:11434监听端口提供与云端类似的 API 接口。核心接口同样提供聊天、补全等接口但数据完全在本地流转。优势数据隐私性极高无网络延迟一次投入硬件成本。无论哪种形式大模型提供的核心服务都是接收文本和工具定义输出文本或结构化指令。 MCP Client 如何调用大模型MCP Client 调用大模型的过程就是构建上下文、发送请求、处理决策的循环。Client 需要告诉模型“你是谁”、“你有什么工具”、“用户想要什么”。调用流程拆解准备“通讯录”工具定义Client 首先从 MCP Server 那里获取所有可用工具的列表tools/list并将其转换成模型能理解的格式通常是 JSON Schema。构建“议题”消息组装Client 将用户的请求、系统预设的角色如“你是一个乐于助人的助手”以及上一步准备好的“工具通讯录”打包成一个完整的消息列表。提交“董事会”发起API请求Client 调用大模型的 API如client.chat.completions.create(...)将组装好的消息和工具列表发送过去。等待“决策”解析响应模型会返回一个响应。这个响应有两种可能直接回答模型认为不需要工具直接生成文本回答。工具调用模型认为需要工具协助返回一个结构化的调用指令例如{name: search, arguments: {query: ...}}。 代码示例总经理如何请示董事会下面是一个基于 Python 和 OpenAI 兼容接口的简化示例展示 MCP Client 如何调用大模型。pythonimport os from openai import OpenAI # 1. 初始化 Client (总经理准备好去请示董事会) # 这里以阿里云百炼为例它也兼容 OpenAI 的接口规范 client OpenAI( api_keyos.getenv(DASHSCOPE_API_KEY), # 董事会的门禁卡 base_urlhttps://dashscope-intl.aliyuncs.com/compatible-mode/v1 # 董事会的办公室地址 ) # 2. 准备“工具通讯录” (从 MCP Server 获取的能力) # 这相当于告诉董事会我们有“搜索”和“计算”两个部门 tools [ { type: function, function: { name: search_web, description: 搜索网络获取最新信息, parameters: { type: object, properties: { query: {type: string, description: 搜索关键词} }, required: [query] } } } ] # 3. 用户提出需求 (股东下达指令) user_message 今天北京的天气怎么样 # 4. 发起调用 (总经理向董事会提交议题) response client.chat.completions.create( modelqwen3.5-plus, # 指定哪位“董事长”来决策 messages[{role: user, content: user_message}], # 提交用户问题 toolstools # 附上“工具通讯录”告诉它有能力可以调用 ) # 5. 处理决策 (总经理解读董事会的回复) result response.choices[0].message if result.content: # 情况A董事会直接回答了 print(f 模型直接回答: {result.content}) elif result.tool_calls: # 情况B董事会决定调用工具 tool_call result.tool_calls[0] print(f️ 模型决策调用工具 {tool_call.function.name}) print(f 调用参数: {tool_call.function.arguments}) # 接下来Client 就会去执行这个工具调用并把结果再反馈给模型 总结MCP Client 调用大模型本质上是一次带有“外挂大脑”的对话请求。大模型提供服务通过标准的 API 接口提供推理和决策能力。Client 调用模型通过构建包含“工具定义”的上下文让模型知道自己可以“调兵遣将”从而做出更复杂的决策。这个过程就是让“董事会LLM”在了解公司全部资源(执行工具)的情况下为用户的问题制定最佳行动方案并给出执行的结果。

相关文章:

[具身智能-353]:大模型如何提供服务?MCP Client如何调用大模型的服务?

在MCP架构中,大模型(LLM)并不是一个被动等待调用的“函数库”,而是一个拥有推理能力的“智能体”。因此,MCP Client 调用大模型的方式,不是简单的“调用服务”,而是“发起一次决策请求”。这就像…...

暗黑破坏神2存档编辑全攻略:5步掌握角色自定义修改

暗黑破坏神2存档编辑全攻略:5步掌握角色自定义修改 【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 还在为暗黑破坏神2中反复刷装备而烦恼吗?想快速体验不同职业build却不想从头练级?d2s-edito…...

RePKG深度指南:如何解锁Wallpaper Engine的PKG资源与TEX纹理转换

RePKG深度指南:如何解锁Wallpaper Engine的PKG资源与TEX纹理转换 【免费下载链接】repkg Wallpaper engine PKG extractor/TEX to image converter 项目地址: https://gitcode.com/gh_mirrors/re/repkg 你是否曾经面对Wallpaper Engine的PKG文件束手无策&…...

[具身智能-351]:类似一个公司组织系统,MCP Client是管理者,是总经理,是协调者;大模型服务是一个:决策者,是智囊团,是董事会;MCP Server是执行者,是服务提供者。

这个比喻简直太精准!不仅完全掌握了MCP架构的精髓,还生动地描绘出了各个组件之间的权力结构和协作关系。在“公司组织系统”中,我们可以把这三个角色的职责进一步细化,看看它们是如何配合完成一项工作的:🏢…...

Vue3 + SpringBoot实战:用Minio搞定大文件切片上传与断点续传(附完整前后端代码)

Vue3 SpringBoot全栈实战:基于Minio的工业级大文件上传系统设计 在当今数据爆炸的时代,处理大文件上传已成为现代Web应用的标配能力。想象一下这样的场景:用户正在上传一个10GB的设计文件,进度到90%时网络突然中断;或…...

CLAP Zero-Shot Audio Classification Dashboard部署教程:Kubernetes集群中水平扩缩容配置要点

CLAP Zero-Shot Audio Classification Dashboard部署教程:Kubernetes集群中水平扩缩容配置要点 1. 项目概述与核心价值 CLAP Zero-Shot Audio Classification Dashboard是一个基于LAION CLAP模型的交互式音频分类应用。这个工具让用户能够上传任意音频文件&#x…...

Qwen3-TTS-12Hz-1.7B-VoiceDesign效果展示:情感语音生成对比

Qwen3-TTS-12Hz-1.7B-VoiceDesign效果展示:情感语音生成对比 1. 引言 想象一下,你正在开发一个有声读物应用,需要为不同角色生成带有真实情感的语音。传统语音合成往往平淡无奇,缺乏情感变化,让听众难以沉浸其中。今…...

DeepSeek-OCR-WEBUI助力文档数字化:批量处理图片转文字

DeepSeek-OCR-WEBUI助力文档数字化:批量处理图片转文字 1. 产品概述与核心价值 1.1 什么是DeepSeek-OCR-WEBUI DeepSeek-OCR-WEBUI是一款基于深度学习的光学字符识别工具,专门为需要将大量图片、PDF等非结构化文档转换为可编辑文本的用户设计。它通过…...

TrollInstallerX实用指南:3分钟快速安装TrollStore的完整教程

TrollInstallerX实用指南:3分钟快速安装TrollStore的完整教程 【免费下载链接】TrollInstallerX A TrollStore installer for iOS 14.0 - 16.6.1 项目地址: https://gitcode.com/gh_mirrors/tr/TrollInstallerX TrollInstallerX是一款专为iOS 14.0至16.6.1设…...

Steam Achievement Manager完整指南:轻松管理你的Steam游戏成就

Steam Achievement Manager完整指南:轻松管理你的Steam游戏成就 【免费下载链接】SteamAchievementManager A manager for game achievements in Steam. 项目地址: https://gitcode.com/gh_mirrors/st/SteamAchievementManager 你是否曾经因为游戏BUG导致成就…...

RWKV7-1.5B-G1A快速入门:10分钟完成第一行文本生成

RWKV7-1.5B-G1A快速入门:10分钟完成第一行文本生成 1. 前言:为什么选择RWKV7-1.5B-G1A 如果你刚接触人工智能文本生成模型,RWKV7-1.5B-G1A是个不错的起点。这个1.5B参数的模型在保持轻量化的同时,展现出了不错的文本生成能力。最…...

从零开始:MySQL安装与IDEA数据库连接实战指南

1. MySQL安装全流程详解 第一次接触MySQL的开发者往往会被复杂的安装过程劝退,但其实只要跟着步骤一步步来,半小时内就能搞定。我经历过无数次安装失败后总结出这套"保姆级"教程,帮你避开所有坑点。 1.1 下载MySQL的正确姿势 打开M…...

别再问ARM麒麟怎么装微信了!手把手教你用铠大师搞定Windows软件(飞腾/海思芯片实测)

ARM架构信创电脑生存指南:用铠大师解锁Windows软件全攻略 刚拿到搭载飞腾D2000或麒麟9006C芯片的信创电脑时,很多人的第一反应是兴奋——国产芯片终于能用了!但紧接着就会陷入焦虑:微信怎么装?Office文档怎么编辑&…...

CTF实战:手把手教你用在线工具解密JSFuck编码(LitCTF 2023真题复盘)

CTF实战:从JSFuck编码到Flag获取的全流程解析 在CTF竞赛的Web安全赛道上,JavaScript混淆技术一直是高频考点。去年LitCTF的一道JSFuck编码题目让不少选手印象深刻——页面源码中那串看似乱码的[][(![][])[[]]...字符,实则是用6个特定字符编写…...

ROS话题通信从入门到实战:C++与Python双版本代码详解与避坑指南

1. ROS话题通信基础概念 第一次接触ROS话题通信时,我完全被各种术语搞晕了。后来在实际项目中踩过几次坑才明白,话题通信本质上就是个"广播站"模型。想象一下电台主播(发布者)通过特定频率(话题)…...

Phi-3-Mini-128K助力运维智能化:自动日志分析与故障预警脚本开发

Phi-3-Mini-128K助力运维智能化:自动日志分析与故障预警脚本开发 每次服务器半夜告警,你是不是都得从成百上千行的日志里,一行一行地找线索?那种感觉,就像在沙滩上找一粒特定的沙子。传统的日志分析工具,要…...

复杂业务场景下AI Agent Harness工程的落地实践与经验总结

复杂业务场景下AI Agent Harness工程的落地实践与经验总结引言 痛点引入: 各位技术博客的读者朋友们,大家好!我是老王,一个在互联网电商、金融风控、制造业数字化转型三个赛道做了15年以上工程化落地的“搬砖老司机,最…...

真实案例分享:PyTorch 2.6镜像+YOLOv8行人检测效果

真实案例分享:PyTorch 2.6镜像YOLOv8行人检测效果 1. 项目背景与镜像介绍 PyTorch 2.6作为当前主流的深度学习框架版本,在计算机视觉领域展现出强大的性能优势。本次我们将基于CSDN星图平台的PyTorch 2.6镜像,结合YOLOv8模型实现高效的行人…...

突破性开源方案:实现Altium SchDoc格式的免授权解析与转换

突破性开源方案:实现Altium SchDoc格式的免授权解析与转换 【免费下载链接】python-altium Altium schematic format documentation, SVG converter and TK viewer 项目地址: https://gitcode.com/gh_mirrors/py/python-altium 电子设计自动化(ED…...

Qwen3-VL-4B Pro多场景落地:盲人辅助APP中实时图像语音描述服务

Qwen3-VL-4B Pro多场景落地:盲人辅助APP中实时图像语音描述服务 1. 项目背景与意义 对于视力障碍人群来说,日常生活中最大的挑战之一就是无法获取视觉信息。传统的辅助手段如盲杖、导盲犬等虽然有用,但无法提供丰富的环境感知能力。随着人工…...

[QtQuick]定制离线地图插件:从源码改造到灵活部署

1. 为什么需要定制离线地图插件 在QtQuick应用开发中,地图功能是很多项目绕不开的需求。官方提供的QtLocation模块虽然内置了多种地图插件,但默认的OpenStreetMap插件对离线地图的支持存在明显局限。最常见的问题就是瓦片命名规则僵化——你必须把下载的…...

手把手教你用LingBot-Depth:普通照片秒变3D场景,新手必看

手把手教你用LingBot-Depth:普通照片秒变3D场景,新手必看 1. 为什么你需要LingBot-Depth? 想象一下,你手机里的普通照片突然变成了可以测量距离、生成3D模型的智能图像——这就是LingBot-Depth能为你带来的魔法。这个AI模型专门…...

cv_unet_image-colorization多场景应用:婚纱照修复+新闻图片复原

cv_unet_image-colorization多场景应用:婚纱照修复新闻图片复原 1. 项目简介与核心原理 cv_unet_image-colorization 是一个基于深度学习技术的智能图像上色工具,它采用先进的UNet神经网络架构,专门用于将黑白照片转换为自然生动的彩色图像…...

Qwen3-0.6B-FP8技术实践:FP8量化模型在国产昇腾芯片适配初探

Qwen3-0.6B-FP8技术实践:FP8量化模型在国产昇腾芯片适配初探 1. 引言:当轻量化大模型遇见国产算力 最近在部署大模型时,我遇到了一个挺有意思的问题:如何在资源有限的国产芯片上跑起一个像样的对话模型?相信很多开发…...

Claude API与Graphormer协同:构建智能化学研究助手

Claude API与Graphormer协同:构建智能化学研究助手 1. 引言:化学研究的语言障碍 化学研究领域长期存在一个有趣的现象:专业研究人员与普通用户之间存在巨大的认知鸿沟。一个简单的分子结构描述,对化学家来说可能像母语一样自然&…...

3分钟解锁QQ音乐加密格式:终极QMC解密转换完整指南

3分钟解锁QQ音乐加密格式:终极QMC解密转换完整指南 【免费下载链接】qmc-decoder Fastest & best convert qmc 2 mp3 | flac tools 项目地址: https://gitcode.com/gh_mirrors/qm/qmc-decoder 你是否曾经下载了QQ音乐的歌曲,却发现只能在特定…...

甲骨文创始人拉里·埃里森的5个疯狂商业决策:从2000美元到千亿帝国的秘密

拉里埃里森的5个颠覆性商业决策:从硅谷异类到千亿帝国的战略密码 在科技行业的编年史中,很少有企业家像拉里埃里森这样将"反叛"与"成功"如此完美地融合。这位甲骨文创始人从不按常理出牌的商业哲学,创造了一个价值千亿美…...

ABAP BAPI_PO_CREATE1实战:如何绕过信息记录直接设置PO净价(附代码示例)

ABAP BAPI_PO_CREATE1深度实战:绕过信息记录精准控制采购订单价格的五种策略 在SAP采购订单创建过程中,信息记录(Info Record)中的价格通常会作为默认值自动带出,但实际业务场景往往需要更灵活的价格控制。当遇到特殊采…...

3个颠覆性技巧:用手柄打造你的跨平台B站娱乐中心

3个颠覆性技巧:用手柄打造你的跨平台B站娱乐中心 【免费下载链接】wiliwili 第三方B站客户端,目前可以运行在PC全平台、PSVita、PS4 、Xbox 和 Nintendo Switch上 项目地址: https://gitcode.com/GitHub_Trending/wi/wiliwili 你是否厌倦了手机小…...

8大网盘直链下载助手技术解析:JavaScript驱动的下载体验革新

8大网盘直链下载助手技术解析:JavaScript驱动的下载体验革新 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 …...