《重塑AI应用架构》系列: Serverless与MCP融合创新,构建AI应用全新智能中枢
在人工智能飞速发展的今天,数据孤岛和工具碎片化问题一直是阻碍AI应用高效发展的两大难题。由于缺乏统一的标准,AI应用难以无缝地获取和充分利用数据价值。
为了解决这些问题,2024年AI领域提出了MCP(Model Context Protocol模型上下文协议),这一标准化接口协议旨在打破AI模型与外部资源之间的壁垒。就像 USB-C 接口一样,为AI模型/应用与各种数据源和工具之间提供了一种通用的“即插即用”连接方式,让AI模型与外部工具与数据源之间安全双向连接,大大提高了AI开发的效率和灵活性。
随着MCP作为AI 连接数据和工具的统一标准逐渐普及,也标志着AI应用从“静态推理”向“动态执行”的转型,AI应用的全新架构也面临着灵活性、性能与安全等诸多挑战。
华为云AI原生应用运行平台+MCP,重塑 AI 应用架构新范式
为更好的适应全新AI应用架构,华为云推出AI原生应用运行平台+MCP产品组合方案,基于MCP整合Serverless 及一系列平台关键组件,为开发者提供高效、灵活、可靠的AI应用开发与部署方案,实现大模型与外部数据源的“即插即用”安全连接,助力开发者快速构建灵活扩展、安全可信的AI应用,实现AI应用的商业化。
华为云AI原生应用运行平台+MCP产品组合方案
AI应用架构新范式解析
- 用户请求:用户向AI应用发起请求时,请求流量首先进入流量+ AI网关(APIG)。APIG作为应用的入口,维护管理所有AI Agent、MCP Server和LLM的路由规则,确保每个请求都能快速、准确地找到处理路径,同时支持流式响应,为用户带来更流畅的交互体验。
- Agent托管:开发者可通过多种方式自建Agent,CAE为Agent提供了理想的Serverless应用环境,根据负载自动实现资源的动态分配,确保Agent始终处于最佳运行状态。
- 访问MCP Server获取外部数据:MCP Server这类事件驱动型业务尤其适合部署在Serverless函数(FunctionGraph)上,通过Python/Go等语言快速构建MCP Server,实现毫秒级弹性扩缩容。
- 现存业务接入:可经由MCP注册/配置中心(CSE)的帮助注册到Nacos上并实现自动注册发现,MCP网关可以将API转换成MCP Server,实现应用的平滑升级。
- 通过应用中心模板快速部署Agent/MCP Server:应用中心汇聚丰富的Agent/MCP应用模板,开发者只需一键操作即可部署,实现开箱即用。华为云也会将中间件(DCS、DMS、EventGrid)等服务能力以预置MCP Server的方式上架到应用中心。
- 异步推理:在多模态或长周期任务执行场景下,Agent往往采用异步推理的方式与LLM进行交互,消息队列不仅能够起为大模型起到削峰填谷的作用,而且支持主动推送方式提升LLM响应的实时性。
Serverless与MCP融合创新,构建AI应用全新智能中枢
从上面的整体方案我们可以看到MCP Server无疑是整个AI应用架构新范式的智能中枢,如何就保障MCP Server安全可靠运行与弹性高效扩展显得至关重要。
传统本地搭建MCP Server存在挑战:
- 在传统的MCP Server部署模式下,资源静态分配问题尤为突出。企业在搭建MCP Server时,需要提前预估流量峰值,以确定所需的资源,但由于业务的不确定性,预估流量往往与实际流量存在较大偏差,导致资源的浪费或性能瓶颈。在业务淡季,大量的服务器资源处于闲置状态,造成了成本的浪费,而在业务高峰期,由于资源不足,MCP Server可能会出现卡顿甚至崩溃,影响用户体验。
- 开发成本高。从底层的资源搭建到上层的MCP逻辑实现,都需要投入大量的人力和时间,仅开发部分工作量就需要几天时间,且还不包括后续的测试和部署工作。开发者还需要重复实现鉴权、日志等通用功能,进一步增加了开发的复杂性和成本。
- 安全风险同样不容忽视。在传统的常驻服务模式下,服务进程会一直运行,这就可能导致上下文残留,增加了数据泄露的风险,一旦服务器被攻击,攻击者就有可能获取到残留的上下文信息,从而窃取敏感数据,给企业带来巨大的损失。
Serverless函数:MCP Server托管的最优解决方案
Serverless函数计算作为云上Serverless算力的典型代表,在资源弹性、开发效率、安全性等方面具备显著优势,可以为MCP Server的托管提供灵活、高效、可靠的运行时环境,直击传统搭建MCP Server的核心痛点。
- 资源智能弹性调度,Serverless函数计算能够根据实际流量自动调整资源配置。根据函数的负载情况,通过自动化、智能化的资源扩缩容弹性机制,自动完成函数规格的调整,毫秒级弹性轻松应对突发流量冲击,确保服务的稳定运行。而在流量较低时,空闲函数会自动休眠,成本趋近于零,大大降低了企业的运营成本。
- 极简开发部署与运维。应用中心提供了预置的MCP应用模板,如server-github等,开发者只需进行简单的配置,即可在30秒内完成MCP Server部署。Serverless函数计算还具备免运维的特性,自动处理日志、监控、扩缩容等,让开发者能够专注于业务逻辑开发,大幅度提高了开发效率和质量。
- 运行安全保障。业务每个请求都在独立的沙箱环境中执行,执行后自动销毁实例,有效防止了上下文残留带来的数据泄露风险。同时支持细粒度权限控制,根据最小化原则授权,只赋予每个请求所需的最小权限,降低了权限滥用的风险。支持临时Token认证,进一步增强了认证的安全性和灵活性。
Serverless与MCP结合实践场景演示
传统大语言模型,就像一个有大脑会思考、有嘴巴会讲话的机器人,它可以解答我们各种问题,教我们如何完成一件事,但是它没有手和脚,不能直接去完成各种事情,现如今各种各样的MCP Server就如同大模型的手和脚,让其具备了这样的能力。这里我们以MCP官方提供的Everything MCP Server来演示如何让大模型通过调用MCP工具获取环境中的环境变量。
以大模型DeepSeek V3演示具体的工具调用,当我们没有启用MCP时,向大模型提问可以看到他只能告诉我们如何完成这件事,而不能亲自去做。
而当我们启用MCP后,可以看到大模型调用了printEnv工具并正确获取到了所有环境变量。
MCP与Serverless的创新融合,正在重塑着AI应用架构的未来格局,将为AI应用带来更高的灵活性、安全性和效率,为企业和开发者提供更便捷、高效的开发方式,赋能加速AI应用的创新和落地。
紧跟智能化时代AI技术的飞速发展,华为云AI原生应用运行平台+MCP整体产品组合方案,未来还可以与智能化研发、AI Agent开发、AIOps应用可观测、应用韧性评估体系等能力相结合,在生态方面和鸿蒙开发者平台、华为云开发者空间相结合。实现“开发-运行-运维”全链路的AI应用新范式,为AI原生应用提供一站式极简的构建能力,让开发者能够更专注于业务创新,推动AI应用的快速发展和广泛应用。
后续我们将持续推出核心产品组件与MCP结合的系列应用场景与方案,产品能力也将逐步上线,欢迎持续关注。
相关文章:

《重塑AI应用架构》系列: Serverless与MCP融合创新,构建AI应用全新智能中枢
在人工智能飞速发展的今天,数据孤岛和工具碎片化问题一直是阻碍AI应用高效发展的两大难题。由于缺乏统一的标准,AI应用难以无缝地获取和充分利用数据价值。 为了解决这些问题,2024年AI领域提出了MCP(Model Context Protocol模型上…...

深度图可视化
import cv2# 1.读取一张深度图 depth_img cv2.imread("Dataset_depth/images/train/1112_0-rgb.png", cv2.IMREAD_UNCHANGED) print(depth_img.shape) cv2.imshow("depth", depth_img) # (960, 1280) print(depth_img)# 读取一张rgb的图片做对比 input_p…...
【调优】log日志海量数据分表后查询速度调优
原始实现 使用pagehelper实现分页 // 提取开始时间的年份和月份,拼装成表名List<String> timeBetween getTimeBetween(condition);List<String> fullTableName getFullTableName(Constants.LOG_TABLE_NAME, timeBetween);PageHelperUtil.startPage(c…...
hive默认的建表格式
在 Hive 中创建表时,默认的建表语法格式如下: CREATE TABLE table_name (column1_type,column2_type,... ) ROW FORMAT DELIMITED FIELDS TERMINATED BY , STORED AS TEXTFILE;在这个语法中: CREATE TABLE table_name:指定要创建…...
sass 变量
基本使用 如果分配给变量的值后面添加了 !default 标志 ,这意味着该变量如果已经赋值,那么它不会被重新赋值,但是,如果它尚未赋值,那么它会被赋予新的给定值。 如果在此之前变量已经赋值,那就不使用默认值…...

微软Edge浏览器字体设置
前言 时间:2025年4月 自2025年4月起,微软Edge浏览器的默认字体被微软从微软雅黑替换成了Noto Sans,如下图。Noto Sans字体与微软雅黑风格差不多,但在4K以下分辨率的显示器上较微软雅黑更模糊,因此低分辨率的显示器建议…...

Vue生命周期详细解析
前言 Vue.js作为当前最流行的前端框架之一,其生命周期钩子函数是每个Vue开发者必须掌握的核心概念。本文将全面解析Vue的生命周期,帮助开发者更好地理解Vue实例的创建、更新和销毁过程。 一、Vue生命周期概述 Vue实例从创建到销毁的整个过程被称为Vue…...

基于c#,wpf,ef框架,sql server数据库,音乐播放器
详细视频: 【基于c#,wpf,ef框架,sql server数据库,音乐播放器。-哔哩哔哩】 https://b23.tv/ZqmOKJ5...

前端项目搭建集锦:vite、vue、react、antd、vant、ts、sass、eslint、prettier、浏览器扩展,开箱即用,附带项目搭建教程
前端项目搭建集锦:vite、vue、react、antd、vant、ts、sass、eslint、prettier、浏览器扩展,开箱即用,附带项目搭建教程 前言:一、Vue项目下载快速通道二、React项目下载快速通道三、BrowserPlugins项目下载快速通道四、项目搭建教…...
【C++游戏引擎开发】第21篇:基于物理渲染(PBR)——统计学解构材质与光影
引言 宏观现象:人眼观察到的材质表面特性(如金属的高光锐利、石膏的漫反射柔和),本质上是微观结构对光线的统计平均结果。 微观真相:任何看似平整的表面在放大后都呈现崎岖的微观几何。每个微表面(Microfacet)均为完美镜面,但大量微表面以不同朝向分布时,宏观上会表…...

什么是Maven
Maven的概念 Maven是一个一键式的自动化的构建工具。Maven 是 Apache 软件基金会组织维护的一款自动化构建工具,专注服务于Java 平台的项目构建和依赖管理。Maven 这个单词的本意是:专家,内行。Maven 是目前最流行的自动化构建工具࿰…...
强化学习复习,价值函数的推导——北大pdf p41(ppt75)(动手学也有)
我们经常看到强化学习中有求汇报期望 E E E,转化为价值函数(value function) V V V,策略的状态价值函数(State-Value function) V π V_π Vπ和动作价值函数(action-value function) Q π Q_π Qπ。还有提到通过将期望将消除…...

neo4j中节点内的名称显示不全解决办法(如何让label在节点上自动换行)
因为节点过多而且想让节点中所有文字都显示出来而放大节点尺寸 从neo4j中导出png,再转成PDF来查看时,要看清节点里面的文字就得放大5倍才行 在网上看了很多让里面文字换行的办法都不行 然后找到一个比较靠谱的办法是在要显示的标签内加换行符 但是我的节点上显示的是…...
day 32 学习笔记
文章目录 前言一、模版匹配的概念二、模版匹配方法 前言 通过今天的学习,我掌握了OpenCV中有关模版匹配和模版匹配方法的相关原理和操作 一、模版匹配的概念 模板匹配就是用模板图(通常是一个小图)在目标图像(通常是一个比模板图…...

【GIT】github中的仓库如何删除?
你可以按照以下步骤删除 GitHub 上的仓库(repository): 🚨 注意事项: ❗️删除仓库是不可恢复的操作,所有代码、issue、pull request、release 等内容都会被永久删除。 🧭 删除 GitHub 仓库步骤…...
使用Python将YOLO的XML标注文件转换为TXT文件格式
使用Python将YOLO的XML标注文件转换为TXT文件格式,并划分数据集 import xml.etree.ElementTree as ET import os from os import listdir, getcwd from os.path import join import random from shutil import copyfile from PIL import Image# 只要改下面的CLASSE…...
docker容器监控自动恢复
关于实现对docker容器监控以及自动恢复,这里介绍两种实现方案。 方案1: 实现思路: 找到(根据正则表达式)所有待监控的docker容器,此处筛选逻辑根据docker运行状态找到已停止(Exit)类…...
【农气项目】基于适宜度的产量预报
直接上干货(复制到开发工具即可运行的代码) 1. 适宜度模型及作物適宜度计算方法 2. 产量分离 3. 基于适宜度计算产量预报 1. 适宜度模型及作物適宜度计算方法 // 三基点温度配置private final double tempMin;private final double tempOpt;private f…...
1、AI及LLM基础:Python语法入门教程
Python语法入门教程 这是一份全面的Python语法入门教程,涵盖了注释、变量类型与操作符、逻辑运算、list和字符串、变量与集合、控制流和迭代、模块、类、继承、进阶等内容,通过详细的代码示例和解释,帮助大家快速熟悉Python语法。 文章目录 Python语法入门教程一、注释二…...

3台CentOS虚拟机部署 StarRocks 1 FE+ 3 BE集群
背景:公司最近业务数据量上去了,需要做一个漏斗分析功能,实时性要求较高,mysql已经已经不在适用,做了个大数据技术栈选型调研后,决定使用StarRocks StarRocks官网:StarRocks | A High-Performa…...
服务器上安装node
1.安装 下载安装包 https://nodejs.org/en/download 解压安装包 将安装包上传到/opt/software目录下 cd /opt/software tar -xzvf node-v16.14.2-linux-x64.tar.gz 将解压的文件夹移动到安装目录(/opt/nodejs)下 mv /opt/software/node-v16.14.2-linux-x64 /opt/nodejs …...
精益数据分析(20/126):解析经典数据分析框架,助力创业增长
精益数据分析(20/126):解析经典数据分析框架,助力创业增长 在创业和数据分析的学习道路上,每一次深入探索都可能为我们带来新的启发。今天,依旧带着和大家共同进步的想法,我们一起深入研读《精…...
9.策略模式:思考与解读
原文地址:策略模式:思考与解读 更多内容请关注:7.深入思考与解读设计模式 引言 你是否曾遇到过这样的情况:在一个系统中,有许多算法或策略,每种策略的实现逻辑相似,但在某些情况下需要进行替换和扩展&am…...

【HCIA】简易的两个VLAN分别使用DHCP分配IP
前言 之前我们通过 静态ip地址实现了Vlan间通信 ,现在我们添加一个常用的DHCP功能。 文章目录 前言1. 配置交换机2. 接口模式3. 全局模式后记修改记录 1. 配置交换机 首先,使用DHCP,需要先启动DHCP服务: [Huawei]dhcp enable I…...
【设计模式-4】深入理解设计模式:工厂模式详解
在软件开发中,对象的创建是一个基础但至关重要的环节。随着系统复杂度的增加,直接使用new关键字实例化对象会带来诸多问题,如代码耦合度高、难以扩展和维护等。工厂模式(Factory Pattern)作为一种创建型设计模式&#…...
Spring Boot 整合 JavaFX 核心知识点详解
1. 架构设计与集成模式 1.1 Spring Boot 与 JavaFX 的分层架构设计 Spring Boot 与 JavaFX 的整合需要精心设计的分层架构,以充分利用两个框架的优势。 标准分层架构 ┌────────────────────────────────────────────────…...
Spring MVC DispatcherServlet 的作用是什么? 它在整个请求处理流程中扮演了什么角色?为什么它是核心?
DispatcherServlet 是 Spring MVC 框架的绝对核心和灵魂。它扮演着前端控制器(Front Controller)的角色,是所有进入 Spring MVC 应用程序的 HTTP 请求的统一入口点和中央调度枢纽。 一、 DispatcherServlet 的核心作用和职责: 请…...
亚马逊英国站FBA费用重构:轻小商品迎红利期,跨境卖家如何抢占先机?
一、政策背景:成本优化成平台与卖家共同诉求 2024年4月,亚马逊英国站(Amazon.co.uk)发布近三年来力度最大的FBA费用调整方案,标志着英国电商市场正式进入精细化成本管理时代。这一决策背后,是多重因素的叠…...
Redis在.NET平台中的各种应用场景
关键点总结 连接管理:所有示例都使用ConnectionMultiplexer来管理Redis连接,它是线程安全的,应该在整个应用程序中重用。 键设计:良好的键命名规范很重要,通常使用冒号分隔的层次结构(如page:home:pv)。 数据序列化&…...
近几年字节测开部分面试题整理
文章目录 前言一、面试问题1. 在浏览器url上写一个地址,请描述一下网络方面有哪些变化2. 堆栈数据存储位置3. HTTP POST请求支持的数据格式4. 缩容要注意些什么?5. Python中元组、数组、list和数组的区别6. Python中is和的区别7. HTTP与HTTPS8. 已知两个…...