当前位置: 首页 > article >正文

MCP与RAG:增强大型语言模型的两种路径

引言

近年来,大型语言模型(LLM)在自然语言处理任务中展现了令人印象深刻的能力。然而,这些模型的局限性,如知识过时、生成幻觉(hallucination)等问题,促使研究人员开发了多种增强技术。其中,模型上下文协议(MCP)和检索增强生成(RAG)是两个重要的概念,特别是在当前的AI研究和应用中。接下来将详细解释MCP和RAG,比较它们的相似点和差异,并讨论它们的实际应用和潜在优势。
在这里插入图片描述

MCP的详细解释

MCP,全称模型上下文协议,是一种协议,旨在通过标准化的方式将LLM与外部工具和系统集成。MCP允许LLM作为AI代理的一部分,与工具互动,这些工具通常托管在服务器上,可以被不同框架使用,即使这些框架使用不同的编程语言。例如,Anthropic推出了MCP,并为Google Drive、Slack、GitHub和Git等系统提供了预建的MCP服务器,详情可见Anthropic的新闻页面。

MCP的一个关键应用是MCP-Solver,这是MCP与约束编程系统集成的第一个应用,具体见arXiv上的论文。该论文展示了如何通过MCP将LLM与MiniZinc等约束求解器集成,开放源代码实现可在GitHub上找到。MCP的成功依赖于行业支持以及在安全、可扩展性和兼容性方面的解决方案。

RAG的详细解释

RAG,全称检索增强生成,是一种架构方法,通过从外部知识库检索相关信息并将其作为上下文提供给LLM,来优化其生成输出。RAG帮助LLM生成更准确、更新的信息,特别适用于需要保持最新信息的支持聊天机器人和问答系统。RAG的工作原理包括两个主要部分:检索组件从数据库或网页中提取相关信息,然后将这些信息无缝整合到LLM的生成过程中,详情见Google Cloud的用例。

arXiv上的调查论文指出,RAG解决了LLM的几个挑战,如幻觉和知识过时问题,通过从外部数据库中获取信息来增强生成的可信度和准确性。这是一种成本效益高的方法,因为更新检索索引比持续微调预训练模型更有效,具体见Oracle的解释。

比较分析

为了更清晰地比较MCP和RAG,我们可以从以下几个方面进行分析:

方面MCPRAG
主要目的集成LLM与外部工具和系统,执行各种操作通过检索信息提供上下文,增强文本生成
互动方式LLM或AI代理主动调用工具,动态控制系统在生成前检索信息,LLM被动接收上下文
适用范围通用,可用于任何工具(如求解器、API调用)特定于信息检索,支持知识密集型任务
典型应用AI代理与GitHub、数据库互动,执行复杂任务聊天机器人、问答系统,提供最新准确信息
灵活性高,允许动态工具调用较低,依赖预定义的检索和生成流程

从表中可以看出,MCP和RAG在增强LLM能力方面有一定的相似性,例如都涉及外部信息或工具的利用,但它们的侧重点不同。MCP更注重让LLM具备与外部系统互动的能力,而RAG则专注于优化文本生成的质量。

讨论与应用

MCP和RAG的差异反映了它们在实际应用中的不同定位。MCP特别适合需要LLM执行复杂操作的场景,例如在开发AI代理时,代理可能需要调用外部工具来完成任务,如从数据库中提取数据或使用约束求解器解决问题。另一方面,RAG更适合需要保持信息最新和准确的场景,例如企业聊天机器人需要回答与产品或服务相关的问题,而这些信息可能超出了LLM的训练数据范围。

一个有趣的观察是,这两者可以结合使用。例如,一个AI代理可以使用MCP调用一个检索工具(如Web搜索),然后通过RAG将检索到的信息整合到其生成响应中,从而实现更强大的功能。这种组合在2025年的AI应用中可能变得越来越常见,尤其是在需要动态交互和实时信息更新的场景中。

MCP的成功依赖于行业对该协议的支持以及解决安全和可扩展性问题,而RAG的普及则得益于其成本效益和易于实施。然而,MCP的通用性可能使其在未来成为更广泛的集成标准,而RAG则可能继续在知识密集型任务中占据主导地位。

结论

总之,MCP和RAG都是增强LLM能力的创新方法,但它们的用途和机制不同。MCP提供了一个通用的框架,允许LLM与各种外部工具互动,而RAG则专注于通过检索信息来改善文本生成。理解这些差异对于选择适合特定用例的技术至关重要,尤其是在当前的AI研究和应用环境中。

关键引用
  • MCP-Solver: Integrating Language Models with Constraint Programming Systems
  • A quick look at MCP with Large Language Models and Node.js
  • What is Retrieval Augmented Generation (RAG)?
  • Retrieval Augmented Generation for Large Language Models: A Survey
  • What is Retrieval-Augmented Generation (RAG)?
  • What is retrieval-augmented generation (RAG)?
  • What is Retrieval-Augmented Generation (RAG)?

相关文章:

MCP与RAG:增强大型语言模型的两种路径

引言 近年来,大型语言模型(LLM)在自然语言处理任务中展现了令人印象深刻的能力。然而,这些模型的局限性,如知识过时、生成幻觉(hallucination)等问题,促使研究人员开发了多种增强技…...

ARM 架构下 cache 一致性问题整理

本篇文章主要整理 ARM 架构下,和 Cache 一致性相关的一些知识。 本文假设读者具备一定的计算机体系结构和 Cache 相关基础知识,适合有相关背景的读者阅读 1、引言 简单介绍一下 Cache 和内存之间的关系 在使能 Cache 的情况下,CPU 每次获取数…...

GB28181未来发展趋势,如何借助于EasyGBS国标GB28181平台+EasyGBD国标GB28181设备端抓住大机会

GB28181规范目前已经迎来了2022版,随着规范行业影响力和应用范围越来越大,相信还会有类似2028、2030等迭代版本出来,我们预测的GB28181发展趋势可能会是以下几个方面,感兴趣的也可以跟我单独探讨: 技术标准持续优化&a…...

代数结构—笔记

线性空间 如果满足以下性质,则域 K K K上定义了二元运算(加法)与二元函数(数乘)的非空集合 X X X称为线性空间。 1、加法封闭性:对任意 u , v ∈ X u, v \in X u,v∈X,存在 u v ∈ X uv\in X …...

tcc编译器教程1 配置tcc编译器环境

TinyCC(又名TCC)是一款开源小型但超快速的C编译器。下面介绍在windows下使用 1软件下载 tcc编译器官网为 https://www.bellard.org/tcc/ 下载地址为 http://download.savannah.gnu.org/releases/tinycc/ 选择其中tcc-0.9.27-win64-bin.zip进行下载 htt…...

安全模块设计:token服务、校验注解(开启token校验、开启签名校验、允许处理API日志)、获取当前用户信息的辅助类

文章目录 引言pom.xmlI 校验注解ApiValidationII token服务TokenService获取当前用户信息的辅助类III 域登录接口响应数据登陆用户信息引言 pom.xml <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/PO…...

机器学习:线性回归,梯度下降,多元线性回归

线性回归模型 (Linear Regression Model) 梯度下降算法 (Gradient Descent Algorithm) 的数学公式 多元线性回归&#xff08;Multiple Linear Regression&#xff09;...

报错The default superclass, “jakarta.servlet.http.HttpServlet“(已经配置好tomcat)

报错报错DescriptionResourcePathLocationType The default superclass,“jakarta.servlet.http.HttpServlet”, according to the project’s Dynamic Web Module facet version (5.0), was not found on the Java Build Path. 解决办法&#xff1a; 根据错误信息&#xff0…...

【人工智能】数据挖掘与应用题库(1-100)

1、涉及变化快慢的问题可以考虑使用导数来分析。 答案:对 2、导数的几何意义是曲线在某点处切线的斜率。 答案:对 3、函数在某点的左导数存在,则导数就存在。 答案:错 4、关于梯度下降算法,下列说法错误的是( ) 错误:梯度下降算法能找到函数精确的最小值。 5、正…...

C#委托(delegate)的常用方式

C# 中委托的常用方式&#xff0c;包括委托的定义、实例化、不同的赋值方式以及匿名委托的使用。 委托的定义 // 委托的核心是跟委托的函数结构一样 public delegate string SayHello(string c);public delegate string SayHello(string c);&#xff1a;定义了一个公共委托类型 …...

【弹性计算】弹性裸金属服务器和神龙虚拟化(一):功能特点

弹性裸金属服务器和神龙虚拟化&#xff08;一&#xff09;&#xff1a;功能特点 特征一&#xff1a;分钟级交付特征二&#xff1a;兼容 VPC、SLB、RDS 等云平台全业务特征三&#xff1a;兼容虚拟机镜像特征四&#xff1a;云盘启动和数据云盘动态热插拔特征五&#xff1a;虚拟机…...

小结:BGP 的自动聚合与手动聚合

BGP 的自动聚合与手动聚合 BGP 在大规模网络中&#xff0c;通常会进行路由聚合&#xff08;Route Aggregation&#xff09;&#xff0c;即将多个更具体&#xff08;更小&#xff09;的路由前缀合并成一个更大&#xff08;更粗略&#xff09;的前缀&#xff0c;以减少 BGP 路由…...

CTF中pwn shellcode题目

CTF中pwn shellcode题目 下面是一些shellcode代码和绕过技巧。 一些只给payload或者exp一把梭 首先给出两个常用shellcode仓库&#xff0c;可以检索需要的shellcode shellcode databaseexploit-db 基础 基础shellcode shellcode asm(shellcraft.sh())生成指定函数 用法…...

Conda 环境搭建实战:从基础到进阶

在当今复杂多变的软件开发与数据科学领域&#xff0c;拥有一个稳定、可复现且易于管理的开发环境是项目成功的基石。Conda 作为一款强大的跨平台环境管理与包管理工具&#xff0c;为开发者提供了便捷高效的环境搭建与依赖管理解决方案。本文将深入探讨 Conda 环境搭建的实战技巧…...

深入解析:域名转换成 IP 地址的多种方式

深入解析&#xff1a;域名转换成 IP 地址的多种方式 在互联网的世界里&#xff0c;我们日常访问网站时输入的是易于记忆的域名&#xff0c;比如 “www.example.com”&#xff0c;但计算机之间通信实际上依靠的是 IP 地址。那么&#xff0c;域名是如何转换成 IP 地址的呢&#x…...

大模型function calling:让AI函数调用更智能、更高效

大模型function calling&#xff1a;让AI函数调用更智能、更高效 随着大语言模型&#xff08;LLM&#xff09;的快速发展&#xff0c;其在实际应用中的能力越来越受到关注。Function Calling 是一种新兴的技术&#xff0c;允许大模型与外部工具或API进行交互&#xff0c;从而扩…...

LeetCode:131. 分割回文串(DP Java)

目录 131. 分割回文串 题目描述&#xff1a; 实现代码与解析&#xff1a; 动态规划 原理思路&#xff1a; 131. 分割回文串 题目描述&#xff1a; 给你一个字符串 s&#xff0c;请你将 s 分割成一些子串&#xff0c;使每个子串都是 回文串 。返回 s 所有可能的分割方案。…...

计算机毕业设计SpringBoot+Vue.js贸易行业CRM系统(源码+文档+PPT+讲解)

温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 作者简介&#xff1a;Java领…...

虚拟机中的指示命令

1. 复制文件&#xff1a;cp 源文件 目标文件&#xff08;cp file1.txt file2.txt&#xff09; 2. 复制文件夹&#xff1a;cp -r 源文件夹 目标文件夹&#xff08;cp -r dir1 dir2&#xff09; 3. 创建一个空的文件&#xff1a;touch file1.txt 4. 创建一个空目录&a…...

图像分类项目2:鸟类图像分类

1 数据集处理 1.1数据集下载 数据集来源&#xff1a;kaggle&#xff0c;网址&#xff1a;https://www.kaggle.com/&#xff0c;点击进入网站&#xff0c;左侧选择Datasets。 进入后搜索栏搜索关键词bird。此时出现很多数据集可以选择&#xff0c;推荐选择第一个或者第三个。…...

Redis数据结构-List列表

1.List列表 列表类型适用于存储多个有序的字符串&#xff08;这里的有序指的是强调数据排列顺序的重要&#xff0c;不是升序降序的意思&#xff09;&#xff0c;列表中的每个字符串称为元素&#xff08;element&#xff09;&#xff0c;一个列表最多可以存储2^32-1个元素。在R…...

启动你的RocketMQ之旅(三)-Producer启动和发送流程(上)

前言&#xff1a; &#x1f44f;作者简介&#xff1a;我是笑霸final。 &#x1f4dd;个人主页&#xff1a; 笑霸final的主页2 &#x1f4d5;系列专栏&#xff1a;java专栏 &#x1f4e7;如果文章知识点有错误的地方&#xff0c;请指正&#xff01;和大家一起学习&#xff0c;一…...

Unity UGUI SuperScrollView介绍

先铺垫一下ScrollView Unity中常用的ScrollView 是 Unity 中的一个常见 UI 组件&#xff0c;主要用于创建可滚动的视图。当内容超过其显示区域时&#xff0c;ScrollView 可以让用户通过滚动查看全部内容。它通常包含一个显示区域和一个内容区域&#xff0c;内容区域可以超过显…...

pandas 数据透视表

数据的透视表 数据的透视表&#xff1a; 使用函数 pivot_table( ) # 引用pandas import pandas as pd # pivot_table 使用 pd.pivot_table(data,values,index,aggfunc,fill_value,columns)参数1:data DataFrame的源数据参数2:values 要进行聚合操作的列参数3:index 进行分组…...

【STM32安全性研究】STM32F103RCT6固件读取

最近从飞哥那买了个stm32固件提取器,效果很好。下面记录对某产品主控STM32F103RCT6固件的提取过程,说明提取时的注意事项。 注意本文的目的仅用于stm32安全性研究,不提供涉及产品本身的内容,包括固件、软件等。 stm32固件提取可参考论坛https://www.aisec.fraunhofer.de/en…...

塔子哥Python算法基础课

【入门题】【输入篇1】AB Problem 题目描述&#xff1a; 给定两个整数 A 和 B&#xff0c;请计算它们的和并输出结果。 输入&#xff1a; 输入包含一行&#xff0c;包含两个整数 A 和 B&#xff0c;以空格分隔。 输出&#xff1a; 输出一行&#xff0c;包含一个整数&#…...

C++ 内存管理:深入理解 new、malloc、delete 和 free

引言 在 C 中&#xff0c;内存管理是一个非常重要的主题。正确使用动态内存分配和释放工具&#xff08;如 new、malloc、delete 和 free&#xff09;可以避免内存泄漏和程序崩溃。本文将深入探讨这些工具的区别&#xff0c;并介绍池化计数技术。 1. new 与 malloc 在动态申请内…...

基于互联网协议的诊断通信(DoIP)

1、ISO 13400标准和其他汽车网络协议标准有何不同&#xff1f; ISO 13400 标准即 DoIP 协议标准&#xff0c;与其他常见汽车网络协议标准&#xff08;如 CAN、LIN、FlexRay 等&#xff09;有以下不同&#xff1a; 通信基础与适用场景 ISO 13400&#xff1a;基于互联网协议&a…...

Android15 am命令 APP安装流程

一. PM 安装命令 使用命令 pm install -r xxx.apk pm命令安装app 会触发PackageManagerShellCommand 中runInstall()方法 frameworks/base/services/core/java/com/android/server/pm/PackageManagerShellCommand.java1. onCommand 函数: public int onCommand(String cmd…...

SpringMVC学习(初识与复习Web程序的工作流程)(1)

目录 一、SpringMVC(框架)的简要概述。 &#xff08;1&#xff09;SpringMVC与Servlet。 &#xff08;2&#xff09;技术方向。 &#xff08;3&#xff09;最终学习目标。 二、Web程序的基本工作流程。 &#xff08;1&#xff09;工作流程。 <1>浏览器。前后端任务。 <…...