当前位置: 首页 > article >正文

基于LangChain的RAG与Agent智能体开发 - 向量存储与向量检索,以及RAG增强检索实现

大家好我是小锋老师最近更新《2027版 基于LangChain的RAG与Agent智能体 开发视频教程》专辑感谢大家支持。本课程主要介绍和讲解RAGLangChain简介接入通义千万大模型 Ollama简介以及安装和使用OpenAI 库介绍和使用以及最重要的基于LangChain实现RAG与Agent智能体开发技术。视频教程课件源码打包下载 链接https://pan.baidu.com/s/1_NzaNr0Wln6kv1rdiQnUTg提取码0000基于LangChain的RAG与Agent智能体开发 - 向量存储与向量检索以及RAG增强检索实现今天我们使用LangChain实现向量存储和相似性检索为下一个RAG与Agent企业知识库项目实战做一些知识准备。上图展示了基于 LangChain 实现的向量存储与相似性检索工作流核心分为 *索引阶段存储和查询阶段检索 两部分索引阶段存储把文档变成向量并存库 输入原始的 文档Documents 文本数据。 处理通过嵌入模型Embedding model将文档文本转换为嵌入向量Embedding vectors—— 这是一种高维数值向量用来编码文本的语义信息。 存储生成的嵌入向量会被存入向量数据库Vector stores完成数据的索引与持久化。查询阶段检索用问题去匹配最相似的文档 输入用户的查询文本Query text也就是问题或检索需求。 处理同样通过嵌入模型Embedding model将查询文本转换为查询向量Query vector保证和文档向量的编码规则一致。 匹配执行相似性搜索Similarity Search将查询向量与向量数据库中所有文档向量做语义相似度计算。 输出返回Top-k 结果Top-k results即与查询语义最相似的 k 条文档片段。 整体逻辑 这是 检索增强生成RAG的核心流程先把知识库文档向量化存储再在用户提问时将问题向量化通过相似度匹配找到最相关的文档片段为后续生成准确回答提供依据。基于LangChain实现向量存储与检索Chroma 是一个轻量级的开源向量数据库专门用于存储和检索嵌入向量。它易于本地部署支持内存模式和持久化存储非常适合与 LangChain 结合构建基于检索的应用程序如 RAG、语义搜索等。LangChain 提供了对 Chroma 的封装通过langchain_chroma包可以方便地将 Chroma 作为向量存储VectorStore使用。本文将介绍其基本用法并给出完整的示例代码。我们在LangChain中调用Chroma的话要安装下依赖库 langchain_chromapip install langchain_chroma -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn我们看一个langchain实现向量存储删除查询以及相似性搜索的实例from langchain_chroma import Chroma from langchain_community.document_loaders import CSVLoader from langchain_community.embeddings import DashScopeEmbeddings ​ # 创建 Chroma 向量数据库 chromadb Chroma( persist_directory./chroma_db, # 持久化目录 embedding_functionDashScopeEmbeddings(), # 嵌入模型 collection_namelangchain_docs, # 指定集合名称类似以前数据库的表名 ) ​ # 创建CSV加载器 loader CSVLoader( file_path../data/知识库.csv, # 文件路径 encodingutf-8, # 文件编码 ) ​ # 加载数据 documents loader.load() print(documents) print([id_ str(doc.metadata[row] 1) for doc in documents]) ​ # 添加文档到向量数据库 chromadb.add_documents( documentsdocuments, # 文档列表 ids[id_ str(doc.metadata[row] 1) for doc in documents] ) ​ # # 查询所有文档 # docs chromadb.get() # print(docs) # # # 删除文档 # chromadb.delete([id_1, id_2]) # # # 查询所有文档 # docs chromadb.get() # print(docs) ​ # 查询 query 什么是向量数据库 # 相似性搜索 result chromadb.similarity_search( queryquery, # 查询内容 k2, # 返回结果数量 filter{source: ../data/知识库.csv}, ) print(result)运行结果[Document(metadata{source: ../data/知识库.csv, row: 0}, page_content知识信息: LangChain 是一个用于开发 LLM 应用的框架。), Document(metadata{source: ../data/知识库.csv, row: 1}, page_content知识信息: Chroma 是一个开源的向量数据库。), Document(metadata{source: ../data/知识库.csv, row: 2}, page_content知识信息: 向量存储可以将文本转换为向量并快速检索相似内容。)] [id_1, id_2, id_3] [Document(idid_3, metadata{row: 2, source: ../data/知识库.csv}, page_content知识信息: 向量存储可以将文本转换为向量并快速检索相似内容。), Document(idid_2, metadata{row: 1, source: ../data/知识库.csv}, page_content知识信息: Chroma 是一个开源的向量数据库。)]基于LangChain的RetrievalQA实现RAG增强检索RAG检索增强生成是一种将信息检索与语言生成相结合的技术架构。它的核心思想是在让大语言模型LLM回答问题之前先从外部知识库中检索与问题相关的信息然后将这些信息作为“上下文”连同问题一起交给模型从而生成更准确、更符合事实的答案。RAG工作流程三个核心步骤检索Retrieve将用户问题转换为向量从向量数据库中检索最相似的文档片段增强Augment将检索到的文档片段与原始问题组合成一个增强的提示词生成Generate将增强后的提示词交给LLM生成最终答案我们使用RetrievalQA来实现RAGRetrievalQA是 LangChain 中专门用于构建检索增强生成RAG问答系统的链。它通过将信息检索与大语言模型生成相结合使模型能够基于外部知识库回答事实性问题有效解决模型知识滞后和幻觉问题。核心功能输入用户问题query工作流程使用检索器从向量数据库或文档索引中获取与问题最相关的文档片段将这些文档片段作为上下文与原始问题一起组合成提示将提示交给大语言模型生成最终答案输出答案result并可选择返回检索到的源文档source_documents核心组件组件说明检索器Retriever负责从文档存储中检索相关片段如VectorStoreRetriever大语言模型LLM负责生成答案如ChatOpenAI、ChatAnthropic等提示模板Prompt定义如何将上下文和问题组合成模型输入可选可使用默认模板我们看下一个具体示例from langchain_chroma import Chroma from langchain_classic.chains.retrieval_qa.base import RetrievalQA from langchain_community.document_loaders import CSVLoader from langchain_community.embeddings import DashScopeEmbeddings from langchain_community.llms.tongyi import Tongyi from langchain_core.prompts import PromptTemplate ​ # 创建 Chroma 向量数据库 chromadb Chroma( persist_directory./chroma_db2, # 持久化目录 embedding_functionDashScopeEmbeddings(), # 嵌入模型 collection_namelangchain_rag, # 指定集合名称类似以前数据库的表名 ) ​ # 创建CSV加载器 loader CSVLoader( file_path../data/知识库.csv, # 文件路径 encodingutf-8, # 文件编码 ) ​ # 加载数据 documents loader.load() print(documents) print([id_ str(doc.metadata[row] 1) for doc in documents]) ​ # 添加文档到向量数据库 chromadb.add_documents( documentsdocuments, # 文档列表 ids[id_ str(doc.metadata[row] 1) for doc in documents] ) ​ # 设置检索器 retriever chromadb.as_retriever( search_kwargs{k: 2} # 检索最相关的3个文档块 ) ​ # 定义提示词模板 prompt_template 基于以下已知信息请回答用户的问题。 如果无法从已知信息中找到答案请说根据现有资料无法回答这个问题不要编造。 ​ 已知信息 {context} ​ 问题{question} ​ 请回答 ​ prompt PromptTemplate( templateprompt_template, input_variables[context, question] ) ​ # 创建模型 model Tongyi(modelqwen-plus) ​ # 创建检索式问答链 qa_chain RetrievalQA.from_chain_type( llmmodel, # 模型 chain_typestuff, # 将所有检索到的文档一次性放入上下文 retrieverretriever, # 检索器 chain_type_kwargs{prompt: prompt}, return_source_documentsTrue # 返回来源文档便于追溯 ) ​ ​ # 提问 def ask_question(query): print(f\n问题{query}) result qa_chain.invoke({query: query}) print(f答案{result[result]}) print(参考来源) for doc in result[source_documents]: print(f - {doc.page_content[:50]}...) return result ​ ​ ask_question(什么是向量数据库) ask_question(什么是RAG)运行结果问题什么是向量数据库 答案向量数据库是一种专门用于存储、索引和检索高维向量如嵌入向量的数据库系统。它支持基于向量相似度的高效语义搜索例如查找与给定向量在语义上最接近的其他向量。Chroma 就是一个典型的向量数据库用于存储和检索文本的嵌入向量。 参考来源 - 知识信息: 嵌入向量是将文本转换为数字向量表示用于语义搜索。... - 知识信息: Chroma 是一个向量数据库用于存储和检索文本向量。... ​ 问题什么是RAG 答案RAG 是一种结合检索和生成的技术用于增强问答的准确性。 参考来源 - 知识信息: RAG 是一种结合检索和生成的技术用于增强问答的准确性。... - 知识信息: LangChain 是一个框架可以帮助你快速构建 LLM 应用。...

相关文章:

基于LangChain的RAG与Agent智能体开发 - 向量存储与向量检索,以及RAG增强检索实现

大家好,我是小锋老师,最近更新《2027版 基于LangChain的RAG与Agent智能体 开发视频教程》专辑,感谢大家支持。本课程主要介绍和讲解RAG,LangChain简介,接入通义千万大模型 ,Ollama简介以及安装和使…...

深入解析Host头攻击:原理、危害与防御策略

1. Host头攻击的基本原理 HTTP协议中的Host头字段就像快递单上的收件人地址。当你在浏览器输入www.example.com时,浏览器会在HTTP请求头部自动添加一行Host: www.example.com,告诉服务器你想访问哪个网站。这个设计本是为了让一台服务器能托管多个网站&a…...

Wave-U-Net:革新音频分离技术的端到端深度学习解决方案

Wave-U-Net:革新音频分离技术的端到端深度学习解决方案 【免费下载链接】Wave-U-Net Implementation of the Wave-U-Net for audio source separation 项目地址: https://gitcode.com/gh_mirrors/wa/Wave-U-Net 在数字音频处理领域,从混合音频中精…...

5G技术解析:深入理解5GNR帧结构与空口资源分配

1. 5GNR帧结构的设计原理 第一次接触5GNR帧结构时,我被那些密密麻麻的时隙和符号搞得头晕眼花。但真正理解后才发现,这套设计就像乐高积木一样精巧。5GNR帧结构延续了4G LTE的10ms帧和1ms子帧设计,但玩出了更多花样。 最关键的改变在于时隙灵…...

Nginx 安装部署

Yum在线安装部署 Nginx- 记录常用服务的版本:1.22.1- 选用稳定版本,上一个稳定版本1)配置 yum 源[rootweb01 ~]# vim /etc/yum.repos.d/nginx.repo[nginx-stable]namenginx stable repobaseurlhttp://nginx.org/packages/centos/$releasever/…...

宇树一年赚6亿背后:研发投入不足1亿,7成人形机器人卖给高校

文章目录前言一、这不是科技公司,这是"高校特供"的硬体印钞机二、七成卖给高校:科研界的"乐高积木"三、研发费用不到1亿:极致省钱的"小脑"路线四、42亿募资背后的焦虑:要补"大脑"短板了五…...

别再只调包了!用Sentence-Transformers从零训练你的专属Embedding模型(附完整代码)

从零构建领域专属Embedding模型:超越调包侠的实战指南 当你第一次调用model.encode("你的文本")就能获得一个语义向量时,是否好奇过这个黑箱背后的魔法?在电商推荐、智能客服等垂直场景中,通用Embedding模型的表现往往差…...

三步搞定全网资源下载:揭秘智能嗅探工具如何让你轻松捕获视频与图片

三步搞定全网资源下载:揭秘智能嗅探工具如何让你轻松捕获视频与图片 【免费下载链接】res-downloader 资源下载器、网络资源嗅探,支持微信视频号下载、网页抖音无水印下载、网页快手无水印视频下载、酷狗音乐下载等网络资源拦截下载! 项目地址: https:…...

概率预测实战 —— DeepAR 模型在电力负荷预测中的应用

1. 为什么电力行业需要概率预测? 想象一下你正在规划下周的家庭用电。如果只知道"大概会用100度电",和知道"90%概率在95-105度之间",哪种信息更有价值?这就是电力负荷预测从点预测升级到概率预测的核心价值。…...

FastbootEnhance:Windows上最直观的Fastboot工具箱与Payload提取器

FastbootEnhance:Windows上最直观的Fastboot工具箱与Payload提取器 【免费下载链接】FastbootEnhance A user-friendly Fastboot ToolBox & Payload Dumper for Windows 项目地址: https://gitcode.com/gh_mirrors/fa/FastbootEnhance 还在为复杂的Fastb…...

用Verilog在FPGA上实现一个真实的十字路口红绿灯(附完整代码与仿真)

从零构建FPGA十字路口交通灯控制系统:Verilog实战指南 十字路口交通灯控制是数字逻辑设计的经典案例,也是FPGA初学者从理论迈向实践的重要一步。本文将带你完整实现一个基于Xilinx Basys3开发板的交通灯控制系统,涵盖状态机设计、时序约束、仿…...

开源密码测试工具ArchivePasswordTestTool:从加密困境到文件解锁的完整方案

开源密码测试工具ArchivePasswordTestTool:从加密困境到文件解锁的完整方案 【免费下载链接】ArchivePasswordTestTool 利用7zip测试压缩包的功能 对加密压缩包进行自动化测试密码 项目地址: https://gitcode.com/gh_mirrors/ar/ArchivePasswordTestTool 问题…...

嵌入式开发中回调函数的解耦实践与高级应用

1. 回调函数在嵌入式开发中的解耦实践在嵌入式系统开发中,模块间的耦合度直接影响着代码的可维护性和可扩展性。最近我在重构一个智能家居项目时,就遇到了模块间强耦合导致修改困难的问题。通过引入回调函数机制,成功将原本紧密交织的代码逻辑…...

开源工具Lenovo Legion Toolkit:游戏本性能管理的轻量化创新方案

开源工具Lenovo Legion Toolkit:游戏本性能管理的轻量化创新方案 【免费下载链接】LenovoLegionToolkit Lightweight Lenovo Vantage and Hotkeys replacement for Lenovo Legion laptops. 项目地址: https://gitcode.com/gh_mirrors/le/LenovoLegionToolkit …...

HS6621CG低功耗调试实战:从5uA到50uA,我踩过的那些坑(附sysdump日志分析)

HS6621CG低功耗调试实战:从5uA到50uA的排查指南 当你的HS6621CG蓝牙芯片功耗从理想的5uA飙升到50uA时,那种感觉就像看着手机电量在眼前飞速下降。作为一款主打低功耗的蓝牙SoC,HS6621CG在实际应用中却常常因为各种隐蔽问题导致功耗异常。本文…...

check-dev-env - 开发环境依赖检测技能

check-dev-env - 开发环境依赖检测技能 技能概述 check-dev-env 是一个用于自动检查开发环境中常见依赖项是否已安装的 AI Agent 技能。该技能能够快速验证 Java、Maven、Node.js、NPM、Go、Python、Git 等主流开发工具的安装状态和版本号。 📋 元信息 项目说明技…...

Vivo Xplay6专用降级刷机工具AFTool|支持1.15.1/1.16.6/1.16.14等多版本线刷|含教程+驱动+工具包

温馨提示:文末有联系方式【适用机型精准说明】 本工具包专为Vivo Xplay6(型号V317A/V317K)深度适配,非Xplay6机型(含其他Vivo手机)请勿购买——不同机型Bootloader锁机制与分区结构差异极大,强行…...

5个宝可梦ROM定制技巧:pk3DS开源工具打造个性化游戏体验

5个宝可梦ROM定制技巧:pk3DS开源工具打造个性化游戏体验 【免费下载链接】pk3DS Pokmon (3DS) ROM Editor & Randomizer 项目地址: https://gitcode.com/gh_mirrors/pk/pk3DS 宝可梦游戏的重复游玩体验一直是玩家面临的核心挑战,如何通过技术…...

【LangGraph】 官方demo调整为本地大模型实现

官网文档链接: https://docs.langchain.com/oss/python/langgraph/quickstart#full-code-example 样例代码: # 第一步:定义工具与大模型 # 导入LangChain工具装饰器,用于将普通函数封装为Agent可调用的工具 from langchain.tool…...

JIT 与 AOT 编译区别

注:本文为 “JIT 与 AOT ” 相关合辑。 英文引文,机翻未校。 中文引文,未整理去重。 图片清晰度受引文原图所限。 如有内容异常,请看原文。 JIT 与 AOT 区别 1 基本概念与典型实例 JIT (Just-In-Time):即时编译&#…...

下载**Qwen3.5-35B-A3B**的GGUF格式文件

要下载Qwen3.5-35B-A3B的GGUF格式文件,可通过Hugging Face(国际主流)或ModelScope(国内镜像)平台获取,以下是具体步骤和注意事项: 一、核心下载地址 Qwen3.5-35B-A3B的GGUF文件主要由Unsloth团队…...

CODESYS开发教程7-变量作用域与存储类型实战解析

1. 变量作用域:从菜市场到保险箱的生动比喻 刚接触CODESYS开发时,我总被各种变量作用域搞得晕头转向。直到有天去菜市场买菜,突然发现变量作用域和菜市场的摊位布局简直一模一样!全局变量就像菜市场入口处的公共电子屏&#xff0c…...

从PMOS、NMOS到CMOS:揭秘现代芯片的互补设计哲学

1. 从PMOS与NMOS的相爱相杀说起 我第一次接触MOSFET晶体管是在大学实验室里,当时对着示波器上那些跳动的波形百思不得其解。教授指着电路板说:"记住,PMOS和NMOS就像电路世界的阴阳两极。"这句话让我花了整整三年时间才真正理解。 P…...

维普检测升级被卡延毕?2026论文降AI急救包:4招人工微调SOP与5大工具硬核横评

论文初稿快要交了,维普却突然搞了个大动作,把系统给升级了。说实话,这事真挺让人头疼的,有人前两天查还是绿的,以为稳了,结果升级完再一测,AI率直接飙红。 但别慌,也别怀疑自己是不…...

LVM命令大全

以下是 Linux LVM(逻辑卷管理)的核心命令分类详解及常用操作示例,结合最新技术网页整理而成:一、物理卷(PV)管理命令功能关键参数示例pvcreate初始化物理设备为PV-f(强制)-u&#xf…...

I2C协议详解:从基础原理到工程实践

1. I2C协议基础与核心设计思想I2C(Inter-Integrated Circuit)总线是Philips公司(现NXP)在1980年代开发的一种同步、半双工串行通信协议。作为嵌入式系统中最常用的总线之一,I2C以其简洁的两线制(SDA数据线S…...

3分钟上手:ControlNet-v1-1_fp16_safetensors让你的AI绘画更精准可控 [特殊字符]

3分钟上手:ControlNet-v1-1_fp16_safetensors让你的AI绘画更精准可控 🎨 【免费下载链接】ControlNet-v1-1_fp16_safetensors 项目地址: https://ai.gitcode.com/hf_mirrors/comfyanonymous/ControlNet-v1-1_fp16_safetensors ControlNet-v1-1_f…...

Polars 2.0大规模清洗性能翻倍的7个底层优化技巧:基于真实金融风控流水线压测数据

第一章:Polars 2.0大规模数据清洗性能跃迁的工程意义Polars 2.0 的发布标志着 Rust 原生 DataFrame 库在工程落地层面实现关键突破——其基于 Arrow 2.0 和全新查询优化器(QOv2)重构的执行引擎,将典型 ETL 清洗任务的吞吐量提升达…...

Java函数计算部署实战:从本地调试到生产环境上线的7个关键步骤(含阿里云/华为云/AWS对比)

第一章:Java函数计算部署全景概览Java函数计算是云原生场景下轻量级、事件驱动型服务的重要实现方式。它将传统Java应用的部署范式从虚拟机/容器迁移至按需执行、自动扩缩的无服务器架构,显著降低运维复杂度与资源闲置成本。开发者只需聚焦业务逻辑&…...

提升90% UI开发效率:psd2fgui工具从设计到实现的全流程指南

提升90% UI开发效率:psd2fgui工具从设计到实现的全流程指南 【免费下载链接】psd2fgui A tool for converting psd file to fairygui package. 项目地址: https://gitcode.com/gh_mirrors/ps/psd2fgui 一、核心价值:为什么选择psd2fgui&#xff1…...