当前位置：首页 > article >正文

LangChian实现最小可运行的 RAG示例解析

article 2026/5/8 14:24:32

下面代码是一个可用的 LangChain 阿里云通义千问 RAG 最小示例。其逻辑非常清晰就是加载 → 切分 → 向量化 → 检索 → QA。https://item.jd.com/15261772.html# -*- coding: utf-8 -*- Created on Thu Jul 24 21:03:45 2025 author: liguo from langchain_community.document_loaders import TextLoader from langchain_community.indexes import VectorstoreIndexCreator from langchain_text_splitters import CharacterTextSplitter from langchain_community.embeddings import DashScopeEmbeddings # 替换 QwenEmbeddings from langchain_community.vectorstores import Chroma from langchain.chains import RetrievalQA from langchain_community.llms import Tongyi # Qwen import os # 设置阿里云 DashScope API Key必须 api_keyos.getenv(DASHSCOPE_API_KEY) # 替换为你自己的 API Key def basic_rag_flow(): # 1. 加载文档 —— 修复编码问题 loader TextLoader(example.txt, encodingutf-8) documents loader.load() # 2. 分割文档 text_splitter CharacterTextSplitter(chunk_size1000, chunk_overlap0) texts text_splitter.split_documents(documents) # 3. 创建嵌入和向量存储使用通义千问的 Embedding 模型 embeddings DashScopeEmbeddings( modeltext-embedding-v1, # 阿里云提供的嵌入模型 dashscope_api_keyos.environ[DASHSCOPE_API_KEY] ) vectorstore Chroma.from_documents(texts, embeddings) # 4. 构建检索器 retriever vectorstore.as_retriever() # 5. 创建RAG链使用通义千问大模型 llm Tongyi( model_nameqwen-max, # 也可以用 qwen-plus, qwen-turbo 等 api_keyapi_key, temperature0.1 ) qa_chain RetrievalQA.from_chain_type( llmllm, chain_typestuff, retrieverretriever, return_source_documentsTrue # 可选返回参考文档 ) # 6. 执行查询并输出结果 query 请总结文档的主要内容 result qa_chain.invoke({query: query}) # 注意新版推荐用 invoke print(问题, query) print(回答, result[result]) # 可选打印参考文档 # for doc in result[source_documents]: # print(参考文档片段, doc.page_content[:200], ...) return qa_chain # 调用函数以执行流程 if __name__ __main__: basic_rag_flow()下面我按模块按流程对你给出的代码做一次完整解析并明确说明这个示例到底在演示什么每一步解决了什么问题一、这个示例整体在演示什么✅这是一个“最小可运行的 RAG检索增强生成示例”它演示了如何用LangChain 阿里云通义千问Qwen 完成“基于本地文档内容回答问题”也就是本地文本文件⬇ 向量检索⬇ 大模型生成答案这正是RAG 的核心流程。二、RAG 的核心思想先看这个RAG Retrieval-Augmented Generation用户问题 ↓ 从文档中检索相关内容 ↓ 把相关内容交给大模型 ↓ 生成基于事实的回答✅ 目的减少大模型幻觉利用私有数据不依赖模型训练三、代码结构总览basic_rag_flow() ├─ 1. 加载文档 ├─ 2. 切分文档 ├─ 3. 向量化存入向量库 ├─ 4. 构建检索器 ├─ 5. 构建 RAG 问答链 └─ 6. 执行查询四、逐段代码解析✅ 1️⃣ 导入依赖基础设施from langchain_community.document_loaders import TextLoader from langchain_community.indexes import VectorstoreIndexCreator from langchain_text_splitters import CharacterTextSplitter from langchain_community.embeddings import DashScopeEmbeddings from langchain_community.vectorstores import Chroma from langchain.chains import RetrievalQA from langchain_community.llms import Tongyi 这些模块分别对应模块作用TextLoader读取本地文本CharacterTextSplitter文本切分成块DashScopeEmbeddings阿里云向量模型Chroma向量数据库RetrievalQARAG 问答链Tongyi通义千问 LLM✅ 2️⃣ 加载文档数据来源loader TextLoader(example.txt, encodingutf-8) documents loader.load() 这一步在做什么从本地加载example.txt返回一个Document对象列表每个 Document 包含page_content 文本内容 metadata {source: example.txt}✅ 这是RAG 的数据入口✅ 3️⃣ 文本切分非常关键text_splitter CharacterTextSplitter( chunk_size1000, chunk_overlap0 ) texts text_splitter.split_documents(documents) 为什么一定要切分Embedding 模型有长度限制向量检索更适合“小块语义”LLM 上下文有限切分后变成texts [ Document(...), Document(...), Document(...) ]每一段都是一个可独立检索的语义单元✅ 4️⃣ 向量化向量库检索基础embeddings DashScopeEmbeddings( modeltext-embedding-v1, dashscope_api_keyos.environ[DASHSCOPE_API_KEY] ) 这一步在做什么把文本 → 向量数字使用的是阿里云的text-embedding-v1vectorstore Chroma.from_documents(texts, embeddings) Chroma 做了什么把所有文本块存成向量建立索引支持相似度搜索✅ 到这里你已经拥有了一个“可检索的知识库”✅ 5️⃣ 构建检索器Retrieverretriever vectorstore.as_retriever() Retriever 的作用给定一个问题 → 返回最相关的文档片段等价于问题 → 向量化 → 相似度匹配 → Top-K 文档✅ 6️⃣ 构建 RAG 问答链核心llm Tongyi( model_nameqwen-max, api_keyapi_key, temperature0.1 ) LLM 负责理解问题阅读检索到的文档生成最终答案qa_chain RetrievalQA.from_chain_type( llmllm, chain_typestuff, retrieverretriever, return_source_documentsTrue )RetrievalQA做了什么自动完成这个流程用户输入问题 ↓ Retriever 找相关文档 ↓ 把问题和文档拼在一起 ↓ LLM 生成答案chain_typestuff的含义把所有检索到的文档直接塞进 prompt简单、直观适合文档不太长的场景✅ 7️⃣ 执行查询query 请总结文档的主要内容 result qa_chain.invoke({query: query}) 实际发生了什么问题 → embedding去 Chroma 里找相关内容拼接成类似这样的 prompt根据以下内容回答问题 [文档片段1] [文档片段2] 问题请总结文档的主要内容Qwen 生成答案五、这个示例“演示了什么能力”✅ 它不是一个玩具而是一个标准 RAG 模板展示了能力是否演示私有数据接入✅文本向量化✅向量检索✅大模型增强生成✅LangChain 标准用法✅阿里云通义千问集成✅六、一句话总结这个示例演示了如何使用 LangChain 阿里云 DashScope构建一个基于本地文档的检索增强生成RAG问答系统。

LangChian实现最小可运行的 RAG示例解析

相关文章：

LangChian实现最小可运行的 RAG示例解析

基于MCP协议构建Jira智能助手：连接AI与项目管理的实践指南

Clawbox：模块化爬虫框架的设计原理与工程实践

如何实现魔兽争霸3终极兼容性修复：WarcraftHelper完整技术指南

为内部知识问答系统集成Taotoken实现多模型答案融合

systemd Service 详细说明

Windows Cleaner：5步快速解决C盘爆红的免费系统优化工具

HarmonyOS 6学习：ContactsKit参数陷阱与401错误排查实战

如何在5分钟内完成Windows与Office永久激活：KMS智能激活终极指南

人们普遍认为跟风创业更容易成功，编程统计跟风项目与原创项目盈亏数据，小众冷门赛道创业成功率远超热门赛道。

传统认为考试分数越高综合能力越强，编程统计分数，社会实践，职场表现数据，卷面成绩无法衡量社会生存能力。

vCenter Server证书过期别慌！保姆级排查与修复指南（含STS证书检查脚本）

告别日志混乱：用Kiwi Syslog Daemon的Rules和Filters，给Linux/Windows服务器日志自动分类归档

抖音内容批量下载技术实现：基于开源工具的高效自动化方案

ZenlessZoneZero-OneDragon技术深度解析：数据驱动的自动化战斗引擎架构

如何高效构建金融数据API：AKShare实战指南与架构深度解析

FDA Data MCP：基于MCP协议为AI智能体构建监管数据接口的实践指南

Deno Deploy部署Azure OpenAI代理：零成本解决API兼容问题

基于MCP与Cloudflare Workers构建AI编程助手的长期记忆系统

OpenClaw安全工具箱：个人AI代理的实战安全防护指南

保姆级教程：在Linux上动手调试PCIe热插拔（基于pciehp驱动源码）

如何用Adafruit NeoPixel库点亮你的创意世界：从零开始掌握智能LED控制

AI写专著全攻略：从构思到完稿，工具助你搞定20万字专著！

抖音批量下载技术深度解析：如何通过智能调度系统解决内容获取效率瓶颈

RK3568平台上 rknn-Toolkit2 rknn build()函数介绍

ColabFold终极指南：5个步骤实现零基础蛋白质结构预测

告别命令行：用VNC+树莓派打造你的轻量级家庭服务器（Raspberry Pi OS Bullseye）

猫抓浏览器扩展：3分钟掌握网页媒体资源智能提取的终极指南

Arduino编程避坑指南：别再混淆 i++ 和 ++i 了，一个例子讲透运算符优先级

AKShare终极指南：如何用5行Python代码获取全市场金融数据？