当前位置：首页 > news >正文

1、开始简单使用rag

news 2026/5/16 6:55:39

文章目录

前言
数据存放
申请api
开始代码
- 安装依赖
- 从文件夹中读取文档
- 文档切块
- 将分割嵌入并存储在向量库中
- 检索部分代码
- 构造用户接口
- 演示提示
整体代码

前言

本章只是简单使用rag的一个示例，为了引出以后的学习，将整个rag的流程串起来

数据存放

一个示例的文件夹OneFlower下，存放了三种不同类型的文档：

申请api

本文档中使用的在线api为gpt4，所以需要先申请，如果是国内也可以按照文档使用glm：glm使用文档

开始代码

下面会对每一部分的代码进行说明

安装依赖

pip install langchain
pip install openai
pip install qdrant-client

从文件夹中读取文档

通过便利文件夹OneFlower下，找到所以文件，通过文件的后缀，使用不同的解析器，将解析后的文档存放到documents中

import os
os.environ["OPENAI_API_KEY"] = 'sk-openai的key'# 1.Load 导入Document Loaders
from langchain.document_loaders import PyPDFLoader
from langchain.document_loaders import Docx2txtLoader
from langchain.document_loaders import TextLoader# 加载Documents
documents = []
for file in os.listdir('OneFlower'): if file.endswith('.pdf'):pdf_path = './OneFlower/' + fileloader = PyPDFLoader(pdf_path)documents.extend(loader.load())elif file.endswith('.docx') or file.endswith('.doc'):doc_path = './OneFlower/' + fileloader = Docx2txtLoader(doc_path)documents.extend(loader.load())elif file.endswith('.txt'):text_path = './OneFlower/' + fileloader = TextLoader(text_path)documents.extend(loader.load())

文档切块

一大片的文档对检索是不友好的，我们需要按照小块进行切分，也就是chunk，每块的大小为200个字符（并且在api中对乱码进行了处理），块与块之间有10个长度的重叠，这种形式的切块使用RecursiveCharacterTextSplitter这个api来操作

# 2.Split 将Documents切分成块以便后续进行嵌入和向量存储
from langchain.text_splitter import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(chunk_size=200, chunk_overlap=10)
chunked_documents = text_splitter.split_documents(documents)

将分割嵌入并存储在向量库中

向量库我们使用的是Qdrant，当然还可以使用faiss或者chromedb都是可以的

# 3.Store 将分割嵌入并存储在矢量数据库Qdrant中
from langchain.vectorstores import Qdrant
from langchain.embeddings import OpenAIEmbeddings
vectorstore = Qdrant.from_documents(documents=chunked_documents, # 以分块的文档embedding=OpenAIEmbeddings(), # 用OpenAI的Embedding Model做嵌入location=":memory:",  # in-memory 存储collection_name="my_documents",) # 指定collection_name

检索部分代码

这个部分，我们主要狗见了一个大模型的检索，他接收的是vectorstore返回的检索，MultiQueryRetriever的意思是我们需要llm帮我们生成多个MultiQuery，比如：

“区块链如何运作？”
“区块链的核心技术是什么？”
“区块链的数据结构是如何设计的？”
然后MultiQueryRetriever 依次执行这些查询，并合并结果，最终返回更多相关的文档，提高召回率。

logging的引入，方便我们进行提问的输出

# 4. Retrieval 准备模型和Retrieval链
import logging # 导入Logging工具
from langchain.chat_models import ChatOpenAI # ChatOpenAI模型
from langchain.retrievers.multi_query import MultiQueryRetriever # MultiQueryRetriever工具
from langchain.chains import RetrievalQA # RetrievalQA链# 设置Logging
logging.basicConfig()
logging.getLogger('langchain.retrievers.multi_query').setLevel(logging.INFO)# 实例化一个大模型工具 - OpenAI的GPT-3.5
llm = ChatOpenAI(model_name="gpt-4o-mini", temperature=0)# 实例化一个MultiQueryRetriever
retriever_from_llm = MultiQueryRetriever.from_llm(retriever=vectorstore.as_retriever(), llm=llm)# 实例化一个RetrievalQA链
# qa_chain = RetrievalQA.from_chain_type(llm,retriever=vectorstore.as_retriever()) # 单个的问题
qa_chain = RetrievalQA.from_chain_type(llm,retriever=retriever_from_llm)

构造用户接口

输出一个input，让用户进行提问，只要不是exit就继续，ask_question是执行langchain的调用

# 5. 问答展示
def ask_question(query):# 使用RetrievalQA链来获取答案response = qa_chain(query)# 返回得到的答案return response# 为用户提供交互界面进行问答
while True:# 获取用户的问题user_query = input("请随意提问 (或者输入'exit'退出): ")# 如果用户输入"exit"，则退出循环if user_query.lower() == 'exit':break# 使用定义的函数获取答案，并打印answer = ask_question(user_query)print("答案:", answer)print("谢谢使用 QA 系统!")

演示提示

在这里插入图片描述

对应pdf文档中可以看到对应的内容

整体代码

整体代码如下，方便在PyCharm中直接运行

import os
os.environ["OPENAI_API_KEY"] = 'sk-openai的key'# 1.Load 导入Document Loaders
from langchain.document_loaders import PyPDFLoader
from langchain.document_loaders import Docx2txtLoader
from langchain.document_loaders import TextLoader# 加载Documents
documents = []
for file in os.listdir('OneFlower'): if file.endswith('.pdf'):pdf_path = './OneFlower/' + fileloader = PyPDFLoader(pdf_path)documents.extend(loader.load())elif file.endswith('.docx') or file.endswith('.doc'):doc_path = './OneFlower/' + fileloader = Docx2txtLoader(doc_path)documents.extend(loader.load())elif file.endswith('.txt'):text_path = './OneFlower/' + fileloader = TextLoader(text_path)documents.extend(loader.load())import os# 设置环境变量
os.environ['http_proxy'] = 'http://127.0.0.1:7890'
os.environ['https_proxy'] = 'http://127.0.0.1:7890'
os.environ['all_proxy'] = 'http://127.0.0.1:7890'# export HTTP_PROXY=http://127.0.0.1:7890; #换成你自己的代理地址
# export HTTPS_PROXY=http://127.0.0.1:7890; #换成你自己的代理地址
# export ALL_PROXY=socks5://127.0.0.1:7890#换成你自己的代理地址# 2.Split 将Documents切分成块以便后续进行嵌入和向量存储
from langchain.text_splitter import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(chunk_size=200, chunk_overlap=10)
chunked_documents = text_splitter.split_documents(documents)# 3.Store 将分割嵌入并存储在矢量数据库Qdrant中
from langchain.vectorstores import Qdrant
from langchain.embeddings import OpenAIEmbeddings
vectorstore = Qdrant.from_documents(documents=chunked_documents, # 以分块的文档embedding=OpenAIEmbeddings(), # 用OpenAI的Embedding Model做嵌入location=":memory:",  # in-memory 存储collection_name="my_documents",) # 指定collection_name# 4. Retrieval 准备模型和Retrieval链
import logging # 导入Logging工具
from langchain.chat_models import ChatOpenAI # ChatOpenAI模型
from langchain.retrievers.multi_query import MultiQueryRetriever # MultiQueryRetriever工具
from langchain.chains import RetrievalQA # RetrievalQA链# 设置Logging
logging.basicConfig()
logging.getLogger('langchain.retrievers.multi_query').setLevel(logging.INFO)# 实例化一个大模型工具 - OpenAI的GPT-3.5
llm = ChatOpenAI(model_name="gpt-4o-mini", temperature=0)# 实例化一个MultiQueryRetriever
retriever_from_llm = MultiQueryRetriever.from_llm(retriever=vectorstore.as_retriever(), llm=llm)# 实例化一个RetrievalQA链
# qa_chain = RetrievalQA.from_chain_type(llm,retriever=vectorstore.as_retriever())
qa_chain = RetrievalQA.from_chain_type(llm,retriever=retriever_from_llm)# 5. 问答展示
def ask_question(query):# 使用RetrievalQA链来获取答案response = qa_chain(query)# 返回得到的答案return response# 为用户提供交互界面进行问答
while True:# 获取用户的问题user_query = input("请随意提问 (或者输入'exit'退出): ")# 如果用户输入"exit"，则退出循环if user_query.lower() == 'exit':break# 使用定义的函数获取答案，并打印answer = ask_question(user_query)print("答案:", answer)print("谢谢使用 QA 系统!")

资源csdn链接：等待更新

1、开始简单使用rag

文章目录前言数据存放申请api开始代码安装依赖从文件夹中读取文档文档切块将分割嵌入并存储在向量库中检索部分代码构造用户接口演示提示整体代码前言本章只是简单使用rag的一个示例，为了引出以后的学习，将整个rag的流程串起来数据存放一个示例…...

编程日记 2025/1/31 10:14:45

Linux Samba 低版本漏洞（远程控制）复现与剖析

目录前言漏洞介绍漏洞原理产生条件漏洞影响防御措施复现过程结语前言在网络安全的复杂生态中，系统漏洞的探索与防范始终是保障数字世界安全稳定运行的关键所在。Linux Samba 作为一款在网络共享服务领域应用极为广泛的软件，其低版本中…...

编程日记 2025/1/31 10:12:40

安卓(android)实现注册界面【Android移动开发基础案例教程（第2版）黑马程序员】

一、实验目的（如果代码有错漏，可查看源码） 1.掌握LinearLayout、RelativeLayout、FrameLayout等布局的综合使用。 2.掌握ImageView、TextView、EditText、CheckBox、Button、RadioGroup、RadioButton、ListView、RecyclerView等控件在项目中的…...

编程日记 2025/1/31 10:05:25

【 AI agents】letta：2024年代理堆栈演进（中英文翻译）

The AI agents stack AI 代理堆栈 November 14, 2024 11月 14， 2024原文： The AI agents stack官方教程教程学习笔记：【memgpt】letta 课程1/2：从头实现一个自我编辑、记忆和多步骤推理的代理Understanding the AI agents landscape 了解 AI 代理环境 Although we see a …...

编程日记 2025/1/31 10:01:12

Java中 instanceof 的用法（详解）

目录引言基本语法基本作用 1. 检查对象是否是指定类的实例 2. 检查对象是否是子类的实例 3. 检查对象是否实现某个接口 4.null 处理错误分析： 5.综合对比示例最后总结注意事项引言 instanceof 概念在多态中引出，因为在多态发生时&…...

编程日记 2025/1/31 9:50:54

联想拯救者R720笔记本外接显示屏方法，显示屏是2K屏27英寸

晚上23点10分前下单，第二天上午显示屏送到，检查外包装没拆封过。这个屏幕左下方有几个按键，按一按就开屏幕、按一按就关闭屏幕，按一按方便节省时间，也支持阅读等模式。显示屏是 ：AOC 27英寸 2K高清 100Hz…...

编程日记 2025/1/31 9:49:42

【RocketMQ 存储】- 一文总结 RocketMQ 的存储结构-基础

文章目录 1. 前言本文章基于 RocketMQ 4.9.3 1. 前言 RocketMQ 存储部分系列文章： 【RocketMQ 存储】- RocketMQ存储类 MappedFile 【RocketMQ 存储】- 一文总结 RocketMQ 的存储结构-基础【RocketMQ 存储】- 一文总结 RocketMQ 的存储结构-基础...

编程日记 2025/1/31 9:46:34

S4 HANA明确税金本币和外币之间转换汇率确定(OBC8)

本文主要介绍在S4 HANA OP中明确明确税金本币和外币之间转换汇率确定(OBC8)相关设置。具体请参照如下内容： 明确税金本币和外币之间转换汇率确定(OBC8) 以上配置，我们可以根据不同公司代码所配置的使用不同的汇率来对税金外币和本币之间进行换算。来针对…...

编程日记 2025/1/31 9:42:17

Cocos Creator 3.8 2D 游戏开发知识点整理

目录 Cocos Creator 3.8 2D 游戏开发知识点整理 1. Cocos Creator 3.8 概述 2. 2D 游戏核心组件 (1) 节点（Node）与组件（Component） (2) 渲染组件 (3) UI 组件 3. 动画系统 (1) 传统帧动画 (2) 动画编辑器 (3) Spine 和 …...

编程日记 2025/1/31 9:38:11

梯度提升用于高效的分类与回归

使用决策树（Decision Tree） 实现梯度提升（Gradient Boosting） 主要是模拟 GBDT（Gradient Boosting Decision Trees） 的原理，即： 第一棵树拟合原始数据计算残差（负梯度…...

编程日记 2025/1/31 9:34:52

【单细胞第二节：单细胞示例数据分析-GSE218208】

GSE218208 1.创建Seurat对象 #untar(“GSE218208_RAW.tar”) rm(list ls()) a data.table::fread("GSM6736629_10x-PBMC-1_ds0.1974_CountMatrix.tsv.gz",data.table F) a[1:4,1:4] library(tidyverse) a$alias:gene str_split(a$alias:gene,":",si…...

编程日记 2025/1/31 9:29:33

设计模式 - 行为模式_Template Method Pattern模板方法模式在数据处理中的应用

文章目录概述1. 核心思想2. 结构3. 示例代码4. 优点5. 缺点6. 适用场景7. 案例：模板方法模式在数据处理中的应用案例背景UML搭建抽象基类 - 数据处理的 “总指挥”子类定制 - 适配不同供应商供应商 A 的数据处理器供应商 B 的数据处理器在业务代码中整合运用 8. 总…...

编程日记 2025/1/31 9:27:29

新春登蛇山：告别岁月，启航未来

大年初一，晨曦透过薄雾，温柔地洒在武汉的大街小巷。2025 年的蛇年春节，带着新春的喜气与希望悄然而至。我站在蛇山脚下，心中涌动着复杂的情感，因为今天，我不仅将与家人一起登山揽胜，更将在这一天…...

编程日记 2025/1/31 9:24:10

hive:基本数据类型,关于表和列语法

基本数据类型 Hive 的数据类型分为基本数据类型和复杂数据类型加粗的是常用数据类型 BOOLEAN出现ture和false外的其他值会变成NULL值没有number,decimal类似number 如果输入的数据不符合数据类型, 映射时会变成NULL, 但是数据本身并没有被修改创建表创建表的本质其实就是在…...

编程日记 2025/1/31 9:23:01

安装最小化的CentOS7后，执行yum命令报错Could not resolve host mirrorlist.centos.org；未知的错误

文章目录安装最小化的CentOS7后，执行yum命令报错"Could not resolve host: mirrorlist.centos.org; 未知的错误"错误解决方案： 安装最小化的CentOS7后，执行yum命令报错"Could not resolve host: mirrorlist.centos.org; 未知…...

编程日记 2025/1/31 9:17:48

图论——spfa判负环

负环图 G G G中存在一个回路，该回路边权之和为负数，称之为负环。 spfa求负环方法1:统计每个点入队次数, 如果某个点入队n次, 说明存在负环。证明：一个点入队n次，即被更新了n次。一个点每次被更新时所对应最短路的边数一定是…...

编程日记 2025/1/31 9:16:32

软件工程概论试题三

一、单选 1.需求确认主要检査五个方面的内容，其中那一项是为了保证文档中的需求不互相冲突(即不应该有相互矛盾的约束或者对同一个系统功能有不同的描述)。 A.现实性 B. 可验证性 C.一致性 D.正确性 E.完整性正答：C 2.下列开发方法中，( )不…...

编程日记 2025/1/31 9:15:30

21.3-启动流程、编码风格(了解) 第21章-FreeRTOS项目实战--基础知识之新建任务、启动流程、编码风格、系统配置文件组成和编码风格(了解)

21.3-启动流程、编码风格(了解) 启动流程第一种启动流程(我们就使用这个): 在main函数中将硬件初始化、RTOS系统初始化，同时创建所有任务，再启动RTOS调度器。第二种启动流程： 在main函数中将硬件初始化、RTOS系统初始化，只…...

编程日记 2025/1/31 9:14:28

未来无线技术的发展方向

未来无线技术的发展趋势呈现出多样化、融合化的特点，涵盖速度、覆盖范围、应用领域、频段利用、安全性等多个方面。这些趋势将深刻改变人们的生活和社会的运行方式。传输速度提升：Wi-Fi 技术迭代加快，如 Wi-Fi7 理论峰值速率达 46Gbps&#…...

编程日记 2025/1/31 9:13:20

Qt5离线安装包无法下载问题解决办法

想在电脑里装一个Qt，但是直接报错。果然还是有解决办法滴。 qt download from your ip is not allowed Qt5安装包下载办法方法一：简单直接，直接科学一下，不过违法行为咱不做，遵纪守法好公民（不过没办法阻…...

编程日记 2025/1/31 9:06:01

如何用4个步骤构建你的开源六轴机械臂：完整DIY指南

如何用4个步骤构建你的开源六轴机械臂：完整DIY指南【免费下载链接】Faze4-Robotic-arm All files for 6 axis robot arm with cycloidal gearboxes . 项目地址: https://gitcode.com/gh_mirrors/fa/Faze4-Robotic-arm Faze4-Robotic-arm是一个开源六轴机械臂…...

编程新知 2026/5/16 4:13:08

提示工程：从AI调教到结构化沟通的系统方法论

1. 项目概述：从“咒语”到“工程”的思维跃迁最近在GitHub上看到一个挺有意思的项目，叫“Hazrat-Ali9/Prompt-Engineering”。乍一看，这名字有点神秘，但点进去你会发现，它其实是一个关于“提示工程”的资源集合。这让我…...

编程新知 2026/5/16 3:47:18

思源宋体CN终极指南：7种字重免费商用中文字体快速上手完整教程

思源宋体CN终极指南：7种字重免费商用中文字体快速上手完整教程【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 还在为商业项目中文字体版权问题而烦恼吗？思源宋…...

编程新知 2026/5/16 2:52:46