当前位置：首页 > news >正文

LangChain + llamaFactory + Qwen2-7b-VL 构建本地RAG问答系统

news 2026/6/1 6:35:41

单纯仅靠LLM会产生误导性的 “幻觉”，训练数据会过时，处理特定知识时效率不高，缺乏专业领域的深度洞察，同时在推理能力上也有所欠缺。

正是在这样的背景下，检索增强生成技术（Retrieval-Augmented Generation,RAG）应时而生，成为大模型时代的一大趋势。

RAG通过在语言模型生成答案之前，先从广泛的专业文档数据库中检索相关信息，然后利用这些专业信息来引导大模型生成的结果，极大地提升了内容的准确性和相关性。

RAG整体技术路线可分为3大块8个小点见图1，其中包含知识库构建、知识检索和知识问答。

参考连接：

langchain框架轻松实现本地RAG_langchain实现rag-CSDN博客

https://www.zhihu.com/question/652674711/answer/3617998488

https://zhuanlan.zhihu.com/p/695287607

https://zhuanlan.zhihu.com/p/692327769

1，Linux 安装llamaFactory

git clone https://github.com/hiyouga/LLaMA-Factory.git
conda create -n llama_factory python=3.10
conda activate llama_factory
cd LLaMA-Factory
pip install -e '.[torch,metrics]'

2, 安装Qwen2-7b-VL模型

pip install modelscope 
modelscope download --model Qwen/Qwen2-VL-7B-Instruct --local_dir ./Qwen2-VL-7B-Instruct

3，用llamaFactory启动Qwen2-7b-VL 【启动server端，端口8000】

# 启动黑框api
CUDA_VISIBLE_DEVICES=0 API_PORT=8000 llamafactory-cli api \--model_name_or_path /home/xxx/Qwen2-VL-7B-Instruct \--template qwen2_vl \--infer_backend huggingface \--trust_remote_code true# 后端运行，启动对话页面
nohup llamafactory-cli webchat \--model_name_or_path /home/xxx/Qwen2-VL-2B-Instruct \--template qwen2_vl \--infer_backend huggingface \--trust_remote_code true &

4, 安装Embedding库

modelscope download --model BAAI/bge-large-zh --local_dir ./bge-large-zh

5，自定义langchain Client代码【Client端，端口8000】;将搜集的文档放在目录langchain_dataset下

import os
from langchain_community.document_loaders import TextLoader
from langchain.prompts import ChatPromptTemplate
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import Chroma
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain.llms.base import LLM
from openai import OpenAI
import base64
from langchain.llms.utils import enforce_stop_tokens
from langchain_huggingface import HuggingFaceEmbeddings# 定义LLM模型
class MyGame(LLM):def __init__(self):super().__init__()print("construct MyGame")def _llm_type(self) -> str:return "MyGame"def encode_image(self, image_path):with open(image_path, "rb") as image_file:return base64.b64encode(image_file.read()).decode('utf-8')def mygame_completion(self, message):client = OpenAI(api_key="0",base_url="http://localhost:{}/v1".format(os.environ.get("API_PORT", 8000)),)response = client.chat.completions.create(model="gpt-4o-mini",messages=message,stream=False,temperature=0.1)return response.choices[0].message.contentdef _call(self, prompt, stop=None, image_path=None):if image_path is None:messages = [{"role": "user", "content": prompt}]else:base64_image = self.encode_image(image_path)messages = [{"role": "user","content": [{"type": "text","text": prompt},{"type": "image_url","image_url": {"url":f"data:image/jpeg;base64,{base64_image}"},}]}]response = self.mygame_completion(messages)if stop is not None:response = enforce_stop_tokens(response, stop)return responseBGE_MODEL_PATH = "/home/xxx/bge-large-zh"
root_dir = "./langchain_dataset"def extract_docs_from_directory(directory):docs = []  # 初始化文档列表for root, dirs, files in os.walk(directory):  # 遍历目录for file in files:file_path = os.path.join(root, file)  # 获取文件的完整路径try:loader = TextLoader(file_path)    # 创建TextLoader实例docs.extend(loader.load())        # 加载文件内容并追加到文档列表except Exception as e:print(f"Error loading file {file_path}: {e}")  # 捕获并打印加载错误return docsdocs = extract_docs_from_directory(root_dir)
text_splitter = RecursiveCharacterTextSplitter(chunk_size=150, chunk_overlap=20)
documents = text_splitter.split_documents(docs)
huggingface_bge_embedding = HuggingFaceEmbeddings(model_name=BGE_MODEL_PATH)
vectorstore = Chroma.from_documents(documents, huggingface_bge_embedding, persist_directory="./vectorstore")query="80cm是多少米."
result = vectorstore.similarity_search(query, k=3)for doc in result:print(doc.page_content)print("********")retriever = vectorstore.as_retriever()template = """Answer the question based only on the following context:{context}Question: {question},请用中文输出答案。
"""
prompt = ChatPromptTemplate.from_template(template)
llm = MyGame()def format_docs(docs):return "\n\n".join([d.page_content for d in docs])chain = ({"context": retriever | format_docs, "question": RunnablePassthrough()}| prompt| llm| StrOutputParser()
)response = chain.invoke(query)
print("RAG 输出结果:",response)print("LLM 输出结果：",llm(query))

6，图文测试代码

if __name__ == "__main__":llm = MyGame()     # 上面代码有定义print(llm("这张图里的是什么。", image_path="E:\code_llm_workspace\static\images\\xxx.jpeg"))

LangChain + llamaFactory + Qwen2-7b-VL 构建本地RAG问答系统

单纯仅靠LLM会产生误导性的 “幻觉”，训练数据会过时，处理特定知识时效率不高，缺乏专业领域的深度洞察，同时在推理能力上也有所欠缺。正是在这样的背景下，检索增强生成技术（Retrieval-Augmented Generati…...

编程日记 2025/1/24 6:20:21

【自然语言处理（NLP）】介绍、发展史

文章目录介绍发展史1. 规则驱动时期（20世纪50年代-80年代）技术特点标志性成果 2. 统计方法兴起（1990年代-2000年代）技术特点标志性成果 3. 神经网络复兴（2010年代初至今）技术特点标志性成果 4. 集成与应用…...

编程日记 2025/1/24 6:19:17

1.CSS的三大特性

css有三个非常重要的三个特性：层叠性、继承性、优先级 1.1 层叠性想通选择器给设置想听的样式，此时一个样式就会覆盖（层叠）另一个冲突的样式。层叠性主要是解决样式冲突的问题。 <!DOCTYPE html> <html lang"en&…...

编程日记 2025/1/24 6:18:16

【分布式日志篇】从工具选型到实战部署：全面解析日志采集与管理路径

网罗开发 （小红书、快手、视频号同名） 大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、Harmony OS、Java、Python等…...

编程日记 2025/1/24 6:17:15

基于springcloud汽车信息分析与可视化系统

基于Spring Cloud的汽车信息分析与可视化系统是一款旨在整合、分析汽车相关数据并以直观可视化方式呈现的应用系统。一、系统架构该系统基于先进的Spring Cloud架构构建，充分利用其分布式、微服务特性，确保系统具备高可用性、可扩展性和灵活性。Spri…...

编程日记 2025/1/24 6:16:13

TOGAF之架构标准规范-信息系统架构 | 数据架构

TOGAF是工业级的企业架构标准规范，信息系统架构阶段是由数据架构阶段以及应用架构阶段构成，本文主要描述信息系统架构阶段中的数据架构阶段。如上所示，信息系统架构（Information Systems Architectures）在TOGAF标准规…...

编程日记 2025/1/24 6:12:09

Databend x 沉浸式翻译 | 基于 Databend Cloud 构建高效低成本的业务数据分析体系

「沉浸式翻译」是一个非常流行的双语对照网页翻译扩展工具，用户可以用它来即时翻译外文网页、PDF 文档、ePub 电子书、字幕等。它不仅可以实现原文加译文实时双语对照显示，还支持 Google、OpenAI、DeepL、微软、Gemini、Claude 等数十家翻译平台服务的自…...

编程日记 2025/1/24 6:11:08

cuda是如何使用GPU并行运算的： 以一个函数为例： duplicateWithKeys << <(P 255) / 256, 256 >> > (P,geomState.means2D,geomState.depths,geomState.point_offsets,binningState.point_list_keys_unsorted,binningState.point_list_…...

编程日记 2025/1/24 6:10:07

「全网最细 + 实战源码案例」设计模式——抽象工厂模式

核心思想抽象工厂模式是一种创建型设计模式，它提供一个接口，用于创建一系列相关或互相依赖的对象，而无需指定它们的具体类。抽象工厂模式解决了产品族的问题，可以管理和创建一组相关的产品。结构 1. 抽象工厂定义创建一些列…...

编程日记 2025/1/24 6:09:06

领域驱动设计（DDD）四订单管理系统实践步骤

以下是基于领域驱动设计（DDD） 的订单管理系统实践步骤，系统功能主要包括订单的创建、更新、查询和状态管理，采用 Spring Boot 框架进行实现。 1. 需求分析订单管理系统的基本功能： 订单创建：用户下单创…...

编程日记 2025/1/24 6:08:05

leetcode 面试经典 150 题：简化路径

链接简化路径题序号71题型字符串解法栈难度中等熟练度✅✅✅ 题目给你一个字符串 path ，表示指向某一文件或目录的 Unix 风格绝对路径 （以 ‘/’ 开头），请你将其转化为更加简洁的规范路径。在 Unix 风格的文件系统中规则如下…...

编程日记 2025/1/24 6:07:04

基于 STM32 的智能农业温室控制系统设计

1. 引言随着农业现代化的发展，智能农业温室控制系统对于提高农作物产量和质量具有重要意义。该系统能够实时监测温室内的环境参数，如温度、湿度、光照强度和土壤湿度等，并根据这些参数自动调节温室设备，如通风扇、加热器、加湿器…...

编程日记 2025/1/24 6:03:00

【Spring Boot】掌握 Spring 事务：隔离级别与传播机制解读与应用

前言 🌟🌟本期讲解关于spring 事务传播机制介绍~~~ 🌈感兴趣的小伙伴看一看小编主页：GGBondlctrl-CSDN博客 🔥 你的点赞就是小编不断更新的最大动力 🎆那么废话…...

编程日记 2025/1/24 5:58:57

【Postgres_Python】使用python脚本将多个PG数据库合并为一个PG数据库

需要合并的多个PG数据库表个数和结构一致，这里提供一种思路，选择sql语句insert插入的方式进行，即将其他PG数据库的每个表内容插入到一个PG数据库中完成数据库合并示例代码说明： 选择一个数据库导出表结构为.sql文件&#xff08…...

编程日记 2025/1/24 5:57:56

Tailwind CSS v4.0 发布

Holy shit its actually done ！ 1 月 22 日，Tailwind CSS 正式发布了 4.0 版本，针对性能和灵活性进行了优化，重新构想了配置和定制体验，并充分利用了 Web 平台提供的最新进展。新的高性能引擎- 完整构建速度提高 5 …...

编程日记 2025/1/24 5:54:53

pandas基础：文件的读取和写入

文件的读取和写入读取csv文件 csv文件： name,age,city Alice,25,New York Bob,30,Los Angelesread_csv(filename) header：如何处理文件的第一行。header0将第一行作为列名，headerNone表示文件中没有列名，所有行都是数据。 im…...

编程日记 2025/1/24 5:52:50

【MySQL — 数据库增删改查操作】深入解析MySQL的create insert 操作

数据库CRUD操作 1 CRUD简介 CURD是对数据库中的记录进行基本的增删改查操作: 2. Create 新增语法 INSERT [INTO] table_name[(column [，column] ...)] VALUES(value_list)[，(value_list)] ... # value 后面的列的个数和类型，要和表结构匹配…...

编程日记 2025/1/24 5:50:48

每日OJ_牛客_小红的子串_滑动窗口+前缀和_C++_Java

目录牛客_小红的子串_滑动窗口前缀和题目解析 C代码 Java代码牛客_小红的子串_滑动窗口前缀和小红的子串描述： 小红拿到了一个长度为nnn的字符串，她准备选取一段子串，满足该子串中字母的种类数量在[l,r]之间。小红想知道&…...

编程日记 2025/1/24 5:49:47

HTTP 配置与应用（局域网）

想做一个自己学习的有关的csdn账号，努力奋斗......会更新我计算机网络实验课程的所有内容，还有其他的学习知识^_^，为自己巩固一下所学知识，下次更新HTTP 配置与应用（不同网段）。我是一个萌新小白&#xf…...

编程日记 2025/1/24 5:46:44

ultralytics 是什么？

ultralytics 是一个用于计算机视觉任务的 Python 库，专注于提供高效、易用的目标检测、实例分割和图像分类工具。它最著名的功能是实现 YOLO（You Only Look Once） 系列模型，特别是最新的 YOLOv8。 1. YOLO 是什么？ YO…...

编程日记 2025/1/24 5:45:43

告别沉浸式白屏！UniApp中iOS/Android底部安全区与顶部状态栏颜色自定义全攻略

告别沉浸式白屏！UniApp中iOS/Android底部安全区与顶部状态栏颜色自定义全攻略当开发者尝试在UniApp中实现沉浸式设计时，往往会遇到一个令人头疼的问题——默认的白色安全区和状态栏导致界面元素（如电池图标、信号强度）几乎不可见。…...

编程新知 2026/5/26 3:13:58

iPaaS 应用场景深度解析：从系统孤岛到数据自由流动的六大实战路径

写在前面一个企业的数字化程度越高，系统就越多。系统越多，集成问题就越严重。这不是假设，而是我们在服务客户过程中反复验证的结论——企业数字化转型的瓶颈，往往不在于"造新系统"，而在于"连老系统&q…...

编程新知 2026/5/26 2:25:34

论文创新点像挤牙膏？导师强推这几个AI论文平台

想写论文又快又好，关键是用对 AI 工具、走对流程——资深教授普遍推荐：千笔AI（中文全流程首选） 豆包学术版（轻量高效） DeepSeek 学术版（理工 / 长文本） Grammarly Academic&#xff…...

编程新知 2026/5/26 2:03:15

MBTI性格测试

简介 MBTI（Myers‑Briggs Type Indicator，迈尔斯‑布里格斯类型指标）是基于荣格心理类型理论发展出的性格类型工具，由凯瑟琳库克布里格斯及其女儿伊莎贝尔布里格斯迈尔斯创建。它通过四对偏好维度将个体的认知与行为倾向归纳为 16…...

编程新知 2026/5/26 1:09:00

打造XBEE封装BLE112蓝牙模块：硬件设计、射频布局与调试全攻略

1. 项目概述：为什么我们需要一个“XBEE格式”的蓝牙模块？在嵌入式开发和物联网项目中，无线通信模块的选择往往决定了项目的成败。对于很多工程师和创客来说，Silicon Labs（芯科科技）的BLE112/113模块是蓝牙4…...

编程新知 2026/5/25 21:17:35

抖音内容批量下载实战：从零开始构建个人视频资料库

抖音内容批量下载实战：从零开始构建个人视频资料库【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support.…...

编程新知 2026/5/25 19:54:57

别再瞎拖拽了！Unity Prefab从创建到批量修改的保姆级工作流（含变体与嵌套实战）

Unity Prefab高效工作流：从创建到批量修改的实战指南在Unity项目开发中，Prefab（预制体）是最基础也最强大的工具之一。但很多开发者，尤其是初学者，往往停留在简单的"拖拽-修改"阶段，没…...

编程新知 2026/5/25 18:50:50

基于Meshtastic构建LoRa Mesh网络：从硬件自制到传感器集成实战

1. 项目概述：构建一个灵活且易用的LoRa Mesh网络如果你对物联网、远程传感或者去中心化通信网络感兴趣，那么LoRa技术一定不会陌生。它以其超低功耗、超远距离和强大的抗干扰能力，成为了构建广域传感网络的理想选择。然而，传统的…...

编程新知 2026/5/25 17:19:40

智能体任务分配算法：从启发式到深度强化学习的演进与实践

1. 项目概述：从“谁来做”到“如何做得更好”的智能进化在机器人集群、无人机编队或是自动化仓储系统中，我们常常面临一个看似简单实则复杂的问题：眼前有一堆任务，手头有一群可用的智能体（机器人、无人机、服务器等&am…...

编程新知 2026/5/25 15:52:16

终极艾尔登法环存档迁移指南：3分钟学会角色无损转移

终极艾尔登法环存档迁移指南：3分钟学会角色无损转移【免费下载链接】EldenRingSaveCopier 项目地址: https://gitcode.com/gh_mirrors/el/EldenRingSaveCopier 还在为《艾尔登法环》存档迁移而烦恼吗？当游戏版本更新后，你辛辛苦苦培…...

编程新知 2026/5/25 15:34:51

LangChain + llamaFactory + Qwen2-7b-VL 构建本地RAG问答系统

相关文章：

LangChain + llamaFactory + Qwen2-7b-VL 构建本地RAG问答系统

【自然语言处理（NLP）】介绍、发展史

1.CSS的三大特性

【分布式日志篇】从工具选型到实战部署：全面解析日志采集与管理路径

基于springcloud汽车信息分析与可视化系统

TOGAF之架构标准规范-信息系统架构 | 数据架构

Databend x 沉浸式翻译 | 基于 Databend Cloud 构建高效低成本的业务数据分析体系

cuda的并行运算介绍

「全网最细 + 实战源码案例」设计模式——抽象工厂模式

领域驱动设计（DDD）四订单管理系统实践步骤

leetcode 面试经典 150 题：简化路径

基于 STM32 的智能农业温室控制系统设计

【Spring Boot】掌握 Spring 事务：隔离级别与传播机制解读与应用

【Postgres_Python】使用python脚本将多个PG数据库合并为一个PG数据库

Tailwind CSS v4.0 发布

pandas基础：文件的读取和写入

【MySQL — 数据库增删改查操作】深入解析MySQL的create insert 操作

每日OJ_牛客_小红的子串_滑动窗口+前缀和_C++_Java

HTTP 配置与应用（局域网）

ultralytics 是什么？

告别沉浸式白屏！UniApp中iOS/Android底部安全区与顶部状态栏颜色自定义全攻略

iPaaS 应用场景深度解析：从系统孤岛到数据自由流动的六大实战路径

论文创新点像挤牙膏？导师强推这几个AI论文平台

MBTI性格测试

打造XBEE封装BLE112蓝牙模块：硬件设计、射频布局与调试全攻略

抖音内容批量下载实战：从零开始构建个人视频资料库

别再瞎拖拽了！Unity Prefab从创建到批量修改的保姆级工作流（含变体与嵌套实战）

基于Meshtastic构建LoRa Mesh网络：从硬件自制到传感器集成实战

智能体任务分配算法：从启发式到深度强化学习的演进与实践

终极艾尔登法环存档迁移指南：3分钟学会角色无损转移