当前位置：首页 > news >正文

FastGPT 源码：如何实现 “问题优化“

news 2025/11/10 7:57:14

文章目录

- FastGPT 源码：如何实现 "问题优化"
- - 一、前言
  - 二、源码分析
  - - 2.1 queryExtension.ts 提示词
    - 2.2 queryExtension.ts 核心逻辑
    - 2.3 queryExtension 引用位置
  - 三、流程总结

FastGPT 源码：如何实现 “问题优化”

一、前言

问题优化的背景和目的

在 RAG (检索增强生成) 系统中，用户的问题需要去数据库中执行向量搜索来找到相关内容
但在连续对话中，用户的后续问题往往是不完整的，比如"第二点是什么"这样的问题
如果直接用这样的问题去搜索，由于缺乏上下文，很难找到相关内容
因此需要问题优化模块来补全用户的问题，使其变得完整和明确

核心实现方式
FastGPT 主要通过 queryExtension 函数来实现问题优化，核心代码在 packages/service/core/ai/functions/queryExtension.ts 中：

输入参数包括：
- chatBg: 对话背景
- query: 用户当前问题
- histories: 历史对话记录
- model: 使用的模型
实现流程：
1. 构建提示词模板，包含示例和要求
2. 结合历史记录和当前问题生成完整的提示词
3. 调用 AI 模型生成多个检索词
4. 返回原始问题和扩展后的问题列表

提示词设计
FastGPT 使用了精心设计的提示词模板来引导 AI 模型生成高质量的检索词：

const defaultPrompt = `作为一个向量检索助手，你的任务是结合历史记录，从不同角度，为"原问题"生成个不同版本的"检索词"，从而提高向量检索的语义丰富度，提高向量检索的精度。生成的问题要求指向对象清晰明确，并与"原问题语言相同"。`;

实际效果

原问题：“第二点是什么”
历史记录中包含了 “FastGPT 的优势” 的上下文
优化后的检索词会变成：
- “介绍下 FastGPT 简便的优势”
- “FastGPT 为什么使用起来简便？”
- “FastGPT的有哪些简便的功能？”

搜索结果处理
优化后的问题会用于知识库搜索，搜索结果还会经过重排序（ReRank）来进一步提高相关性：

const reRankSearchResult = async ({data,query
}: {data: SearchDataResponseItemType[];query: string;
}) => {// 使用 rerank 模型对搜索结果重新排序const results = await reRankRecall({query,documents: data.map((item) => ({id: item.id,text: `${item.q}\n${item.a}`}))});
};

这样的问题优化机制确保了即使在用户提出不完整或指代性问题时，系统也能准确理解用户意图并找到相关的知识库内容。

二、源码分析

2.1 queryExtension.ts 提示词

作为一个向量检索助手，你的任务是结合历史记录，从不同角度，为“原问题”生成个不同版本的“检索词”，从而提高向量检索的语义丰富度，提高向量检索的精度。生成的问题要求指向对象清晰明确，并与“原问题语言相同”。例如：
历史记录: 
"""
"""
原问题: 介绍下剧情。
检索词: ["介绍下故事的背景和主要人物。","故事的主题是什么？","剧情是是如何发展的？"]
----------------
历史记录: 
"""
Q: 对话背景。
A: 当前对话是关于 Nginx 的介绍和使用等。
"""
原问题: 怎么下载
检索词: ["Nginx 如何下载？","下载 Nginx 需要什么条件？","有哪些渠道可以下载 Nginx？"]
----------------
历史记录: 
"""
Q: 对话背景。
A: 当前对话是关于 Nginx 的介绍和使用等。
Q: 报错 "no connection"
A: 报错"no connection"可能是因为……
"""
原问题: 怎么解决
检索词: ["Nginx报错"no connection"如何解决？","造成'no connection'报错的原因。","Nginx提示'no connection'，要怎么办？"]
----------------
历史记录: 
"""
Q: 护产假多少天?
A: 护产假的天数根据员工所在的城市而定。请提供您所在的城市，以便我回答您的问题。
"""
原问题: 沈阳
检索词: ["沈阳的护产假多少天？"]
----------------
历史记录: 
"""
Q: 作者是谁？
A: FastGPT 的作者是 labring。
"""
原问题: Tell me about him
检索词: ["Introduce labring, the author of FastGPT." ," Background information on author labring." "," Why does labring do FastGPT?"]
----------------
历史记录:
"""
Q: 对话背景。
A: 关于 FatGPT 的介绍和使用等问题。
"""
原问题: 你好。
检索词: ["你好"]
----------------
历史记录:
"""
Q: FastGPT 如何收费？
A: FastGPT 收费可以参考……
"""
原问题: 你知道 laf 么？
检索词: ["laf是什么？","如何使用laf？","laf的介绍。"]
----------------
历史记录:
"""
Q: FastGPT 的优势
A: 1. 开源2. 简便3. 扩展性强
"""
原问题: 介绍下第2点。
检索词: ["介绍下 FastGPT 简便的优势", "FastGPT 为什么使用起来简便？","FastGPT的有哪些简便的功能？"]。
----------------
历史记录:
"""
Q: 什么是 FastGPT？
A: FastGPT 是一个 RAG 平台。
Q: 什么是 Laf？
A: Laf 是一个云函数开发平台。
"""
原问题: 它们有什么关系？
检索词: ["FastGPT和Laf有什么关系？","FastGPT的RAG是用Laf实现的么？"]
----------------
历史记录:
"""
{{histories}}
"""
原问题: {{query}}
检索词: `

2.2 queryExtension.ts 核心逻辑

好的,我来帮您逐行分析 queryExtension.ts 的代码实现:

导入依赖

import { replaceVariable } from '@fastgpt/global/common/string/tools';  // 用于替换字符串中的变量
import { getAIApi } from '../config';  // 获取 AI API 配置
import { ChatItemType } from '@fastgpt/global/core/chat/type';  // 聊天项类型定义
import { countGptMessagesTokens } from '@fastgpt/global/common/string/tiktoken';  // 计算 token 数量
import { ChatCompletionMessageParam } from '@fastgpt/global/core/ai/type';  // OpenAI 聊天参数类型
import { chatValue2RuntimePrompt } from '@fastgpt/global/core/chat/adapt';  // 聊天内容转换为运行时提示词

提示词模板定义

const defaultPrompt = `作为一个向量检索助手...`;

这是一个很长的提示词模板,包含了多个示例。每个示例都遵循相同的格式:

历史记录: 展示对话上下文
原问题: 用户当前的问题
检索词: 生成的扩展问题数组

主函数定义

export const queryExtension = async ({chatBg,         // 对话背景query,          // 用户当前问题histories = [], // 历史对话记录model          // 使用的模型
}) => {

构建系统提示词

const systemFewShot = chatBg? `Q: 对话背景。
A: ${chatBg}
`: '';

如果有对话背景,则添加到提示词中

构建历史对话

const historyFewShot = histories.map((item) => {const role = item.obj === 'Human' ? 'Q' : 'A';return `${role}: ${chatValue2RuntimePrompt(item.value).text}`;}).join('\n');

将历史对话记录转换为 Q/A 格式的文本

合并提示词

const concatFewShot = `${systemFewShot}${historyFewShot}`.trim();

初始化 AI API

const ai = getAIApi({timeout: 480000  // 8分钟超时
});

构建请求消息

const messages = [{role: 'user',content: replaceVariable(defaultPrompt, {query: `${query}`,histories: concatFewShot})}
] as ChatCompletionMessageParam[];

将用户问题和历史记录替换到提示词模板中

调用 AI 接口

const result = await ai.chat.completions.create({model: model,temperature: 0.01,  // 温度很低,保证输出稳定性messages,stream: false
});

处理返回结果

let answer = result.choices?.[0]?.message?.content || '';
if (!answer) {return {rawQuery: query,extensionQueries: [],model,tokens: 0};
}

解析结果

answer = answer.replace(/\\"/g, '"');  // 处理转义字符
try {const queries = JSON.parse(answer) as string[];  // 解析为字符串数组return {rawQuery: query,           // 原始问题extensionQueries: Array.isArray(queries) ? queries : [],  // 扩展后的问题列表model,                     // 使用的模型tokens: countGptMessagesTokens(messages)  // token 数量};
} catch (error) {// 解析失败时返回空结果console.log(error);return {rawQuery: query,extensionQueries: [],model,tokens: 0};
}

这个函数的主要作用是:

接收用户问题和历史对话
使用精心设计的提示词引导 AI 生成多个检索词
返回原始问题和扩展后的问题列表
通过低温度参数(0.01)确保输出的稳定性
完整的错误处理确保函数的健壮性

这样的设计使得即使用户提出不完整的问题,系统也能通过上下文理解用户意图并生成合适的检索词。

2.3 queryExtension 引用位置

知识库搜索中的使用

// packages/service/core/dataset/search/utils.ts
export const datasetSearchQueryExtension = async ({model,query,histories,chatBg
}) => {const result = await queryExtension({model,query,histories,chatBg});
}

这是最主要的使用场景，在知识库搜索前对用户问题进行优化。

工作流节点中的使用

// packages/service/core/workflow/dispatch/tools/queryExternsion.ts
export const dispatchQueryExtension = async ({model,params,histories,chatBg
}) => {const queryExtensionModel = getLLMModel(model);const { extensionQueries, tokens } = await queryExtension({chatBg,query: params.userChatInput,histories,model: queryExtensionModel.model});
}

作为工作流中的一个独立节点使用，可以在对话流程中进行问题优化。

搜索测试中的使用

// projects/app/src/pages/api/core/dataset/searchTest.ts
const { concatQueries, rewriteQuery, aiExtensionResult } = await datasetSearchQueryExtension({model: body.model,query: body.searchParams.query,histories: body.searchParams.histories || [],chatBg: body.searchParams.chatBg
});

在知识库的搜索测试功能中使用，用于测试问题优化的效果。

配置相关
在多个配置文件中，我们可以看到 usedInQueryExtension 的配置：

{"usedInQueryExtension": true  // 标记模型是否可用于问题优化
}

UI 组件中的使用

// projects/app/src/components/core/module/DatasetParamsModal.tsx
const queryExtensionModel = watch('datasetSearchExtensionModel');

在界面上提供问题优化相关的配置选项。

三、流程总结

用户发起问题
如果启用了问题优化功能：
- 系统会调用 queryExtension 生成多个检索词
- 这些检索词会与原始问题一起用于知识库搜索
- 搜索结果会经过重排序和合并
最终返回最相关的知识库内容

这种设计让系统能够：

更好地理解用户的意图
处理不完整或指代性的问题
提高知识库搜索的准确性
支持连续对话中的上下文理解

FastGPT 源码：如何实现 “问题优化“

文章目录 FastGPT 源码：如何实现 "问题优化"一、前言二、源码分析2.1 queryExtension.ts 提示词2.2 queryExtension.ts 核心逻辑2.3 queryExtension 引用位置三、流程总结 FastGPT 源码：如何实现 “问题优化” 一、前言问题优化的背景和目…...

编程日记 2025/3/5 7:17:01

CSS—flex布局、过渡transition属性、2D转换transform属性、3D转换transform属性

1.flex布局也叫弹性布局，是浏览器提倡的布局模型，非常适合结构化布局，提供了强大的空间分布和对齐能力，不会产生浮动布局中脱标现象，布局网页更简单，更灵活。 flex容器属性： 属性描述d…...

编程日记 2025/3/5 7:15:59

Spring Boot Gradle 项目中使用 @Slf4j 注解

Spring Boot Gradle 项目中，如果想使用 Slf4j 注解来启用日志记录，首先需要添加 Lombok 和 SLF4J 的依赖。可以通过以下步骤来添加它们： 1. 添加 Lombok 依赖在 build.gradle 文件中添加以下 Lombok 依赖： dependencies {impl…...

编程日记 2025/3/5 7:14:58

实验环境 stm32F103RCT6核心板 keil5 vscode stm32cubemx 使用stm32cubemx 问题现场 void my_task_init(void) {xTaskCreate(LED1_Task, "LED1_Task", configMINIMAL_STACK_SIZE, NULL, 1, NULL);xTaskCreate(LED2_Task, "LED2_Task", configMINIMA…...

编程日记 2025/3/5 7:12:56

linux应用：errno、perror、open、fopen

errno errno 是一个全局变量，定义在头文件中。当系统调用（如 open、read、write 等）或库函数执行失败时，会将一个错误码赋值给 errno。不同的错误码代表不同的错误类型，通过检查 errno 的值，可以判断具体…...

编程日记 2025/3/5 7:10:54

物联网中的气象监测设备具备顶级功能

物联网中的气象监测设备具备顶级功能时，通常集成GPS、数据上报和预警系统，以确保精准监测和及时响应。以下是这些功能的详细说明： 1. GPS定位精准定位：GPS模块提供设备的精确地理位置，确保数据与具体位置关联&#…...

编程日记 2025/3/5 7:09:52

15-YOLOV8OBB损失函数详解

一、YOLO OBB支持的OBB 在Ultralytics YOLO 模型中，OBB 由YOLO OBB 格式中的四个角点表示。这样可以更准确地检测到物体，因为边界框可以旋转以更好地适应物体。其坐标在 0 和 1 之间归一化： class_index x1 y1 x2 y2 x3 y3 x4 y4 YOLO 在内部处理损失和输出是xywhr 格式，x…...

编程日记 2025/3/5 7:03:46

WHAT - 前端异步事件流处理场景梳理

目录一、典型场景二、解决方案与技术选型1. 基础异步控制2. 状态管理方案3. 复杂任务调度4. 任务取消机制5. 微任务队列优化三、最佳实践建议四、工具链推荐前端异步任务流处理是现代Web开发中常见的需求，尤其在复杂业务逻辑、高交互性应用中不可或缺。以下是常见…...

编程日记 2025/3/5 7:00:41

计算机网络软考

1.物理层 1.两个主机之间发送数据的过程自上而下的封装数据，自下而上的解封装数据，实现数据的传输 2.数据、信号、码元码元就是数字通信里用来表示信息的基本信号单元。比如在二进制中，用高电平代表 “1”、低电平代表 “0”&#xff0c…...

编程日记 2025/3/5 6:55:36

安防监控/视频集中存储EasyCVR视频汇聚平台如何配置AI智能分析平台的接入？

EasyCVR安防视频监控平台不仅支持AI边缘计算智能硬件设备的接入，还能快速集成AI智能分析平台，接收来自智能分析平台或设备的AI告警信息，如烟火检测、周界入侵检测、危险区域闯入检测、安全帽/反光衣佩戴检测等。本文将详细介绍如何在EasyCVR…...

编程日记 2025/3/5 6:52:33

做小程序开发的安全防护全方案

小程序开发安全防护方案为了确保小程序在开发过程中的安全性，以下是一个全面的防护方案： 1. 需求分析与规划功能模块分析：明确小程序的功能模块，识别高风险区域如用户登录和支付功能。数据分类分级：将数据分为敏感…...

编程日记 2025/3/5 6:51:32

在Spring Boot项目中导出复杂对象到Excel文件

在Spring Boot项目中导出复杂对象到Excel文件，可以利用Hutool或EasyExcel等库来简化操作。这里我们将详细介绍如何使用Hutool和EasyExcel两种方式来实现这一功能。使用Hutool导出复杂对象到Excel 首先确保你的pom.xml中添加了Hutool的依赖： <depe…...

编程日记 2025/3/5 6:40:18

从JDBC到数据库连接池：构建高性能Java应用的基石（中篇）

推荐关联阅读：JDBC核心技术解析：从基础连接到ORM演进之路（上） 一、JDBC的困境与连接池的救赎 1.1 传统JDBC的致命缺陷在Java应用与数据库交互的原始模式中，开发者通过DriverManager.getConnection()获取数据库连接…...

编程日记 2025/3/5 6:38:15

JavaWeb后端基础（6）

主键返回例子： /** * 新增员工数据 */ Options(useGeneratedKeys true, keyProperty "id") Insert("insert into emp(username, name, gender, phone, job, salary, image, entry_date, dept_id, create_time, update_time) " "value…...

编程日记 2025/3/5 6:36:14

nio多线程版本

多线程多路复用多线程NIO，，就是多个线程，每个线程上都有一个Selector，，，比如说一个系统中一个线程用来接收请求，，剩余的线程用来读写数据，，每个线程独立干自…...

编程日记 2025/3/5 6:35:12

Electron、Tauri及其它跨平台方案终极对比

Electron、Tauri及跨平台方案终极对比（2025版） 一、核心框架深度解析 1.1 Electron：Web技术的桌面霸主技术架构基于Chromium（浏览器内核） Node.js（后端运行时）的双进程架构，支持…...

编程日记 2025/3/5 6:34:11

蓝桥杯试题：二分查找

一、问题描述给定 n 个数形成的一个序列 a，现定义如果一个连续子序列包含序列 a 中所有不同元素，则该连续子序列便为蓝桥序列，现在问你，该蓝桥序列长度最短为多少？ 例如 1 2 2 2 3 2 2 1，包含 3 个不同的…...

编程日记 2025/3/5 6:33:09

MongoDB Chunks核心概念与机制

1. 基础定义‌ ‌Chunk（块）‌：MongoDB分片集群中数据的逻辑存储单元，由一组连续的片键（Shard Key）范围数据组成，默认大小为‌64MB‌（可调整范围为1-1024MB）‌。‌数据分…...

编程日记 2025/3/5 6:32:07

决策树（Decision Tree）：机器学习中的经典算法

1. 什么是决策树？ 决策树（Decision Tree）是一种基于树形结构的机器学习算法，适用于分类和回归任务。其核心思想是通过一系列的规则判断，将数据集不断划分，最终形成一棵树状结构，从而实现预测目…...

编程日记 2025/3/5 6:30:05

高频 SQL 50 题（基础版）_1084. 销售分析 III

高频 SQL 50 题（基础版）_1084. 销售分析 III 思路思路 select t1.product_id,product_name from Product as t1 join(select product_id,min(sale_date) as min_date,max(sale_date) as max_datefrom Salesgroup by (product_id)having 2019-01-01<…...

编程日记 2025/3/5 6:28:02

基于Flask实现的医疗保险欺诈识别监测模型

基于Flask实现的医疗保险欺诈识别监测模型项目截图项目简介社会医疗保险是国家通过立法形式强制实施，由雇主和个人按一定比例缴纳保险费，建立社会医疗保险基金，支付雇员医疗费用的一种医疗保险制度， 它是促进社会文明和进步的…...

编程新知 2025/11/7 21:08:07

linux arm系统烧录

1、打开瑞芯微程序 2、按住linux arm 的 recover按键插入电源 3、当瑞芯微检测到有设备 4、松开recover按键 5、选择升级固件 6、点击固件选择本地刷机的linux arm 镜像 7、点击升级 （忘了有没有这步了估计有） 刷机程序和镜像就不提供了。要刷的时…...

编程新知 2025/11/8 4:28:59

Psychopy音频的使用

Psychopy音频的使用本文主要解决以下问题： 指定音频引擎与设备；播放音频文件本文所使用的环境： Python3.10 numpy2.2.6 psychopy2025.1.1 psychtoolbox3.0.19.14 一、音频配置 Psychopy文档链接为Sound - for audio playback — Psy…...

编程新知 2025/11/8 7:46:49

MySQL中【正则表达式】用法

MySQL 中正则表达式通过 REGEXP 或 RLIKE 操作符实现（两者等价），用于在 WHERE 子句中进行复杂的字符串模式匹配。以下是核心用法和示例： 一、基础语法 SELECT column_name FROM table_name WHERE column_name REGEXP pattern; …...

编程新知 2025/10/27 12:32:57

【电力电子】基于STM32F103C8T6单片机双极性SPWM逆变（硬件篇）

本项目是基于 STM32F103C8T6 微控制器的 SPWM（正弦脉宽调制）电源模块，能够生成可调频率和幅值的正弦波交流电源输出。该项目适用于逆变器、UPS电源、变频器等应用场景。供电电源输入电压采集上图为本设计的电源电路，图中 D1 为二极管，其目的是防止正负极电源反接， …...

编程新知 2025/11/8 1:39:23

脑机新手指南（七）：OpenBCI_GUI：从环境搭建到数据可视化（上）

一、OpenBCI_GUI 项目概述 （一）项目背景与目标 OpenBCI 是一个开源的脑电信号采集硬件平台，其配套的 OpenBCI_GUI 则是专为该硬件设计的图形化界面工具。对于研究人员、开发者和学生而言，首次接触 OpenBCI 设备时，往…...

编程新知 2025/11/9 11:18:09

Qt 事件处理中 return 的深入解析

Qt 事件处理中 return 的深入解析在 Qt 事件处理中，return 语句的使用是另一个关键概念，它与 event->accept()/event->ignore() 密切相关但作用不同。让我们详细分析一下它们之间的关系和工作原理。核心区别：不同层级的事件处理方…...

编程新知 2025/6/10 21:19:52

springboot 日志类切面，接口成功记录日志，失败不记录

springboot 日志类切面，接口成功记录日志，失败不记录自定义一个注解方法 import java.lang.annotation.ElementType; import java.lang.annotation.Retention; import java.lang.annotation.RetentionPolicy; import java.lang.annotation.Target;/***…...

编程新知 2025/11/9 11:41:06

Vue 3 + WebSocket 实战：公司通知实时推送功能详解

📢 Vue 3 WebSocket 实战：公司通知实时推送功能详解 📌 收藏点赞关注，项目中要用到推送功能时就不怕找不到了！ 实时通知是企业系统中常见的功能，比如：管理员发布通知后，所有用户…...

编程新知 2025/11/3 9:35:59

python基础语法Ⅰ

python基础语法Ⅰ 常量和表达式变量是什么变量的语法1.定义变量使用变量变量的类型1.整数2.浮点数(小数)3.字符串4.布尔5.其他动态类型特征注释注释是什么注释的语法1.行注释2.文档字符串注释的规范常量和表达式我们可以把python当作一个计算器，来进行一些算术…...

编程新知 2025/11/9 10:42:39

FastGPT 源码：如何实现 “问题优化“

文章目录

FastGPT 源码：如何实现 “问题优化”

一、前言

二、源码分析

2.1 queryExtension.ts 提示词

2.2 queryExtension.ts 核心逻辑

2.3 queryExtension 引用位置

三、流程总结

相关文章：

FastGPT 源码：如何实现 “问题优化“

CSS—flex布局、过渡transition属性、2D转换transform属性、3D转换transform属性

Spring Boot Gradle 项目中使用 @Slf4j 注解

FreeRTOS系列---程序正常，但任务无法创建

linux应用：errno、perror、open、fopen

物联网中的气象监测设备具备顶级功能

15-YOLOV8OBB损失函数详解

WHAT - 前端异步事件流处理场景梳理

计算机网络软考

安防监控/视频集中存储EasyCVR视频汇聚平台如何配置AI智能分析平台的接入？

做小程序开发的安全防护全方案

在Spring Boot项目中导出复杂对象到Excel文件

从JDBC到数据库连接池：构建高性能Java应用的基石（中篇）

JavaWeb后端基础（6）

nio多线程版本

Electron、Tauri及其它跨平台方案终极对比

蓝桥杯试题：二分查找

MongoDB Chunks核心概念与机制

决策树（Decision Tree）：机器学习中的经典算法

高频 SQL 50 题（基础版）_1084. 销售分析 III

基于Flask实现的医疗保险欺诈识别监测模型

linux arm系统烧录

Psychopy音频的使用

MySQL中【正则表达式】用法

【电力电子】基于STM32F103C8T6单片机双极性SPWM逆变（硬件篇）

脑机新手指南（七）：OpenBCI_GUI：从环境搭建到数据可视化（上）

Qt 事件处理中 return 的深入解析

springboot 日志类切面，接口成功记录日志，失败不记录

Vue 3 + WebSocket 实战：公司通知实时推送功能详解

python基础语法Ⅰ