当前位置：首页 > news >正文

【GoMate框架案例】讯飞大模型RAG智能问答挑战赛top10 Baseline

news 2026/2/9 11:43:26

【RAG框架】GoMate：RAG Framework within Reliable input,Trusted output

【项目链接】：https://github.com/gomate-community/GoMate

一、赛题背景

RAG（检索增强生成）是一种结合了检索模型和生成模型的技术，它通过检索大量外部知识来辅助文本生成，从而提高大型语言模型（LLMs）的准确度和可靠性。

RAG特别适合于需要不断更新知识的知识密集型场景或特定领域应用，它通过引入外部信息源，有效缓解了大语言模型在领域知识缺乏、信息准确性问题以及生成虚假内容等方面的挑战。本次挑战赛旨在探索RAG技术的极限，鼓励开发者、研究人员和爱好者利用RAG技术解决实际问题，推动人工智能领域的进步。

二、赛题任务

赛题需要参赛选手设计并实现一个RAG模型，该模型能够从给定的问题出发，检索知识库中的相关信息。利用检索到的信息，结合问题本身，生成准确、全面、权威的回答。

三、评审规则

1.数据说明

数据集还可能包括一些未标注的文本，需要参赛者使用RAG技术中的检索增强方法来找到相关信息，并生成答案。这要求参赛者不仅要有强大的检索能力，还要能够生成准确、连贯且符合上下文的文本。

测试集为模拟生成的用户提问，需要参赛选手结合提问和语料完成回答。需注意，在问题中存在部分问题无法回答，需要选手设计合适的策略进行拒绝回答的逻辑。

• corpus.txt.zip：语料库，每行为一篇新闻

• test_question.csv：测试提问

评审规则

对于测试提问的回答，采用字符重合比例进行评价，分数最高为1。

四、数据分析

检索语料
文本长度

五、RAG基线实现

import pickleimport pandas as pd
from tqdm import tqdmfrom gomate.modules.document.chunk import TextChunker
from gomate.modules.document.txt_parser import TextParser
from gomate.modules.document.utils import PROJECT_BASE
from gomate.modules.generator.llm import GLM4Chat
from gomate.modules.reranker.bge_reranker import BgeRerankerConfig, BgeReranker
from gomate.modules.retrieval.bm25s_retriever import BM25RetrieverConfig
from gomate.modules.retrieval.dense_retriever import DenseRetrieverConfig
from gomate.modules.retrieval.hybrid_retriever import HybridRetriever, HybridRetrieverConfigdef generate_chunks():tp = TextParser()tc = TextChunker()paragraphs = tp.parse(r'H:/2024-Xfyun-RAG/data/corpus.txt', encoding="utf-8")print(len(paragraphs))chunks = []for content in tqdm(paragraphs):chunk = tc.chunk_sentences([content], chunk_size=1024)chunks.append(chunk)with open(f'{PROJECT_BASE}/output/chunks.pkl', 'wb') as f:pickle.dump(chunks, f)if __name__ == '__main__':# test_path="H:/2024-Xfyun-RAG/data/test_question.csv"# embedding_model_path="H:/pretrained_models/mteb/bge-m3"# llm_model_path="H:/pretrained_models/llm/Qwen2-1.5B-Instruct"test_path = "/data/users/searchgpt/yq/GoMate_dev/data/competitions/xunfei/test_question.csv"embedding_model_path = "/data/users/searchgpt/pretrained_models/bge-large-zh-v1.5"llm_model_path = "/data/users/searchgpt/pretrained_models/glm-4-9b-chat"# ====================文件解析+切片=========================generate_chunks()with open(f'{PROJECT_BASE}/output/chunks.pkl', 'rb') as f:chunks = pickle.load(f)corpus = []for chunk in chunks:corpus.extend(chunk)# ====================检索器配置=========================# BM25 and Dense Retriever configurationsbm25_config = BM25RetrieverConfig(method='lucene',index_path='indexs/description_bm25.index',k1=1.6,b=0.7)bm25_config.validate()print(bm25_config.log_config())dense_config = DenseRetrieverConfig(model_name_or_path=embedding_model_path,dim=1024,index_path='indexs/dense_cache')config_info = dense_config.log_config()print(config_info)# Hybrid Retriever configuration# 由于分数框架不在同一维度，建议可以合并hybrid_config = HybridRetrieverConfig(bm25_config=bm25_config,dense_config=dense_config,bm25_weight=0.7,  # bm25检索结果权重dense_weight=0.3  # dense检索结果权重)hybrid_retriever = HybridRetriever(config=hybrid_config)# 构建索引# hybrid_retriever.build_from_texts(corpus)# 保存索引# hybrid_retriever.save_index()# 加载索引hybrid_retriever.load_index()# ====================检索测试=========================query = "新冠肺炎疫情"results = hybrid_retriever.retrieve(query, top_k=5)# Output resultsfor result in results:print(f"Text: {result['text']}, Score: {result['score']}")# ====================排序配置=========================reranker_config = BgeRerankerConfig(model_name_or_path="/data/users/searchgpt/pretrained_models/bge-reranker-large")bge_reranker = BgeReranker(reranker_config)# ====================生成器配置=========================# qwen_chat = QwenChat(llm_model_path)glm4_chat = GLM4Chat(llm_model_path)# ====================检索问答=========================test = pd.read_csv(test_path)answers = []for question in tqdm(test['question'], total=len(test)):search_docs = hybrid_retriever.retrieve(question)search_docs = bge_reranker.rerank(query=question,documents=[doc['text'] for idx, doc in enumerate(search_docs)])# print(search_docs)content = '/n'.join([f'信息[{idx}]：' + doc['text'] for idx, doc in enumerate(search_docs)])answer = glm4_chat.chat(prompt=question, content=content)answers.append(answer[0])print(question)print(answer[0])print("************************************/n")test['answer'] = answerstest[['answer']].to_csv(f'{PROJECT_BASE}/output/gomate_baseline.csv', index=False)

【GoMate框架案例】讯飞大模型RAG智能问答挑战赛top10 Baseline

【RAG框架】GoMate：RAG Framework within Reliable input,Trusted output 【项目链接】：https://github.com/gomate-community/GoMate 一、赛题背景 RAG（检索增强生成）是一种结合了检索模型和生成模型的技术，它通过检…...

编程日记 2024/9/16 2:41:12

2024/9/15 408“回头看”之应用层小总结（下）

域名系统DNS: 本地域名服务器本地域名服务器起着代理的作用，会将报文转发到根域名服务器、顶级域名服务器、权限域名服务器。递归查询： 迭代查询： 文件传送协议FTP: FTP客户和FTP服务器之间使用的是tcp连接。控制连接使用21端口&…...

编程日记 2024/9/16 2:40:10

经纬恒润高压电池管理系统，助力新能源汽车飞速发展

随着新能源汽车行业的快速发展，电池管理系统作为关键技术之一，其重要性日益凸显。经纬恒润自主研发的高压电池管理系统（Battery Management System，BMS），凭借卓越的性能与先进的技术，在新能源汽…...

编程日记 2024/9/16 2:38:08

一文速通calcite结合flink理解SQL从文本变成执行计划详细过程

文章目录你可以学到啥测试代码背景知识SQL转变流程图问题你可以学到啥 SQL如何一步步变成执行计划的有哪些优化器，哪些优化规则calcite 和flink 如何结合的测试代码 EnvironmentSettings settings EnvironmentSettings.inBatchMode(); TableEnvironment tabl…...

编程日记 2024/9/16 2:37:07

spring-TransactionTemplate 编程式事务

TransactionTemplate 是 Spring 框架提供的用于管理事务的一种方式。它提供了一种编程式的事务管理方法，允许开发者在代码中显式地控制事务的开始、提交或回滚。与使用 Transactional 注解相比，TransactionTemplate 提供了更多的灵活性和控制力。为什么…...

编程日记 2024/9/16 2:35:05

中考全国45套（全国教育发达地区中考试卷）

文章目录获取方式为什么选择这份资源？ 权威性与全面性：我们精心搜集了全国教育发达地区的最新中考试卷，确保每一套试卷都代表了该地区的教学水平和考试趋势。这不仅涵盖了丰富的知识点，还融入了各地独特的命题风格，让…...

编程日记 2024/9/16 2:33:03

嵌入式Linux学习笔记（5）-进程间常见通讯方式（c语言实现）

一、概述进程间通信（IPC，InterProcess Communication）是指在多个进程之间进行数据传输和共享的机制。在操作系统中，进程是运行中的程序的实例，每个进程都有自己的内存空间和资源。进程间通信可以用于在不同的进程之间…...

编程日记 2024/9/16 2:26:58

【移动端】菜单的自动展开与收回

前言为了满足手机上菜单栏随用户移动，菜单的自动展示与隐藏，特此记录基本原理实现逻辑 window.addEventListener(‘scroll’, debouncedScrollHandler) – 监听文档视图滚动事件 document.querySelector(‘.header’) – 选择器匹配元素创建show和h…...

编程日记 2024/9/16 2:24:56

Java获取Object中Value的方法

在Java中，获取对象（Object）中的值通常依赖于对象的类型以及我们希望访问的属性。由于Java是一种静态类型语言，直接从一个Object类型中访问属性是不可能的，因为Object是所有类的超类，但它本身不包含任何特定…...

编程日记 2024/9/16 2:23:55

集群聊天服务器项目【C++】（二）Json的简单使用

在上一章中，简单介绍了本项目的内容、技术栈、需求和目标等，详细介绍了环境配置，如果还没有配置成功，请参考我的上一篇博客环境配置今天主要介绍Json库是什么以及简单的使用。 1.为什么要使用Json 我们在网络传输数据时&#…...

编程日记 2024/9/16 2:16:50

班迪录屏和这三款录屏工具，一键操作，太方便了！

嘿，小伙伴们！今天我要跟大家分享几款超棒的录屏工具，它们绝对是我们在工作和学习中不可或缺的好帮；这些工具功能强大且操作简单，下面就让我来详细介绍一下它们的使用体验和好用之处吧！ 班迪录屏工具使用体…...

编程日记 2024/9/16 2:12:43

DAY60Bellman_ford 算法

队列优化算法请找出从城市 1 到城市 n 的所有可能路径中，综合政府补贴后的最低运输成本。如果能够从城市 1 到连通到城市 n， 请输出一个整数，表示运输成本。如果该整数是负数，则表示实现了盈利。如果从城市 1 没有路径可达城市…...

编程日记 2024/9/16 2:11:42

Dubbo SPI源码

文章目录 Dubbo SPI使用方式AOP功能源码剖析SPI注解1.获取加载器2.获取拓展实例对象3.创建拓展类的实例对象 Dubbo SPI Dubbo 的 SPI（Service Provider Interface）机制是一种强大的扩展机制，它允许开发者在运行时动态地替换或增加框架的功能。…...

编程日记 2024/9/16 2:09:40

《C++代码高度优化之双刃剑：避免过度优化引发的“暗雷”》

在 C编程的世界里，追求高效性能的代码是每个开发者的目标之一。高度优化的 C代码可以带来显著的性能提升，让程序在运行速度、内存占用等方面表现出色。然而，正如一把双刃剑，过度优化可能会引入难以察觉的错误，给程序带…...

编程日记 2024/9/16 2:08:39

javascript网页设计案例

设计一个具有良好用户体验的 JavaScript 网页涉及多个方面，如用户界面（UI）、用户体验（UX）、交互设计等。以下是一些示例案例，展示了如何使用 JavaScript 创建功能丰富且吸引人的网页设计。 1. 响应式导航菜…...

编程日记 2024/9/16 2:07:38

初阶数据结构【TOP】- 11.普通二叉树的介绍 - 1. (细致,保姆~~!)

文章目录前言一、普通二叉树的链式结构二、造树三、普通二叉树的遍历四、遍历完整代码五、总结前言本篇文章笔者将会对普通二叉树部分进行细致的讲解 , 本篇主要包括以下内容: 二叉树链式结构的介绍 ,二叉树的遍历. 笔者会一步一步分析带学者领略递归的美好~~ 一、普通二叉…...

编程日记 2024/9/16 2:06:37

【pyenv】pyenv安装版本超时的解决方案

目录 1、现象 2、分析现象 3、手动下载所需版本 4、存放到指定路径 5、重新安装 6、pip失败（做个记录，未找到原因） 7、方法二修改环境变量方法 7.1 设置环境变量 7.2 更新 7.3 安装即可 8、方法三修改XML文件前言：研…...

编程日记 2024/9/16 2:05:36

【新片场-注册安全分析报告-无验证方式导致安全隐患】

前言由于网站注册入口容易被黑客攻击，存在如下安全问题： 1. 暴力破解密码，造成用户信息泄露 2. 短信盗刷的安全问题，影响业务及导致用户投诉 3. 带来经济损失，尤其是后付费客户，风险巨大，造…...

编程日记 2024/9/16 2:04:35

新160个crackme - 057-bbbs-crackme04

运行分析因软件版本老旧，需使用windows XP虚拟机运行有个SystemID，值为12345678需破解User ID和Password PE分析 yC壳，32位 OD手动脱壳使用windows XP虚拟机，将程序拖入OD按一下F8，ESP变红，根据ESP定律设…...

编程日记 2024/9/16 2:02:33

车机中 Android Audio 音频常见问题分析方法实践小结

文章目录前言1. 无声2. 断音3. 杂音4. 延迟播放5. 焦点问题6. 无声问题(连上 BT )其他完善中…… 前言本文主要总结了一下车机开发中遇到的 Audio 有关的问题，同时参考网上的一案例，由于Audio 模块出现音频问题的场景很多，对每一个出现的问…...

编程日记 2024/9/16 2:00:32

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …...

编程新知 2026/2/8 4:37:37

FFmpeg 低延迟同屏方案

引言在实时互动需求激增的当下，无论是在线教育中的师生同屏演示、远程办公的屏幕共享协作，还是游戏直播的画面实时传输，低延迟同屏已成为保障用户体验的核心指标。FFmpeg 作为一款功能强大的多媒体框架，凭借其灵活的编解码、数据…...

编程新知 2025/11/4 6:26:59

【HarmonyOS 5.0】DevEco Testing：鸿蒙应用质量保障的终极武器

——全方位测试解决方案与代码实战一、工具定位与核心能力 DevEco Testing是HarmonyOS官方推出的一体化测试平台，覆盖应用全生命周期测试需求，主要提供五大核心能力： 测试类型检测目标关键指标功能体验基…...

编程新知 2026/1/28 8:17:53

Mybatis逆向工程，动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件

今天呢，博主的学习进度也是步入了Java Mybatis 框架，目前正在逐步杨帆旗航。那么接下来就给大家出一期有关 Mybatis 逆向工程的教学，希望能对大家有所帮助，也特别欢迎大家指点不足之处，小生很乐意接受正确的建议&…...

编程新知 2026/1/31 15:00:15

HTML 列表、表格、表单

1 列表标签作用：布局内容排列整齐的区域列表分类：无序列表、有序列表、定义列表。例如： 1.1 无序列表标签：ul 嵌套 li，ul是无序列表，li是列表条目。注意事项： ul 标签里面只能包裹 li…...

编程新知 2026/1/24 22:33:33

Mac下Android Studio扫描根目录卡死问题记录

环境信息操作系统: macOS 15.5 (Apple M2芯片)Android Studio版本: Meerkat Feature Drop | 2024.3.2 Patch 1 (Build #AI-243.26053.27.2432.13536105, 2025年5月22日构建) 问题现象在项目开发过程中，提示一个依赖外部头文件的cpp源文件需要同步，点…...

编程新知 2026/2/6 1:00:00

Java 二维码

Java 二维码 **技术：**谷歌 ZXing 实现首先添加依赖 <dependency><groupId>com.google.zxing</groupId><artifactId>core</artifactId><version>3.5.1</version></dependency><de…...

编程新知 2025/9/6 16:22:45

基于TurtleBot3在Gazebo地图实现机器人远程控制

1. TurtleBot3环境配置 # 下载TurtleBot3核心包 mkdir -p ~/catkin_ws/src cd ~/catkin_ws/src git clone -b noetic-devel https://github.com/ROBOTIS-GIT/turtlebot3.git git clone -b noetic https://github.com/ROBOTIS-GIT/turtlebot3_msgs.git git clone -b noetic-dev…...

编程新知 2026/2/6 11:54:58

基于 TAPD 进行项目管理

起因自己写了个小工具，仓库用的Github。之前在用markdown进行需求管理，现在随着功能的增加，感觉有点难以管理了，所以用TAPD这个工具进行需求、Bug管理。操作流程注册 TAPD，需要提供一个企业名新建一个项目&#…...

编程新知 2026/1/24 14:15:44

4. TypeScript 类型推断与类型组合

一、类型推断 (一) 什么是类型推断 TypeScript 的类型推断会根据变量、函数返回值、对象和数组的赋值和使用方式，自动确定它们的类型。这一特性减少了显式类型注解的需要，在保持类型安全的同时简化了代码。通过分析上下文和初始值，TypeSc…...

编程新知 2025/11/2 1:48:43

【GoMate框架案例】讯飞大模型RAG智能问答挑战赛top10 Baseline

一、赛题背景

二、赛题任务

三、评审规则

四、数据分析

五、RAG基线实现

相关文章：

【GoMate框架案例】讯飞大模型RAG智能问答挑战赛top10 Baseline

2024/9/15 408“回头看”之应用层小总结（下）

经纬恒润高压电池管理系统，助力新能源汽车飞速发展

一文速通calcite结合flink理解SQL从文本变成执行计划详细过程

spring-TransactionTemplate 编程式事务

中考全国45套（全国教育发达地区中考试卷）

嵌入式Linux学习笔记（5）-进程间常见通讯方式（c语言实现）

【移动端】菜单的自动展开与收回

Java获取Object中Value的方法

集群聊天服务器项目【C++】（二）Json的简单使用

班迪录屏和这三款录屏工具，一键操作，太方便了！

DAY60Bellman_ford 算法

Dubbo SPI源码

《C++代码高度优化之双刃剑：避免过度优化引发的“暗雷”》

javascript网页设计案例

初阶数据结构【TOP】- 11.普通二叉树的介绍 - 1. (细致,保姆~~!)

【pyenv】pyenv安装版本超时的解决方案

【新片场-注册安全分析报告-无验证方式导致安全隐患】

新160个crackme - 057-bbbs-crackme04

车机中 Android Audio 音频常见问题分析方法实践小结

利用最小二乘法找圆心和半径

FFmpeg 低延迟同屏方案

【HarmonyOS 5.0】DevEco Testing：鸿蒙应用质量保障的终极武器

Mybatis逆向工程，动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件

HTML 列表、表格、表单

Mac下Android Studio扫描根目录卡死问题记录

Java 二维码

基于TurtleBot3在Gazebo地图实现机器人远程控制

基于 TAPD 进行项目管理

4. TypeScript 类型推断与类型组合