当前位置: 首页 > article >正文

不用向量数据库的_RAG,居然跑得更准了?

PageIndex是一种创新的RAG技术彻底摒弃传统向量数据库从文档结构构建层次化索引。受AlphaGo启发通过推理路径而非相似度检索让模型像翻书一样找答案。特别适合专业长文档分析保持上下文连续性和逻辑性在金融等领域测试达98.7%准确率。三步即可将文档转为可推理索引可作为独立底座接入各种RAG系统。最近在翻 RAG 相关项目时看到一个挺反直觉的思路忍不住多看了几眼它就是——PageIndex它做了一件不一样的事把向量数据库从 RAG 里彻底拿掉了不是“少用”也不是“可选”而是从设计一开始就假设检索这一步不一定非要靠相似度向量 RAG 的老问题如果你平时主要在处理财报、招股书、监管文件或者各种技术规范、专业教材那大概率遇到过这种情况向量检索给你的段落“看起来很像”但一问深一点答案却感觉总是差那么一口气问题往往不在 embedding而在于一个被忽略很久的事实相似度并不等于相关性。尤其是那些需要跨章节理解、顺着逻辑一路推下去的问题向量 RAG 很容易把你带到一个“似是而非”的位置PageIndex 想解决的正是这种场景。PageIndex 在做什么让模型像人一样“翻书”PageIndex 并没有去优化向量效果也没有试图用更复杂的 chunk 策略而是直接换了一条路走。它从文档本身的结构出发把整份文档整理成一个层次清晰的索引让模型先理解目录和章节之间的关系再一步步缩小范围判断接下来更可能相关的部分在哪里。整个检索过程更像是在不断做选择题这一问更像属于哪一章是不是应该继续往下翻而不是在一堆零散文本里比对“像不像”。这种设计思路受到了 AlphaGo 树搜索的启发本质上是用推理路径来完成检索而不是用距离来筛选文本。为什么它在专业长文档上特别有优势这种基于结构和推理的方式在面对专业长文档时优势会非常明显。一方面它不会把一个完整的论证过程切碎模型拿到的上下文始终是连续、有逻辑的另一方面检索的每一步都有明确的来源位置可以回溯到具体章节和页码可解释性也更强。官方给出的结果也很有说服力基于 PageIndex 构建的推理型 RAG 系统在 FinanceBench 基准测试中达到了98.7% 的准确率明显高于传统向量 RAG 的表现至少在金融这种强结构、强逻辑的场景下这条路线已经被验证过是可行的。快速上手三步把文档变成“可推理的索引”从使用角度看PageIndex 的上手并不复杂你可以把它理解成一个“文档理解前处理”的工具1. 安装依赖pip3 install --upgrade -r requirements.txt2. 设置OpenAI API密钥在项目根目录创建.env文件添加CHATGPT_API_KEYyour_openai_key_here3. 运行PageIndex处理PDFpython3 run_pageindex.py --pdf_path /path/to/your/document.pdf这一步的核心不是切文本而是让模型先读目录、理解章节关系再生成一份可以被逐层导航和推理的索引结构。后续无论你是做问答还是做 Agent 调用这个结构都会成为检索的基础。如果你处理的是 Markdown 文档也可以直接指定--md_pathPageIndex 会按# / ## / ###的层级自动识别结构这种情况下体验会更自然。可选参数•--model使用的OpenAI模型默认gpt-4o-2024-11-20•--toc-check-pages检查目录的页数默认20•--max-pages-per-node每个节点的最大页数默认10•--max-tokens-per-node每个节点的最大token数默认20000•--if-add-node-id是否添加节点ID默认是•--if-add-node-summary是否添加节点摘要默认是•--if-add-doc-description是否添加文档描述默认是生成之后可以怎么用PageIndex 并不会强行绑定某个具体的 RAG 框架。你可以把生成的索引结构接进自己的 Agent 系统也可以作为推理型 RAG 的检索层使用甚至通过 API 或 MCP 的方式暴露给其他服务。它更像是一个文档理解底座而不是一整套“开箱即用”的解决方案。最后PageIndex 并不是要否定向量 RAG。但它清楚地提醒了一件事当我们处理的文档足够长、足够专业时RAG 的瓶颈往往不在 embedding而在模型是否真正理解了文档的结构和逻辑脉络。如果你正在折腾专业文档分析、金融或合规类 RAG这个项目非常值得你认真看一眼。项目地址https://github.com/VectifyAI/PageIndex大模型入门学习教程 附PDF文档现在国内外关于大模型入门教程做的比较好的并不多这其实也是一件好事有难度和有门槛才能避免烂大街现在大模型入门教程热度最高的包括李宏毅老师、吴恩达老师、Datawhale开源社区等选择合适的入门学习教程能少走弯路抓住核心内容快速达到前沿的水平甚至是发表大模型相关的论文都是可以的这一期主要是给大家推荐李宏毅老师的最新课程大模型入门学习教程这个教程的主要内容如下总共11讲第1讲总体介绍这一讲主要介绍现在大模型作为生成式人工智能其发展的历史过程以及大模型落地的主要应用方向了解大模型主要学习什么内容难度不大简单看一下就行第2讲提示词和AI代理人首先介绍什么是提示词工程提示词就是人类和大模型交互的语言对于大模型的引导需要通过提示词来完成然后介绍如何引导模型进行思考比如COT是什么在模型训练过程中提供额外信息第3讲生成策略同一个问题多次询问大模型大模型会给出不同的回答如何提高回复的准确率以及稳定性是一个重要的大模型生成策略。了解大模型的生成概率与什么有关比如top_p, top_ktemperature等第4讲深度学习和Transformer这一部分先介绍一些深度学习基础内容大模型的模型都是深度学习模型了解深度学习中基础内容是有必要的比如损失函数反向传播梯度下降等然后介绍大模型的基础框架transformertransformer模型结构一定要非常熟悉很重要第5讲大模型评估和道德问题这一部分先介绍大模型的评估标准现在有很多benchmark从各个方面来评测大模型的不同能力评估指标很多开源的模型往往会选择有利于自己的指标进行展示然后介绍大模型中存在的道德问题因为大模型不能随意生成一些不符合道德社会文明的内容第6讲AI的可解释性给大模型一个输入只能得到一个输出但是我们并不清楚大模型的思考过程是怎么样的这个问题大模型是怎么思考的提升大模型的可解释性有助于后续研究如何提升大模型的推理性能像COT就是显式展示大模型的思考过程然后还可以让语言模型来解释语言模型第7讲视觉大模型常说的大模型都指的是文本大模型输入是文本输出也是文本而现实世界中可能我们的输入既有文本又有图片和视频输出也可能是多样化的视觉大模型就是能解决文本和视觉两种模态的大模型第8讲GPT-4o前面都是关于大 模型的理论这一部分是拆解一个完整的大模型是怎么样的以GPT-4o为例进行说明GPT**-4o是首个端到端多模态通用模型**是迈向AGI的一步能够实现文本音频和图片的多模态交互上面就是大模型的入门教程的所有内容学完这些可以去看看关于大模型微调大模型训练大模型推理加速RAG和Agent等相关的内容后面最好整一两个项目来实践一下上述资料获取1. 关注公众号【大模型应用开发LLM】领取即可获取2. 这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关文章:

不用向量数据库的_RAG,居然跑得更准了?

PageIndex是一种创新的RAG技术,彻底摒弃传统向量数据库,从文档结构构建层次化索引。受AlphaGo启发,通过推理路径而非相似度检索,让模型像"翻书"一样找答案。特别适合专业长文档分析,保持上下文连续性和逻辑性…...

【半导体工艺深度解析】STI应力效应(LOD效应)如何重塑CMOS器件性能与电路设计

1. STI应力效应的物理本质 当我们观察现代半导体芯片的微观结构时,会发现无数个晶体管像城市建筑一样紧密排列。这些"建筑"之间需要"围墙"来隔离,这就是STI(浅沟槽隔离)技术的由来。但很少有人知道&#xff0…...

面试必问的TCP/IP:3次握手4次挥手的底层原理与常见误区

面试必问的TCP/IP:3次握手4次挥手的底层原理与常见误区 在技术面试中,TCP连接管理机制几乎是每位面试官必问的核心知识点。无论是初级开发者还是资深架构师,理解TCP三次握手和四次挥手的底层原理,以及相关状态转换和异常处理&…...

python-django-flask个性化服装搭配推荐系统 穿搭推荐系统 小程序

目录实现个性化服装搭配推荐系统的计划可以分为以下几个关键部分:技术栈选择用户画像构建服装数据库设计推荐算法实现小程序前端开发系统集成测试部署与运维项目技术支持源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作实现个性化…...

避坑指南:H3C防火墙配置‘Trust域’时,90%的人会忽略的这个接口划分细节

H3C防火墙Trust域配置深度解析:接口划分的隐藏陷阱与实战解决方案 当你按照标准教程一步步配置完ACL和域间策略,却发现流量依然被拦截时,那种挫败感每个网络工程师都深有体会。问题的根源往往不在那些显眼的策略配置上,而是隐藏在…...

Kafka订阅模式深度对比:assign vs subscribe在分布式系统中的正确使用姿势

Kafka订阅模式深度解析:assign与subscribe的架构师级实践指南 在分布式消息系统的设计中,Kafka作为核心基础设施的选择已经毋庸置疑。但真正决定系统健壮性的,往往是对消费端订阅模式的精准把控。assign与subscribe两种看似简单的API背后&…...

尤雨溪转发庆祝,Claude.ai 抛弃 SSR 拥抱 Vite,性能飙升!

Anthropic 的工程师 Felix Rieseberg 在 3 月 20 日公开发布称:他们把 Claude.ai 和桌面端应用的前端架构做了一次大手术,从 SSR(服务端渲染)切换到了 Vite TanStack Router 的静态方案,直接部署到边缘 Workers 上。效…...

解锁服务器潜能:10个创意项目让你的云端生活更酷

1. 打造专属个人博客:从零开始建立你的数字名片 想象一下,在互联网上拥有一块完全属于你的领地,这就是个人博客的魅力。我十年前第一次用WordPress搭建博客时,那种兴奋感至今难忘。不同于第三方平台,自建博客让你拥有绝…...

2024最新全国建筑轮廓数据免费下载:含楼层信息的SHP文件(附三维建模教程)

2024建筑轮廓数据实战指南:从二维SHP到三维建模的全流程解析 城市规划师和GIS开发者们,是否曾为寻找高质量的建筑轮廓数据而苦恼?或是面对海量数据却不知如何快速转化为直观的三维模型?本文将带你深入探索2024年最新建筑轮廓数据的…...

java毕业设计基于SSM的数字乡村管理系统

前言 随着社会经济的快速发展和农村社会结构的变化,乡村管理面临着新的挑战和需求。传统的管理方式已经无法满足日益增长的管理工作和服务需求,因此需要建立数字化的乡村管理系统来提高管理效率、优化资源配置,实现乡村治理的现代化和智能化。…...

小程序毕业设计基于微信小程序的智慧农产品系统(编号:9643707)

前言 随着信息技术的快速发展,智慧农业已成为当前农业领域的研究热点。智慧农产品系统作为智慧农业的重要组成部分,连接了普通用户、生产者、农科院、联销社和管理员等多个参与方,实现了信息共享、交流合作和产品推广等功能。基于SSM框架和微…...

OpenClaw与多模型协同策略:释放AI组合的强大力量

OpenClaw与多模型协同策略:释放AI组合的强大力量 在AI技术快速发展的今天,单一模型已经难以满足复杂任务的需求。OpenClaw作为一个强大的AI智能体平台,通过多模型协同策略,将不同模型的优势结合起来,实现了11>2的效…...

JS如何基于WebUploader实现军工涉密图纸的浏览器端分片加密断点续传与审计?

要求:免费,开源,技术支持 技术:百度webuploader,分块,切片,断点续传,秒传,MD5验证,纯JS实现,支持第三方软件集成 前端:vue2,vue3,vue-cli,html5,webuploader …...

AgentScope 可观测体系:OpenTelemetry 全链路追踪与 AgentScope Studio 诊断

AgentScope 可观测体系:OpenTelemetry 全链路追踪与 AgentScope Studio 诊断 导读:可观测性是生产级 AI 系统的生命线。AgentScope 基于 OpenTelemetry 标准构建了完整的可观测体系,支持 Trace/Metrics/Logs 三支柱追踪,并提供 AgentScope Studio 可视化…...

计算机毕业设计springboot基于的环境保护宣传网站基于Spring Boot的生态文明教育在线学习与资源共享系统 基于Spring Boot的低碳生活推广与环保公益参与平台

计算机毕业设计springboot基于的环境保护宣传网站 (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。随着人类文明进程的快速推进,环境污染、生态破坏、资源枯竭等问题日…...

MATLAB 常微分方程数值求解算法探索:以两自由度无阻尼振动系统为例

MATLAB常微分方程数值求解算法程序(龙格库塔法、威尔逊法、纽马克法、中心差分法),以两自由度无阻尼振动系统为例,在MATLAB中建模并编制数值计算输出四种算法下物块的位移、速度和加速度曲线,后续可在此基础上继续开展…...

什么是二级指针,用法举例

二级指针是什么&#xff1f;一句话&#xff1a;指向指针的指针。- 一级指针&#xff1a; int *p → 指向一个 int 变量- 二级指针&#xff1a; int **pp → 指向一个 int* 类型的指针变量最简单例子c#include <stdio.h>int main() {int a 10;int *p &a; // 一…...

AI赋能产业升级,天津创新力量引领行业发展

后疫情时代的市场变革中&#xff0c;淘汰与新生并行&#xff0c;而天津始终坚守创新初心&#xff0c;持续发力人工智能产业生态建设。AI技术作为驱动产业迭代升级的核心引擎&#xff0c;正深度渗透这座城市的各个领域&#xff0c;为区域经济高质量发展注入强劲动力。本次我们精…...

YOLOv8鹰眼检测新手教程:从镜像启动到结果可视化全流程

YOLOv8鹰眼检测新手教程&#xff1a;从镜像启动到结果可视化全流程 1. 引言&#xff1a;为什么你需要这个“鹰眼”&#xff1f; 想象一下&#xff0c;你有一张工厂车间的照片&#xff0c;里面有工人、叉车、货架和各种设备。你想快速知道这张图里到底有多少人、多少辆车、多少…...

基于FPGA与PLL的等精度频率计实现与精度优化

1. 等精度频率计的核心原理 我第一次接触等精度频率测量时&#xff0c;被它巧妙的设计思路惊艳到了。传统频率计在测量高低频信号时总会有精度波动&#xff0c;就像用同一把尺子去量蚂蚁和大象&#xff0c;肯定不准确。而等精度测量法就像智能伸缩尺&#xff0c;能根据被测对象…...

Flux.1-Dev深海幻境环境配置详解:Anaconda虚拟环境管理最佳实践

Flux.1-Dev深海幻境环境配置详解&#xff1a;Anaconda虚拟环境管理最佳实践 最近在折腾一些AI模型&#xff0c;特别是像Flux.1-Dev这类比较新的图像生成项目&#xff0c;最头疼的就是环境配置。你肯定也遇到过这种情况&#xff1a;好不容易跟着教程跑通了一个模型&#xff0c;…...

SpringBoot+Vue开源MES系统二次开发指南:从接口对接到看板定制

SpringBootVue开源MES系统二次开发实战&#xff1a;从接口对接到看板定制 在制造业数字化转型浪潮中&#xff0c;MES&#xff08;制造执行系统&#xff09;作为连接企业计划层与控制层的关键纽带&#xff0c;正成为提升生产效率的核心工具。本文将深入探讨如何基于SpringBootVu…...

通达信数据导出避坑指南:为什么你的backtrader回测结果总是不准?

量化交易数据处理的三大陷阱&#xff1a;为什么你的回测结果总是失真&#xff1f; 在量化交易的世界里&#xff0c;数据质量往往决定了策略的生死。许多交易员花费数月时间精心打磨策略&#xff0c;却在回测阶段遭遇滑铁卢——不是策略逻辑有问题&#xff0c;而是基础数据出了差…...

AI编程新范式:UNIT-00:Berserk Interface结对编程实践与效果评估

AI编程新范式&#xff1a;UNIT-00&#xff1a;Berserk Interface结对编程实践与效果评估 最近几个月&#xff0c;我一直在尝试一种新的编程方式&#xff1a;和AI结对编程。听起来有点科幻&#xff0c;但实际体验下来&#xff0c;感觉就像身边多了一个不知疲倦、知识渊博的编程…...

Qwen3-ASR-0.6B效果展示:儿童语音(发音不标准+语速快)识别准确率实测

Qwen3-ASR-0.6B效果展示&#xff1a;儿童语音&#xff08;发音不标准语速快&#xff09;识别准确率实测 1. 测试背景与目的 语音识别技术在日常生活中的应用越来越广泛&#xff0c;从智能助手到在线教育&#xff0c;都离不开准确的语音转文字功能。但在实际使用中&#xff0c…...

四机两区风储调频建模踩坑实录

四机两区 风储虚拟惯量调频仿真simulink建模复现&#xff08;附带参考文献 【风力发电&#xff1b;储能&#xff1b;频率特性&#xff1b;惯性调节&#xff1b;变桨距控制】最近在复现风储联合调频的Simulink模型时&#xff0c;发现虚拟惯量这块的水比想象的深。特别是把风电和…...

基于CNN-LSTM的的锂离子电池健康状态SOH估计; 主要算法如下: 1、首先提取放电电压最...

基于CNN-LSTM的的锂离子电池健康状态SOH估计&#xff1b; 主要算法如下: 1、首先提取放电电压最低点时间 平均放电电压 平均放电温度作为锂电池间接健康因子&#xff1b; 2、然后建立CNN-LSTM联合模型的SOH锂电池健康状态评估模型。 3、最后 NASA 卓越预测中心的锂电池数据集 B…...

[电池SOC估算案例]: 使用Bilstm网络来实现锂电池SOC估计的算法(基于matlab编...

[电池SOC估算案例]: 使用Bilstm网络来实现锂电池SOC估计的算法&#xff08;基于matlab编写&#xff09; 1.使用锂离子电池间隔恒流放电数据集来完成&#xff0c;可更换恒流放电数据 2.提取电池的恒流充电放电中的电流与电压变量作为健康特征。 3.使用Bilstm网络来建立电池的SOC…...

Hensoldt 与 UMS 签署 GaN 供应协议

该协议旨在确保用于 Spexer 雷达系列设备的供应德国国防公司 Hensoldt 已与 United Monolithic Semiconductors (UMS) 签署了一项长期供应协议。到 2030 年&#xff0c;UMS 将为 Hensoldt 雷达提供总计 90 万个 GaN&#xff08;氮化镓&#xff09;半导体组件。GaN 半导体用于现…...

意法半导体扩展 800 VDC 电源转换产品组合

12V、6V 解决方案补充了现有的 800 VDC 至 50V 中间级解决方案意法半导体&#xff08;STMicroelectronics&#xff09;扩展了其 800 VDC 电源转换产品组合&#xff0c;推出了两种新架构&#xff1a;800 VDC 转 12V 和 800 VDC 转 6V。这些新的电源转换级是根据 NVIDIA 800 VDC …...