当前位置: 首页 > article >正文

RAG 系列(十二):高级分块策略——Parent-Child 与 Contextual Retrieval

分块的两难困境RAG 系统里有一个经典矛盾:Chunk 太小:向量匹配精准,但返回给 LLM 的内容是片段,缺乏上下文,无法完整回答问题Chunk 太大:内容完整,但语义太分散,embedding 质量下降,检索命中率降低这不是调参能解决的问题,而是 Naive 分块的结构性缺陷。小块适合检索,大块适合生成——这两个需求本来就是矛盾的,用同一个尺寸的 chunk 同时满足两者,必然顾此失彼。本篇介绍两种突破这一困境的方案:Parent-Child Chunking:用小块做检索,命中后返回对应的大块Contextual Retrieval(Anthropic 方案):给每个 Chunk 加上文档上下文描述,让 embedding 更"聪明"Parent-Child Chunking核心思路索引阶段: 父文档(800字)→ 存储在 docstore(InMemoryStore) ↓ 切割 子 Chunk(200字)→ 存入向量库 检索阶段: query → 向量检索匹配子 Chunk(精准) → 找到子 Chunk 对应的父文档 → 返回父文档给 LLM(完整)检索用的是小 chunk,LLM 拿到的是大 chunk。两个需求,各自最优,互不干扰。代码实现LangChain 的ParentDocumentRetriever封装了这个逻辑:fromlangchain_classic.retrieversimportParentDocumentRetrieverfromlangchain_classic.storageimportInMemoryStorefromlangchain_text_splittersimportRecursiveCharacterTextSplitter child_splitter=RecursiveCharacterTextSplitter(chunk_size=200,# 小块:用于向量检索chunk_overlap=20,)parent_splitter=RecursiveCharacterTextSplitter(chunk_size=800,# 大块:命中后返回给 LLMchunk_overlap=50,)vectorstore=Chroma(collection_name="parent_child",embedding_function=embeddings)store=InMemoryStore()# 存储父文档的 docstoreretriever

相关文章:

RAG 系列(十二):高级分块策略——Parent-Child 与 Contextual Retrieval

分块的两难困境 RAG 系统里有一个经典矛盾: Chunk 太小:向量匹配精准,但返回给 LLM 的内容是片段,缺乏上下文,无法完整回答问题 Chunk 太大:内容完整,但语义太分散,embedding 质量下降,检索命中率降低 这不是调参能解决的问题,而是 Naive 分块的结构性缺陷。 小块适…...

从Photoshop钢笔到游戏角色建模:用Python手把手实现贝塞尔曲线(附完整代码)

从Photoshop钢笔到游戏角色建模:用Python手把手实现贝塞尔曲线(附完整代码) 在数字艺术和游戏开发领域,贝塞尔曲线无处不在。从Photoshop中流畅的钢笔工具路径,到3D游戏中角色服装的自然飘动,再到UI设计中优…...

保姆级教程:用PCL的ProgressiveMorphologicalFilter搞定机载LiDAR点云地面提取(附避坑指南)

从零掌握PCL渐进形态学滤波:机载LiDAR地面点提取实战指南 第一次处理机载LiDAR点云时,我盯着屏幕上密密麻麻的几百万个点发呆——如何从这团"星空"中准确分离出地面?传统高程阈值法在山丘区域误判严重,而手动分类又如同…...

SAP资产折旧别只记成本中心了!试试这招,让项目成本核算更清晰(附ACSET避坑点)

SAP资产折旧优化:从成本中心到WBS的精准核算实践 在SAP系统中,固定资产折旧的会计处理看似简单,却隐藏着影响企业项目管理精细度的关键细节。许多财务团队习惯性地将折旧费用全部归集到成本中心,这种"一刀切"的做法虽然…...

在CentOS 7虚拟机上部署ICC 2016:从安装器配置到环境调优全流程

1. 环境准备与依赖安装 在CentOS 7虚拟机上部署ICC 2016之前,我们需要做好充分的准备工作。我建议使用VMware或VirtualBox创建虚拟机,分配至少4GB内存和50GB硬盘空间。实测下来,这个配置能保证基本流畅运行,如果条件允许&#xff…...

QKeyMapper:Windows平台下无需重启系统的终极按键映射解决方案

QKeyMapper:Windows平台下无需重启系统的终极按键映射解决方案 【免费下载链接】QKeyMapper [按键映射工具] QKeyMapper,Qt开发Win10&Win11可用,不修改注册表、不需重新启动系统,可立即生效和停止。支持游戏手柄映射到键鼠&am…...

LinkSwift:免费网盘直链下载的终极解决方案

LinkSwift:免费网盘直链下载的终极解决方案 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘 / 迅雷…...

WeChatMsg终极指南:3步永久备份微信聊天记录,打造专属数字记忆库

WeChatMsg终极指南:3步永久备份微信聊天记录,打造专属数字记忆库 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/Git…...

Jasminum:为中文研究者量身打造的Zotero智能文献管理解决方案

Jasminum:为中文研究者量身打造的Zotero智能文献管理解决方案 【免费下载链接】jasminum A Zotero add-on to retrive CNKI meta data. 一个简单的Zotero 插件,用于识别中文元数据 项目地址: https://gitcode.com/gh_mirrors/ja/jasminum 在中文学…...

告别拥堵:用PressLight+RL实战优化城市主干道红绿灯,附Python仿真代码

智能交通信号优化实战:基于PressLight与强化学习的城市主干道控制 清晨七点半的城市主干道上,车辆排起长龙,司机们不耐烦地按着喇叭。这种场景在全球各大城市不断上演,而问题的核心往往在于传统交通信号系统的僵化响应。随着物联网…...

如何快速解锁QQ音乐加密文件:qmcflac2mp3完整使用指南

如何快速解锁QQ音乐加密文件:qmcflac2mp3完整使用指南 【免费下载链接】qmcflac2mp3 直接将qmcflac文件转换成mp3文件,突破QQ音乐的格式限制 项目地址: https://gitcode.com/gh_mirrors/qm/qmcflac2mp3 你是否遇到过这样的困扰?在QQ音…...

2026届学术党必备的五大AI辅助论文网站推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 智能写作辅助工具DeepSeek,于论文写作整个流程里能起到多维度的作用,…...

实战指南:如何用AKShare在3分钟内构建Python金融数据应用

实战指南:如何用AKShare在3分钟内构建Python金融数据应用 【免费下载链接】akshare AKShare is an elegant and simple financial data interface library for Python, built for human beings! 开源财经数据接口库 项目地址: https://gitcode.com/gh_mirrors/aks…...

深度解析:FramePack视频帧压缩技术的完整实践指南

深度解析:FramePack视频帧压缩技术的完整实践指南 【免费下载链接】FramePack Lets make video diffusion practical! 项目地址: https://gitcode.com/gh_mirrors/fr/FramePack FramePack是一项革命性的视频帧压缩技术,通过创新的神经网络架构实现…...

KMS_VL_ALL_AIO终极指南:一站式Windows与Office智能激活解决方案

KMS_VL_ALL_AIO终极指南:一站式Windows与Office智能激活解决方案 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO KMS_VL_ALL_AIO是一款功能强大的智能激活脚本工具,专为W…...

N_m3u8DL-RE:如何用现代下载工具解决流媒体下载三大技术难题?

N_m3u8DL-RE:如何用现代下载工具解决流媒体下载三大技术难题? 【免费下载链接】N_m3u8DL-RE Cross-Platform, modern and powerful stream downloader for MPD/M3U8/ISM. English/简体中文/繁體中文. 项目地址: https://gitcode.com/GitHub_Trending/…...

心理咨询医院暖心指南与真实案例分享

行业痛点分析长沙作为中西部核心城市,近年来心理疾病检出率呈上升趋势。据《2023年湖南省心理健康报告》显示,全市抑郁症患者基数已超45万人,精神心理疾病就诊人数年增速达12.7%。然而,部分患者因长期受“病耻感”困扰&#xff0c…...

构建AI增强的第二大脑:从知识管理到智能创造的实战指南

1. 项目概述:构建你的第二大脑AI助手 在信息爆炸的时代,我们每天都在被海量的文章、播客、笔记和想法淹没。你有没有过这样的经历:明明记得读过一篇非常有洞见的文章,但需要用到时却怎么也想不起具体内容,甚至连标题都…...

taotoken官方折扣活动下tokenplan套餐的性价比分析

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 taotoken官方折扣活动下tokenplan套餐的性价比分析 效果展示类,结合平台近期的官方折扣活动,客观分析选择不…...

Subnautica Linux兼容性终极指南:完整解决方案与性能调优

Subnautica Linux兼容性终极指南:完整解决方案与性能调优 【免费下载链接】dxvk Vulkan-based implementation of D3D8, 9, 10 and 11 for Linux / Wine 项目地址: https://gitcode.com/gh_mirrors/dx/dxvk 在Linux系统上畅玩《深海迷航》(Subnautica)是许多…...

如何利用Taotoken模型广场为你的特定应用场景选择性价比最优的模型

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 如何利用Taotoken模型广场为你的特定应用场景选择性价比最优的模型 为你的应用选择一个合适的大语言模型,往往需要在性…...

如何永久保存微信聊天记录?WeChatMsg完整指南带你一键备份

如何永久保存微信聊天记录?WeChatMsg完整指南带你一键备份 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we/W…...

AI智能体的开发及上线

将一个AI智能体(AI Agent)从构思推向市场,已形成了一套标准的技术开发与合规上线闭环。一、 AI智能体的开发阶段2026年的开发重心已从“写代码”转向“编排逻辑”。1. 架构设计:五大核心组件大脑:选择底座模型。通常根…...

SingleFile革命性方案:为什么传统网页保存方法注定失败,而单文件保存正在重新定义数字保存范式

SingleFile革命性方案:为什么传统网页保存方法注定失败,而单文件保存正在重新定义数字保存范式 【免费下载链接】SingleFile Web Extension for saving a faithful copy of a complete web page in a single HTML file 项目地址: https://gitcode.com/…...

Navicat Premium 试用期重置实践:3种技术方案深度解析

Navicat Premium 试用期重置实践:3种技术方案深度解析 【免费下载链接】navicat_reset_mac navicat mac版无限重置试用期脚本 Navicat Mac Version Unlimited Trial Reset Script 项目地址: https://gitcode.com/gh_mirrors/na/navicat_reset_mac 对于macOS平…...

Nintendo Switch存储管理终极指南:NxNandManager完全解决方案

Nintendo Switch存储管理终极指南:NxNandManager完全解决方案 【免费下载链接】NxNandManager Nintendo Switch NAND management tool : explore, backup, restore, mount, resize, create emunand, etc. (Windows) 项目地址: https://gitcode.com/gh_mirrors/nx/…...

Recaf Java字节码编辑器:快速上手与指令搜索实战指南

Recaf Java字节码编辑器:快速上手与指令搜索实战指南 【免费下载链接】Recaf The modern Java bytecode editor 项目地址: https://gitcode.com/gh_mirrors/re/Recaf Recaf是一款现代化的Java字节码编辑器,它简化了Java程序分析的复杂性&#xff…...

SITS议题征集窗口即将关闭:资深评审专家透露“隐藏加分项”——这3类提案优先加急评审

更多请点击: https://intelliparadigm.com 第一章:SITS大会技术论坛议题征集 SITS(Smart Infrastructure & Technology Summit)大会作为面向智能基础设施与前沿技术融合的年度旗舰活动,现面向全球开发者、研究员及…...

在Taotoken控制台清晰查看各模型用量与消费明细的实践

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在Taotoken控制台清晰查看各模型用量与消费明细的实践 对于使用多个大模型API的项目而言,清晰、及时地了解资源消耗情况…...

利用Taotoken透明计费与账单追溯功能优化项目成本管理

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 利用Taotoken透明计费与账单追溯功能优化项目成本管理 对于项目管理者或独立开发者而言,大模型API的调用成本常常是一个…...