当前位置: 首页 > article >正文

all-in-rag零散的笔记(自存/持续更新)

2026.3.17原文说的很详尽写这么一篇只是为了让自己背的更顺。------1.让代码只输出contentprint(answer.content)补充其中answer llm.invoke(prompt.format(questionquestion, contextdocs_content))该代码先把question问题和docs_content上下文 / 参考文档填充到预设的prompt提示词模板中再调用大语言模型llm处理填充后的提示词最终将模型返回的结果赋值给answer变量。format方法会把实际的question和docs_content替换到占位符位置生成最终发给模型的完整提示词。例若prompt 基于{context}回答问题{question}question什么是PythoncontextPython是编程语言格式化后得到基于Python是编程语言回答问题什么是Python。llm.invoke(...)invoke是 LangChain 框架中统一的模型调用方法接收格式化后的提示词向模型发送请求并获取返回结果。2.修改Langchain代码中RecursiveCharacterTextSplitter()的参数chunk_size和chunk_overlap观察输出结果有什么变化。chunk_size每个块的目标大小chunk_overlap 每个块之间重叠个字符以缓解语义割裂未修改前输出结果修改后的输出结果其中chunk_size5000, chunk_overlap500总结一、1. 默认参数chunk_size4000, chunk_overlap200输出列举了 8 个例子包括走迷宫、象棋、股票管理、雅达利游戏、Pong游戏、21点、自动驾驶、MountainCar-v0。特点覆盖了文章的主要部分例子比较全面。2. 小参数chunk_size1000, chunk_overlap100输出列举了 3 大类共 10 个例子包括探索与利用的例子选择餐馆、做广告、挖油、玩游戏、强化学习具体应用的例子DeepMind 走路的智能体、机械臂抓取、OpenAI 的机械臂翻魔方、Gym 库交互的例子MountainCar-v0。特点更聚焦于文章的后半部分特别是探索与利用的例子。3. 大参数chunk_size5000, chunk_overlap500输出列举了 3 大类共 9 个例子包括自然界与生活领域羚羊、股票交易、电子游戏雅达利的 Pong 游戏、雅达利的 Breakout 游戏、Gym 库中的具体环境Taxi-v3、Acrobot、CartPole-v0、MountainCar-v0。特点覆盖了文章的前半部分特别是自然界和游戏的例子。二、chunk_size 影响增大如从 50→100文本块数量减少单个块更长减少分割次数但可能包含过多无关内容减小如从 50→20文本块数量剧增单个块更短分割更细但可能导致语义碎片化比如 “Langchain” 被拆成两半。chunk_overlap 影响增大如从 10→20相邻块重叠内容更多上下文连贯性更好但会重复处理字符增加冗余减小如从 10→0无重叠文本块更 “独立”但可能断裂语义比如 “帮助开发者” 只出现在第一块第二块直接从 “快速构建” 开始。chunk_size决定文本块的长度上限值越大块数越少、单块越长值越小块数越多、单块越短。chunk_overlap决定文本块的上下文连贯性值越大重叠越多、连贯性越好但冗余增加值越小重叠越少、冗余降低但可能语义断裂。这个例子更直观一点 正常参数 (chunk_size50, chunk_overlap10) 第1块字符数50Langchain是一个强大的大语言模型应用开发框架它提供了丰富的组件和工具帮助开发者 第2块字符数49开发者快速构建基于LLM的应用程序。无论是文本处理、链调用还是代理开发Langchain都能提 第3块字符数24能提供便捷的解决方案。 增大chunk_size (chunk_size100, chunk_overlap10) 第1块字符数99Langchain是一个强大的大语言模型应用开发框架它提供了丰富的组件和工具帮助开发者快速构建基于LLM的应用程序。无论是文本处理、链调用还是代理开发Langchain都能提 第2块字符数24能提供便捷的解决方案。 减小chunk_size (chunk_size20, chunk_overlap10) 第1块字符数20Langchain是一个强大的大语言 第2块字符数20大语言模型应用开发框架它提供了 第3块字符数20它提供了丰富的组件和工具帮助开 第4块字符数20工具帮助开发者快速构建基于LLM 第5块字符数20于LLM的应用程序。无论是文本处理 第6块字符数20文本处理、链调用还是代理开发Lan 第7块字符数20代理开发Langchain都能提供便捷 第8块字符数13供便捷的解决方案。 增大chunk_overlap (chunk_size50, chunk_overlap20) 第1块字符数50Langchain是一个强大的大语言模型应用开发框架它提供了丰富的组件和工具帮助开发者 第2块字符数50帮助开发者快速构建基于LLM的应用程序。无论是文本处理、链调用还是代理开发Langchain 第3块字符数24能提供便捷的解决方案。 减小chunk_overlap (chunk_size50, chunk_overlap0) 第1块字符数50Langchain是一个强大的大语言模型应用开发框架它提供了丰富的组件和工具帮助开发者 第2块字符数39快速构建基于LLM的应用程序。无论是文本处理、链调用还是代理开发Langchain都能提供 第3块字符数24能提供便捷的解决方案。2.数据加载部分抽取文本-抽取关键信息作为元数据-转换成统一数据结构Unstructured 库加载并解析一个PDF文件from unstructured.partition.auto import partitionelements partition(filenamepdf_path,content_typeapplication/pdf)3.文本分块直接分分割号分语义分文档结构分←一般组合使用总结各个切块的步骤直接分块固定长度分块① 设定固定字符 / 词数长度阈值② 从文本开头按阈值逐段硬切割③ 不考虑语义、标点直接拆分④ 输出分块结果分割号分块分隔符分块① 定位分隔符标点、换行、分隔线、特殊符号等② 以分隔符作为分块边界③ 按边界位置拆分文本④ 清理冗余内容后输出分块语义分块逻辑分块① 识别文本话题、句意、逻辑边界② 按语义完整独立原则划分③ 合并零散短句、拆分过长段落④ 输出语义连贯的分块文档结构分块① 解析文档层级标题、章节、段落、列表等② 按结构标签一级 / 二级标题、正文段划分③ 遵循文档原有结构边界分块④ 保留结构关系输出结构化分块其中语义分块句子分割-上下文感知嵌入-计算语义距离-识别断点-合并成块中langchain_experimental.text_splitter.SemanticChunker 通过buffer_size参数默认为1来捕捉上下文信息。对于列表中的每一个句子这种方法会将其与前后各buffer_size个句子组合起来然后对这个临时的、更长的组合文本进行嵌入。然后计算每对相邻句子的嵌入向量之间的余弦距离。这个距离值量化了两个句子之间的语义差异——距离越大表示语义关联越弱跳跃越明显。余弦距离的发现者真伟大。。。4.实践使用partition_pdf替换当前partition函数并分别尝试用hi_res和ocr_only进行解析观察输出结果有何变化。修改前解析完成: 5 页, 7956 字符 第一页内容: 进⼊词条 全站搜索检索增强生成 帮助 近期有不法分子冒充百度百科官方人员以删除词条为由威胁并敲诈相关企业。在此严正声明百度百科是免费编辑平台绝不存在收费代编服务请勿上当受骗详情 检索增强生成播报 锁定 讨论1 上传视频 ⼤模型前沿技术之⼀ 展开2个同名词条 一分钟了解检索增强生成一分钟了解检索增强生成01:2201:22 RAG 当下大模型应用落地的必杀技RAG 当下大模型应用落地的必杀技02:2302:23 查 中国科学院大学计算机科 中国科学院大学计算机科 术学院是 201... 权威合作编辑 ⽬录 同义词RAG⼤模型内化吸收知识的过程⼀般指检索增强⽣成 本词条由中国科学院大学计算机科学与技术学院、中国科学院计算技术研究所 参与编辑并 审核经科普中国 · 科学百科认证 。 历史沿革 播报 技术定义 播报 检索增强生成 Retrieval-augmented Generation 简称 RAG 是当下热门的大模型 前沿技术之一 [1]。 检索增强生成模型结合了语言模型和信息检索技术。具体来说当模型需要生成文本或者回答问题时它会先从一个庞大的 文档集合中检索出相关的信息然后利用这些检索到的信息来指导文本的生成从而提高预测的质量和准确性 [2]。

相关文章:

all-in-rag零散的笔记(自存/持续更新)

2026.3.17原文说的很详尽,写这么一篇只是为了让自己背的更顺。------1.让代码只输出content?print(answer.content)补充:其中,answer llm.invoke(prompt.format(questionquestion, contextdocs_content))该代码先把 question&…...

COMSOL煤矿模型仿真合集:‘瓦斯抽采与热流固耦合、采空区耦合性分析、倾斜煤层下的采空区参数...

comsol煤矿模型仿真合集 comsol煤矿(地下水流)模型整理合集, 1.图1-2为瓦斯抽采热流固耦合,采用固体力学、达西和多孔介质传热研究瓦斯抽采下煤层温度、应力、瓦斯渗流的变化情况。 2.图3-4为采空区耦合性分析,贴合一篇…...

AI聊天机器人安全漏洞:暴力诱导与风险警示

AI聊天机器人暴力诱导事件时间线与影响规模近期,一个倡导组织公布了对10款人工智能聊天机器人的研究结果。自去年11月至12月进行测试后,几家聊天机器人制造商称已做出改进以提升安全性。今日,与CNN记者合作开展研究的反数字仇恨中心&#xff…...

目前主流AI绘画工具排名,功能参数全对比

本文对2026年主流AI绘画工具进行功能维度的详细盘点,包括核心功能、技术参数、模型生态、价格等,供开发者和专业用户参考选型。一、主流AI绘画工具概览工具开发方核心技术部署方式访问方式MidjourneyMidjourney Inc.自研模型SaaS需海外访问Stable Diffus…...

MySQL分库分表的实现(二)--水平分表

本文介绍下使用Sharding-JDBC实现水平分表 Sharding-JDBC是轻量级的 java 框架,是增强版的 JDBC 驱动,使用Sharding-JDBC可以简化对分库分表之后数据相关操作。下面分别介绍下水平分表的方法。 1、准备好数据库和数据表 先创建一个course_db数据库,然…...

B2B战略咨询在行业竞争中实现差异化突围

在激烈的行业竞争中,B2B战略咨询发挥了重要作用。通过创新解决方案和个性化服务,企业能够实现显著的差异化,从而提升市场竞争力。咨询公司首先需要进行深入的市场需求分析,以识别客户的真实需求和痛点。这一过程帮助企业围绕客户体…...

第七届人工智能、网络与信息技术国际学术会议(AINIT 2026)

第七届人工智能、网络与信息技术国际学术会议(AINIT 2026)将于2026年5月15-17日在中国大连举行。本届会议将主要关注人工智能、网络与信息技术面临的新的挑战问题和研究方向,着力反映国际人工智能、网络与信息技术相关技术研究的最新进展。大…...

3·15曝光后深度解析:AI“投毒”与幻觉乱象,GEO技术困局与破局之道

2026年央视315晚会曝光的GEO(生成式引擎优化)黑产,给所有AI领域技术从业者(程序员、算法工程师、数据工程师等)敲响了警钟——批量虚假信息“投毒”污染大模型,导致多个主流大模型在“2026年315晚会”这一基…...

小龙虾时代:用于安全连接——内网穿透工具Tailscale 实用手册

Tailscale 在linux Windows 场景下的使用***这里的linux以ubuntu为例,mac同理适合: 你有一台 Ubuntu 桌面机(比如养小龙虾放资料)你想从 Windows 安全地连接过去你把 安全 放在第一位你希望这份说明能 拿来就用1. Tailscale 到底是…...

担心 openclaw 软件带毒?域卫 Yvevos 帮你一键系统级隔离风险

高权限软件运行的最佳解决方案在日常工作中,OpenClaw 是一款功能强大的工具,但它需要接管操作系统所有权限。这也导致了很多兄弟不敢用,心里直打鼓:“万一这个软件带毒怎么办?它权限这么大,会不会把我的主机…...

8.3负载生成工具

8.3 负载生成工具 实时性测试不仅要满足系统空载或低负载时的时延要求,还必须满足高负载情况下的时延要求。 通过负载生成工具模拟高负载场景进行压力测试,是评估实时系统在高负载情况下的稳定性和可靠性的有效手段。 压力测试是一种破坏性的测试&…...

vue-django flask+uniapp 小程序 特色农产品商城购物交易系统

目录技术选型与架构设计核心功能模块关键技术实现测试与部署扩展性设计项目技术支持可定制开发之功能创新亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作技术选型与架构设计 前端框架:UniApp(跨端开发&#xff…...

五相svpwm调制。 (五相永磁同步电机矢量控制,相邻四矢量,二矢量,文档说明+)

五相svpwm调制。 (五相永磁同步电机矢量控制,相邻四矢量,二矢量,文档说明)五相电机的矢量舞蹈比三相系统有趣得多。当我们把传统的三相桥臂拓展到五相时,电压矢量的分布从六边形变成了十边形,就…...

晶振激励功率和负性阻抗实测及计算方法

尽管在晶振振荡电路设计之前,我们都会从IC方案中获取晶振相关信息,如晶振封装、频率、频差、负载电容、工作电压等,但在晶振实际电路应用中,我们却会遇到一些具体问题,比如按照BOM采购晶振,在电路板上电后&…...

Kotlin的reified泛型:在运行时保留类型信息

Kotlin的reified泛型:在运行时保留类型信息 在Java的泛型系统中,类型擦除是一个广为人知的限制——泛型类型信息在编译后会被擦除,导致运行时无法直接获取类型参数的具体信息。Kotlin通过reified关键字打破了这一限制,允许开发者…...

英语基础输入提升指南

英语基础输入提升指南 目标人群:出国旅游基础对话、日常看懂基础英文(路牌、菜单、简单新闻) 核心原则:i1 理论(材料难度略高于当前水平,但可理解) 生成时间:2026-03-17&#x1f4cc…...

飞函如何把即时通讯、会议和云盘真正做成一体化协同底座

很多企业已经配置了不少“协同工具”:一个聊天软件、一个会议系统、一个网盘,再加上 OA、ERP、CRM 等业务系统。表面看功能齐全,实际落地时却经常出现同一个问题: 沟通、决策、文件和执行是分开的。 研发在群里讨论需求,会议里敲定…...

Spring的@Configuration注解:深入解析与实战指南

Spring的Configuration注解:深入解析与实战指南 在Spring框架中,Configuration注解是一个非常重要的注解,用于标记一个类为配置类。配置类用于定义和管理Spring容器中的Bean。本文将深入探讨Configuration注解的使用,帮助你更好地…...

保姆级STM32CubeMX入门攻略(CSDN博客版)

一、下载前准备:避坑清单先收好1. 拒绝第三方资源:别信“百度网盘破解版”“精简版”,不仅有病毒风险,还会缺固件包,安装后报错找不到芯片; 2. 必备环境:STM32CubeMX基于Java开发,需…...

CC工具箱使用指南:【查找面要素的狭窄部位】

一、简介 之前做过一个查找狭窄面的工具,只是针对整体面的一个判断。 但是如果一个面只是一个角存在狭窄的区域,就很难判断: 这种情况下,要这个狭窄区域找出来是很有必要的,于是就做了这个工具。 注意,这…...

3分钟搞定!OpenClaw 龙虾 + Kimi 联网搜索,小白也能上手

哈喽,大家好!我是阿星👋龙虾本身是没有搜索能力的。你可以利用tavily search skills搜索,也可以用openclaw的brave search websearch tool 进行搜索(后者是要钱的,前者可能有点时效问题)。国内新…...

【程序员转型】开发者转型成为 AI 工程师指南,大模型入门到精通,收藏这篇就足够了!

本文为开发者转型 AI 工程师提供了必备技能与职业路径的全面指南。 AI 工程师的需求前所未有地高涨,成为科技领域增长最快的职业之一。该岗位融合了传统软件开发与机器学习能力,对开发者而言既是机遇,也是现有编程技能的自然进化。你可以在此…...

Git误删急救:30秒拯救你的代码

Git误操作急救手册大纲常见误操作场景误删文件或代码未提交的本地修改被删除已提交的文件被误删误提交或提交错误内容提交了敏感信息(如密码、密钥)提交了错误文件或大文件分支操作失误误删分支(本地或远程)强制推送导致历史覆盖撤…...

大模型联网难题破解!数眼智能(DataEyes)全解析,5分钟解锁实时数据能力

ChatGPT、文心一言、Gemini等大模型落地AI项目时,普遍面临“实时信息获取难、网页数据提取杂、合规使用有风险”的困境,而过时信息、杂乱数据往往让AI应用实用性大打折扣。数眼智能(DataEyes)的核心价值,就是为大模型补…...

搞定2026年生鲜促销图,我的经验是别直接套模板

搞定2026年生鲜促销图,我的经验是别直接套模板我是生鲜电商店铺的运营,上周老板让我负责新品豇豆的推广,要求在周三下午之前做一张吸引人的线上促销海报。这是一个急活,但我自己用手机拍的几张豇豆照片,背景杂乱&#…...

语义之战:微软与帕兰提尔(Palantir)为何争夺你的企业本体(Ontology)

跳出数据湖与大模型:为何“意义层”成为智能体 AI 与业务主权的新前线一场无声的圈地运动正在上演。争夺的不是你的云预算,不是算力,而是决定自主 AI 智能体如何理解你数据含义的语义层。谁掌控了这层翻译层,谁就有权把企业决策直…...

TMC2208控制步进电机

系列文章目录 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录系列文章目录前言一、两相四线步进电机基本介绍&#xff1f…...

vue表格vxe-table实现表头合并,分组表头自定义合并

在开发后台管理系统时,经常会遇到需要展示复杂表格的场景,其中表头合并(多级表头、不规则合并)是一项常见需求。vxe-table 是一款功能强大的 Vue 表格组件,它不仅支持树形分组表头,还提供了自定义列头合并的…...

【AI】----java的 大模型提示词 prompt ,代码输出提示规范

java的 大模型提示词 prompt ,代码规范■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■提示词■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■…...

金仓数据库在MySQL迁移中的技术观察:兼容性、性能与一体化部署实践

金仓数据库在MySQL迁移中的技术观察:兼容性、性能与一体化部署实践 在数字化转型持续深化的当下,企业对数据基础设施的稳定性、可维护性与成本效益提出了更高要求。面对传统商业数据库授权费用持续走高、技术路线受制于人、运维复杂度日益增加等现实挑战…...