记录些LangChain相关的知识
RAG的输出准确率
RAG的输出准确率 = 向量信息保留率 * 语义搜索准确率 * LLM准确率
RAG的输出准确率由三个因素共同决定:向量信息保留率、语义搜索准确率以及LLM准确率。这三个因素是依次作用的,因此准确率实际上是它们的乘积。这意味着,任何一个环节的不完美都会影响到整体的准确率。
目前,针对RAG的优化工作主要集中在以下三个方面:
- 通过COT等方法提高LLM对问题的理解程度。
- 使用sentence window retrive、rerank等技术来提高语义搜索的准确率。
- 通过精心选择和优化embedding算法,以最大程度保留原始数据的信息。
然而,由于最终准确率是这三个因素准确率的乘积,即使我们将每个环节的准确率都优化到90%,最终的准确率也只能达到72%。因此,提高RAG的输出准确率需要我们在每一个环节都进行深入优化,以实现整体的提升。
RAG高级检索策略
依赖于嵌入的余弦相似性进行检索的方法效果有限。许多人在LangChain中实现了更高级的检索策略,这些策略在LangChain中被广泛采用和记录。
然而,我们发现最常用的检索策略并非LangChain内置的,而是用户自定义的策略。这反映出在LangChain中实现自定义检索策略是相对简单的,同时也说明为了达到最优性能,往往需要开发特定的逻辑。
此外,我们还注意到了一些熟悉的策略名称:
- Self Query:从用户的问题中提取元数据过滤器。
- Hybrid Search:主要通过Supabase和Pinecone等提供商的集成来实现。
- Contextual Compression:对基本检索结果进行后处理。
- Multi Query:将单个查询拆分为多个查询,并检索所有查询的结果。
- TimeWeighted VectorStore:为最近的文档赋予更高的优先级。
这些策略的出现表明,为了提高检索效果,人们正在不断地探索和实施创新的解决方案。
LangGraph协作
主要控制状态转换的因素是「路由器」,但它是一个基于规则的路由器,因此相当简单。基本上,在每次LLM调用之后,它会查看输出。如果调用了工具,则调用该工具。如果没有调用工具且LLM响应“最终答案”,则返回给用户。否则(如果没有调用工具且LLM未响应“最终答案”),则转到另一个LLM。
在LangGraph协作中,控制状态转换的关键组件是「路由器」,它基于规则进行操作,因此设计相对简单。其工作流程大致如下:每次语言模型(LLM)被调用后,路由器会检查其输出内容。如果LLM指示需要调用某个工具,那么路由器就会执行这一工具调用。如果LLM的输出是一个“最终答案”且没有指示调用工具,那么这个答案就会被返回给用户。如果LLM的输出既没有指示调用工具,也没有提供“最终答案”,那么路由器会将任务转发给另一个LLM进行进一步处理。
Neo4j-图数据库AI助手
在业界,利用语言模型(LLMs)生成Cypher查询语句已经变得非常普遍。这种方法显著增加了数据提取的灵活性。然而,经验表明,直接依赖LLMs生成Cypher语句可能会遇到稳定性和准确性方面的问题。
为了解决这些挑战,我们探索了一种新的策略,旨在确保操作的稳定性和高度一致性。我们提出的方法是让LLM不再直接创建Cypher语句,而是根据用户的指令,从提供的信息中识别和提取参数。接着,这些参数被用来填充预定义的函数或现有的Cypher模板,以生成准确的查询。
Agents自省
基础自省
在Agents自省的场景中,我们采用了基础自省的方法,涉及到两个语言模型的互动:一个是生成器,另一个是自省者。生成器的角色是直接回答用户的查询,而自省者则承担起指导者的责任,对生成器的初步回答提供有益的评估和指导。
这一互动过程会经历几个循环,直至最终提供一个经过优化的答案。
Reflexion
在Agents自省的领域,Shinn等人开发的Reflexion框架通过口头反馈和自我反思来促进学习。该框架中,执行者负责对每次生成的响应进行深入分析,并利用外部数据提供支持。执行者被要求提供引文作为证据,并明确指出响应中的重复内容和缺失信息,这样的自省过程不仅具有建设性,还能指导生成器根据反馈进行相应的改进。
在我们的示例中,我们在达到一定步骤后停止了自省过程。然而,你也可以选择让自省语言模型自行决定何时结束这一过程。
代理循环的概述如下:
执行者概述
在每一步的执行过程中,回答者的任务是提供答案,并执行一系列的搜索查询作为补充操作。紧接着,审稿者需要对当前的情况进行反思和评估。这一逻辑可以通过LangGraph框架来定义。
语言代理树搜索
在Agents自省的领域,Zhou等人研发的语言代理树搜索(LATS)是一种创新算法,它整合了自省评估和搜索架构,尤其是蒙特卡洛树搜索。该算法基于标准的强化学习(RL)任务框架,并采用语言模型来替代传统RL代理、价值函数和优化器,这样做显著提升了处理复杂任务的能力,并有效避免了陷入重复的行为模式。
搜索过程分为以下四个主要步骤:
- 选择:基于后续步骤产生的综合奖励,挑选出最佳行动方案。当找到解决方案或达到最大搜索深度时,会直接给出响应;若没有,则继续搜寻。
- 扩展和模拟:预设生成 N 个可能采取的行动(本例中为 5 个),并同时执行这些行动。
- 反思和评价:观察这些行动产生的结果,并依据反思(也可能包含外部反馈)对其做出评价。
- 反向传播:根据行动结果更新初始轨迹的评分。
如果智能体拥有一个有效的反馈环,基于环境奖励或可靠的自省得分,那么它就可以确切区分不同的行动轨迹,并选择更佳路径。最终选定的路径可以保存在外部记忆中,或者用于模型的微调,提升未来的性能表现。
“选择”步骤会选择具有最高上限置信区间(UCT)的节点,该步骤平衡了预期奖励与探索新途径的动机。
通过查阅代码,可以了解具体实现方式。在 LangGraph 的实现中,我们将生成和自省步骤归于同一节点,并且每一次循环时都会检查任务状态,以判断任务是否已被成功解决。
LATS 将诸如 Reflexion、思想树和计划执行等其他代理架构中的推理、规划、自省组件结合起来。通过对自省和环境反馈的逆向传播,LATS 优化了搜索流程。尽管它对奖励分数可能较为敏感,但总体来说,这个算法可以灵活地应用于多种任务。
与其他代理架构的对比图
RAG数据抽取服务
明确抽取需求
为了确保语言模型(LLM)有效地抽取信息,我们需要清楚地指导它我们想要什么。明确需求包括三个核心部分:
- 描述你希望抽取的数据结构的模式(Schema)。
- 提供包含抽取背景和指示的命令(Prompt)。
- 展示文本信息抽取的实例样本(Reference examples)。
实现过程
理解了这些组成部分后,我们需要了解如何使它们协同工作。我们将分享两个简单但有效的方法。
- 首先,确保LLM以正确的格式回应至关重要。仅仅在命令中指示LLM输出JSON格式可能不足以确保一致性。因此,采用函数调用已经成为一种新的、相对可靠的方法来确保LLM严格按照特定格式输出。我们建议使用这种方法来提高性能。
可以查阅结构化输出文档,其中LangChain API的高级视图展示了不同LLM如何调用工具和函数。
- 另一个提高性能的方法是使用参考样本。尽管可以不使用样本来设置抽取问题,但我们发现,在实际应用中,提供输入和相应输出的样本通常非常有帮助。有时,这些样本比指令本身更能有效地指导LLM处理特定情况。
LangChain 数据抽取文档:https://python.langchain.com/docs/use_cases/extraction
信息检索的能力边界
随着人工智能模型处理能力的提升,它们能够有效处理的上下文信息量也在不断增加,现在已能处理达到百万级别的词汇量。这种能力使得大型语言模型(LLMs)对长上下文文本的研究兴趣日益浓厚。在这类模型的研究中,一种广泛采用的方法是将一个事实(被称为“针”)嵌入到大量的上下文信息(被称为“干草堆”)中,随后测试模型是否能够在这些上下文中定位并回答与该事实相关的问题。这种测试方法使我们能够评估并洞察模型在处理长文本和信息检索方面的能力极限。
相关文章:

记录些LangChain相关的知识
RAG的输出准确率 RAG的输出准确率 向量信息保留率 * 语义搜索准确率 * LLM准确率RAG的输出准确率由三个因素共同决定:向量信息保留率、语义搜索准确率以及LLM准确率。这三个因素是依次作用的,因此准确率实际上是它们的乘积。这意味着,任何一…...

C语言例4-7:格式字符f的使用例子
%f,实型,小数部分为6位 代码如下: //格式字符f的使用例子 #include<stdio.h> int main(void) {float f 123.456;double d1, d2;d11111111111111.111111111;d22222222222222.222222222;printf("%f,%12f,%12.2f,%-12.2f,%.2f\n&qu…...
[蓝桥杯 2019 省 A] 修改数组
题目链接 [蓝桥杯 2019 省 A] 修改数组 题目描述 给定一个长度为 N N N 的数组 A [ A 1 , A 2 , A 3 , . . . , A N ] A [A_1, A_2, A_3, ...,A_N] A[A1,A2,A3,...,AN],数组中有可能有重复出现的整数。 现在小明要按以下方法将其修改为没有重复整数的…...

Git基础(25):Cherry Pick合并指定commit id的提交
文章目录 前言指定commit id合并使用TortoiseGit执行cherry-pick命令 前言 开发中,我们会存在多个分支开发的情况,比如dev,test, prod分支,dev分支在开发新功能,prod作为生产分支已发布。如果某个时候,我们…...

C语言结构体之位段
位段(节约内存),和王者段位联想记忆 位段是为了节约内存的。刚好和结构体相反。 那么什么是位段呢?我们现引入情景:我么如果要记录一个人是男是女,用数字0 1表示。我们发现只要一个bit内存就可以完成我们想…...

2016年认证杯SPSSPRO杯数学建模D题(第二阶段)NBA是否有必要设立四分线全过程文档及程序
2016年认证杯SPSSPRO杯数学建模 D题 NBA是否有必要设立四分线 原题再现: NBA 联盟从 1946 年成立到今天,一路上经历过无数次规则上的变迁。有顺应民意、皆大欢喜的,比如 1973 年在技术统计中增加了抢断和盖帽数据;有应运而生、力…...

登录校验解决方案JWT
目录 🎗️1.JWT介绍 🎞️2.应用场景 🎟️3.结构组成 🎫4.JWT优点 🎠5.封装成通用方法 🛝6.JWT自动刷新 1.JWT介绍 官网:JWT官网 JSON Web Token (JWT) 是一个开放标准,它…...

Flutter开发进阶之瞧瞧BuildOwner
Flutter开发进阶之瞧瞧BuildOwner 上回说到关于Element Tree的构建还缺最后一块拼图,build的重要过程中会调用_element!.markNeedsBuild();,而markNeedsBuild会调用owner!.scheduleBuildFor(this);。 在Flutter框架中,BuildOwner负责管理构建…...
大量免费工具使用(提供api接口)
标题: 免费工具集使用 - 简化你的任务 介绍: 在数字化时代,我们经常需要使用各种工具来完成各种任务。本文将介绍一个免费工具集,它提供了多种实用工具,帮助简化你的任务。这些工具可以在网站 https://tool.kertennet.com 上找到…...

网络探测工具Nmap介绍
1. Nmap简介 Nmap是一款用于网络发现和安全审计的网络安全工具。可用于列举网络主机清单、管理服务升级调度、监控主机、监控主机服务运行状况、检测目标主机是否在线和端口开放情况、侦测运行的服务类型及版本信息、侦测操作系统与设备类型等。 2. 命令大纲 3. 命令详细介绍…...

20240319-2-机器学习基础面试题
⽼板给了你⼀个关于癌症检测的数据集,你构建了⼆分类器然后计算了准确率为 98%, 你是否对这个模型很满意?为什么?如果还不算理想,接下来该怎么做? 首先模型主要是找出患有癌症的患者,模型关注的…...
0202矩阵的运算-矩阵及其运算-线性代数
文章目录 一、矩阵的加法二、数与矩阵相乘三、矩阵与矩阵相乘四、矩阵的转置五、方阵的行列式结语 一、矩阵的加法 定义2 设有两个 m n m\times n mn橘子 A ( a i j ) 和 B ( b i j ) A(a_{ij})和B(b_{ij}) A(aij)和B(bij),那么矩阵A与B的和记为AB,规定为 A B ( a 11…...
python中的__dict__
类的__dict__返回的是:类的静态函数、类函数、普通函数、全局变量以及一些内置的属性都是放在类的__dict__里的, 而实例化对象的:__dict__中存储了一些类中__init__的一些属性值。 import的py文件 __dict__返回的是:__init__的…...
数学分析复习:无穷乘积
文章目录 无穷乘积定义:无穷乘积的收敛性命题:无穷乘积的Cauchy收敛准则正项级数和无穷乘积的联系 本篇文章适合个人复习翻阅,不建议新手入门使用 无穷乘积 设复数列 { a n } n ≥ 1 \{a_n\}_{n\geq 1} {an}n≥1,设对任意 …...
02 React 组件使用
import React, { useState } from react;// 定义一个简单的函数式组件 function Counter() {// 使用 useState hook 来创建一个状态变量 count,并提供修改该状态的函数 setCountconst [count, setCount] useState(0);// 在点击按钮时增加计数器的值const increment…...

你就是上帝
你就是上帝:Jv程序员,请你站在上帝或神的角度 1.万物皆有裂缝 按照西方文化(宗教神话,古希腊、古罗马等),上帝创建了人; 创建人之前,还创建了人的居所或地盘/栖息地(伊…...
Spring Cloud: openFegin使用
文章目录 一、OpenFeign简介二、Springboot集成OpenFeign1、引入依赖2、EnableFeignClients注解(1)应用(2)属性解析 3、 FeignClient(1)应用(2)属性解析(3)向…...

流畅的 Python 第二版(GPT 重译)(二)
第三章:字典和集合 Python 基本上是用大量语法糖包装的字典。 Lalo Martins,早期数字游牧民和 Pythonista 我们在所有的 Python 程序中都使用字典。即使不是直接在我们的代码中,也是间接的,因为dict类型是 Python 实现的基本部分。…...

Flutter 旋转动画 线性变化的旋转动画
直接上代码 图片自己添加一张就好了 import dart:math;import package:flutter/material.dart;import package:flutter/animation.dart;void main() > runApp(MyApp()); //旋转动画 class MyApp extends StatelessWidget {overrideWidget build(BuildContext context) {re…...

【Web应用技术基础】HTML(5)——案例1:展示简历信息
样式: 代码: <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>展示简历信息…...
后进先出(LIFO)详解
LIFO 是 Last In, First Out 的缩写,中文译为后进先出。这是一种数据结构的工作原则,类似于一摞盘子或一叠书本: 最后放进去的元素最先出来 -想象往筒状容器里放盘子: (1)你放进的最后一个盘子(…...
解锁数据库简洁之道:FastAPI与SQLModel实战指南
在构建现代Web应用程序时,与数据库的交互无疑是核心环节。虽然传统的数据库操作方式(如直接编写SQL语句与psycopg2交互)赋予了我们精细的控制权,但在面对日益复杂的业务逻辑和快速迭代的需求时,这种方式的开发效率和可…...

最新SpringBoot+SpringCloud+Nacos微服务框架分享
文章目录 前言一、服务规划二、架构核心1.cloud的pom2.gateway的异常handler3.gateway的filter4、admin的pom5、admin的登录核心 三、code-helper分享总结 前言 最近有个活蛮赶的,根据Excel列的需求预估的工时直接打骨折,不要问我为什么,主要…...

转转集团旗下首家二手多品类循环仓店“超级转转”开业
6月9日,国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。 转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。 据「TMT星球」了解,“超级…...
多模态商品数据接口:融合图像、语音与文字的下一代商品详情体验
一、多模态商品数据接口的技术架构 (一)多模态数据融合引擎 跨模态语义对齐 通过Transformer架构实现图像、语音、文字的语义关联。例如,当用户上传一张“蓝色连衣裙”的图片时,接口可自动提取图像中的颜色(RGB值&…...

k8s业务程序联调工具-KtConnect
概述 原理 工具作用是建立了一个从本地到集群的单向VPN,根据VPN原理,打通两个内网必然需要借助一个公共中继节点,ktconnect工具巧妙的利用k8s原生的portforward能力,简化了建立连接的过程,apiserver间接起到了中继节…...
Caliper 配置文件解析:config.yaml
Caliper 是一个区块链性能基准测试工具,用于评估不同区块链平台的性能。下面我将详细解释你提供的 fisco-bcos.json 文件结构,并说明它与 config.yaml 文件的关系。 fisco-bcos.json 文件解析 这个文件是针对 FISCO-BCOS 区块链网络的 Caliper 配置文件,主要包含以下几个部…...

九天毕昇深度学习平台 | 如何安装库?
pip install 库名 -i https://pypi.tuna.tsinghua.edu.cn/simple --user 举个例子: 报错 ModuleNotFoundError: No module named torch 那么我需要安装 torch pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple --user pip install 库名&#x…...

人工智能(大型语言模型 LLMs)对不同学科的影响以及由此产生的新学习方式
今天是关于AI如何在教学中增强学生的学习体验,我把重要信息标红了。人文学科的价值被低估了 ⬇️ 转型与必要性 人工智能正在深刻地改变教育,这并非炒作,而是已经发生的巨大变革。教育机构和教育者不能忽视它,试图简单地禁止学生使…...

GraphQL 实战篇:Apollo Client 配置与缓存
GraphQL 实战篇:Apollo Client 配置与缓存 上一篇:GraphQL 入门篇:基础查询语法 依旧和上一篇的笔记一样,主实操,没啥过多的细节讲解,代码具体在: https://github.com/GoldenaArcher/graphql…...