当前位置: 首页 > news >正文

香港大学神作 LightRAG 横空出世!AI 检索生成系统革命,秒懂复杂信息,动态数据无所遁形!

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

微信订阅号|搜一搜:蚝油菜花

在这里插入图片描述

🚀 快速阅读

  1. LightRAG 是一种基于图结构索引和双层检索机制的检索增强生成系统,旨在提升大型语言模型在信息检索中的准确性和效率。
  2. 系统能捕捉实体间的复杂依赖关系,全面理解信息,处理具体和抽象查询,确保用户获得既相关又丰富的响应。
  3. LightRAG 具备快速适应新数据的能力,在动态环境中保持高效和准确,基于增量更新算法及时整合新数据,无需重建整个知识库。

正文(附运行示例)

LightRAG 是什么

LightRAG 是由香港大学研究团队开发的一种检索增强生成(Retrieval-Augmented Generation, RAG)系统。简单来说,这个系统通过结合图结构索引和双层检索机制,大大提高了大型语言模型在信息检索方面的准确性和效率。LightRAG 能很好地捕捉实体之间的复杂关系,全面理解信息,无论是具体还是抽象的查询都能处理,确保用户得到既相关又丰富的回答。此外,LightRAG 还能快速适应新数据,在动态环境中保持高效和准确,通过增量更新算法及时整合新数据,而无需重建整个知识库。

LightRAG 的主要功能

  • 增强信息检索: LightRAG 能结合外部知识源,提升大型语言模型在信息检索中的准确性和相关性。
  • 处理复杂查询: 系统能理解和处理涉及多个实体和复杂关系的查询。
  • 生成准确回答: 基于检索到的信息,生成与用户查询紧密相关的详细回答。
  • 适应动态数据: 快速整合新数据,确保系统在信息频繁更新的环境中保持准确性和时效性。
  • 提高检索效率: 通过优化的检索机制,减少检索时间和计算资源消耗。

LightRAG 的技术原理

  • 图结构索引: 使用图结构来索引文本数据,节点代表实体,边代表实体间的关系,这样可以更好地捕捉和表示复杂的依赖关系。
  • 双层检索系统: 结合低层次(具体实体和属性)和高层次(广泛主题和概念)的检索策略,满足不同类型的查询需求。
  • 增量更新算法: 当新数据到来时,系统会增量式地更新知识图谱,无需从头开始重建,提高了数据处理的效率。
  • 实体和关系提取: 利用大型语言模型识别文本中的实体和关系,生成键值对,优化检索过程。

如何运行 LightRAG

安装

  • 从源代码安装
cd LightRAG
pip install -e .
  • 从 PyPI 安装
pip install lightrag-hku

快速开始

  1. 设置 OpenAI API 密钥在环境变量中:export OPENAI_API_KEY="sk-...".
  2. 下载示例文本 “A Christmas Carol by Charles Dickens”
curl https://raw.githubusercontent.com/gusye1234/nano-graphrag/main/tests/mock_data.txt > ./book.txt
  1. 使用以下 Python 代码片段:
from lightrag import LightRAG, QueryParamrag = LightRAG(working_dir="./dickens")with open("./book.txt") as f:rag.insert(f.read())# 执行朴素搜索
print(rag.query("What are the top themes in this story?", param=QueryParam(mode="naive")))# 执行本地搜索
print(rag.query("What are the top themes in this story?", param=QueryParam(mode="local")))# 执行全局搜索
print(rag.query("What are the top themes in this story?", param=QueryParam(mode="global")))# 执行混合搜索
print(rag.query("What are the top themes in this story?", param=QueryParam(mode="hybird")))

四种搜索方式之间的区别

搜索方式描述适用场景
朴素搜索 (Naive)直接根据查询关键词进行搜索,不考虑实体间的关系。适用于简单、直接的查询,不需要深入理解实体间的关系。
本地搜索 (Local)在实体及其直接相邻的实体之间进行搜索,考虑实体间的基本关系。适用于需要理解实体间直接关系的查询,但不需要全局视角。
全局搜索 (Global)在整个知识图谱中进行搜索,考虑实体间的全局关系。适用于需要全局视角,理解实体间复杂关系的查询。
混合搜索 (Hybird)结合本地搜索和全局搜索的优点,既考虑实体间的直接关系,也考虑全局关系。适用于需要全面理解实体间关系的查询,适用于大多数场景。

批量插入

rag.insert(["TEXT1", "TEXT2",...])

增量插入

rag = LightRAG(working_dir="./dickens")with open("./newText.txt") as f:rag.insert(f.read())

资源

  • 项目官网:https://lightrag.github.io/?utm_source=ai-bot.cn
  • GitHub 仓库:https://github.com/HKUDS/LightRAG
  • arXiv 技术论文:https://arxiv.org/pdf/2410.05779

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

微信订阅号|搜一搜:蚝油菜花

相关文章:

香港大学神作 LightRAG 横空出世!AI 检索生成系统革命,秒懂复杂信息,动态数据无所遁形!

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦! 微信订阅号|搜一搜&…...

云栖实录 | 智能运维年度重磅发布及大模型实践解读

本文根据2024云栖大会实录整理而成,演讲信息如下: 演讲人: 钟炯恩 | 阿里云智能集团运维专家 张颖莹 | 阿里云智能集团算法专家 活动: 2024 云栖大会 AI 可观测专场 -智能运维:云原生大规模集群GitOps实践 2024 …...

Vue3中防止按钮重复点击的方式

本文列两种方式&#xff0c;推荐第一种&#xff0c;经过长时间测试第二种防止的还是会漏&#xff0c;这里也列一下 ①使用定时器&#xff08;推荐&#xff09; 判断3秒钟之内方法只能执行一次 <el-button click"handleClick" type"primary" :loading…...

windows主机重新安装zabbix agent提示please clear the previous agent registration

目录 1. Zabbix Agent1.1 错误提示 2. 解决方法2.1 管理员运行cmd2.2 可以正常安装 1. Zabbix Agent 1.1 错误提示 2. 解决方法 2.1 管理员运行cmd 输入 sc.exe delete “Zabbix Agent” 或者 sc.exe delete “Zabbix Agent 2” 如果成功会出现“[SC] DeleteService SUCCES…...

一个将.Geojson文件转成shapefile和kml文件的在线页面工具

最近需要读取.geojson格式的流域边界文件。在谷歌地球桌面版和globalMapper中均无法正常读取。下面我发现的一个在线的平台可以很好实现这一功能。 GeoJSON to SHP Converter Online - MyGeodata Cloud ❤️欢迎点赞收藏❤️...

Mamba学习笔记(1)——原理基础

文章目录 Mamba: Linear-Time Sequence Modeling with Selective State Spaces0 Abstract1 Introduction2 State Space Models3 Selective State Space Models3.1 Motivation: Selection as a Means of Compression3.2 Improving SSMs with Selection3.3 Efficient Implementat…...

linux应用

检查Python程序未运行则重新运行 entity_program定时杀掉进程重新运行 match_program定时检查是否运行&#xff0c;未运行则启动 (注意echo时间时&#xff0c;date和中间要有空格) #!/bin/bash# 检测的Python程序名称 entity_program"entity.py" match_program"…...

【千库网-注册安全分析报告】

前言 由于网站注册入口容易被黑客攻击&#xff0c;存在如下安全问题&#xff1a; 暴力破解密码&#xff0c;造成用户信息泄露短信盗刷的安全问题&#xff0c;影响业务及导致用户投诉带来经济损失&#xff0c;尤其是后付费客户&#xff0c;风险巨大&#xff0c;造成亏损无底洞…...

【LwIP源码学习3】TCP协议栈分析——数据接收流程

前言 本文介绍代码在lwip的tcp_in.c文件中&#xff0c;主要介绍TCP协议栈中数据的接收流程。 正文 1、一个正常的TCP数据&#xff0c;首先会传入到 tcp_input(struct pbuf *p, struct netif *inp)函数&#xff0c;其中指针p指向传入的数据流。 2、从数据流中获取TCP头部 …...

【bug】finalshell向远程主机拖动windows快捷方式导致卡死

finalshell向远程主机拖动windows快捷方式导致卡死 问题描述 如题&#xff0c;作死把桌面的快捷方式拖到了finalshell连接的服务器面板中&#xff0c;导致finalshell没有响应&#xff08;小概率事件&#xff0c;有时会触发&#xff09; 解决 打开任务管理器查看finalshell进…...

基于SpringBoot剧本杀管理系统 【附源码】

基于SpringBoot剧本杀管理系统 效果如下&#xff1a; 系统首页界面 系统注册页面 剧本信息详细页面 后台登录界面 管理员主界面 剧本信息界面 剧本预约界面 作者主界面 研究背景 随着现代社会生活节奏的加快&#xff0c;人们越来越渴望通过各种娱乐活动来释放压力和增进社交…...

Linux 命令 —— grep、tail、head、cat、more、less(查看日志常用命令)

文章目录 查看日志常用命令grep 命令tail 命令head 命令cat 命令more 命令less 命令 查看日志常用命令 grep tail、head、cat、more、less grep 命令 grep [options] PATTERN filename&#xff1a;查找日志文件中的 PATTERN 关键字&#xff0c;用于过滤/搜索的特定字符。PAT…...

知识见闻 - 美国连线杂志

https://www.wired.com/ WIRED 杂志是一份月刊&#xff0c;重点关注新兴技术如何影响文化、经济和政治。在快速变革的世界中&#xff0c;它已成为信息和思想的重要来源。 WIRED magazine is a monthly publication that focuses on how emerging technologies impact culture, …...

多线程的状态及切换流程

多线程的状态及切换流程 线程状态说明&#xff1a; 初始化&#xff08;Init&#xff09;&#xff1a;该线程正在被创建。就绪&#xff08;Ready&#xff09;&#xff1a;该线程在就绪列表中&#xff0c;等待 CPU 调度。运行&#xff08;Running&#xff09;&#xff1a;该线程…...

[Python学习日记-47] Python 中的系统调用模块—— os 与 sys

[Python学习日记-47] Python 中的系统调用模块 简介 os sys 简介 os 模块和 sys 模块提供了很多允许你的程序与操作系统直接交互的功能。下面将进行逐一介绍。 os 一、os.getcwd() 得到当前工作目录&#xff0c;即当前 Python 脚本工作的目录路径&#xff08;绝对路径&#…...

Linux系统——lvm逻辑卷

Linux系统——lvm逻辑卷 一、lvm逻辑卷1、lvm操作流程2、操作指令 二、逻辑卷操作1、创建逻辑卷1.1 /dev/cloud/openstack 5G xfs /cloud/openstack1.2 /dev/cloud/docker 10G ext4 /cloud/docker 2、逻辑卷扩容2.1 扩容流程2.2 需求一&#xff1a;扩容ext4文件系统的逻辑卷2.3…...

一键快捷回复软件助力客服高效沟通

双十一临近&#xff0c;电商大战一触即发&#xff01;在这个购物狂欢的热潮中&#xff0c;客服团队的效率至关重要。今天我要和大家分享一个非常实用的快捷回复软件&#xff0c;特别是为电商客服小伙伴们准备的。这款软件能够极大地提高你的工作效率&#xff0c;让你在处理客户…...

初识Linux之指令(二)

一&#xff1a;head指令 head 与 tail 就像它的名字一样的浅显易懂&#xff0c;它是用来显示开头或结尾某个数量的文字区块&#xff0c;head 用来显示档案的 开头至标准输出中&#xff0c;而 tail 想当然尔就是看档案的结尾。 语法&#xff1a;head 【参数】 【文件】 功能&…...

在深度学习中,Epoch、迭代次数、批次大小(Batch Size)和学习速率(Learning Rate)是影响模型训练效果的重要超参数。

1. Epoch 定义&#xff1a;Epoch是指整个训练数据集被完整地用来训练一次。影响&#xff1a;增加Epoch的数量可以使模型更充分地学习数据。然而&#xff0c;过高的Epoch可能导致过拟合&#xff0c;即模型在训练集上表现良好&#xff0c;但在测试集上表现不佳。设置&#xff1a…...

研究学习的循环递进三段论

在研究学习&#xff0c;编程语言、编译器、计算机科学、类型论、集合论等多门学科及分支后&#xff0c;我貌似隐隐约约地感受到&#xff0c;研究学习的过程分为三个阶段&#xff0c;我称之为研究学习的三段论&#xff0c;其中的段&#xff0c;是阶段的意思。对应了&#xff0c;…...

TestNet资产管理平台:从安装到实战,全面超越灯塔的解决方案

1. TestNet资产管理平台&#xff1a;为什么你需要它&#xff1f; 如果你是一名网络安全工程师或者渗透测试人员&#xff0c;肯定对资产管理的繁琐深有体会。传统的资产管理工具要么功能单一&#xff0c;要么操作复杂&#xff0c;而TestNet资产管理系统的出现&#xff0c;彻底改…...

智科毕业设计易上手选题100例

0 选题推荐 - 汇总篇 毕业设计是大家学习生涯的最重要的里程碑&#xff0c;它不仅是对四年所学知识的综合运用&#xff0c;更是展示个人技术能力和创新思维的重要过程。选择一个合适的毕业设计题目至关重要&#xff0c;它应该既能体现你的专业能力&#xff0c;又能满足实际应用…...

手机号逆向查询QQ号:3步快速找回QQ号的终极免费方案

手机号逆向查询QQ号&#xff1a;3步快速找回QQ号的终极免费方案 【免费下载链接】phone2qq 项目地址: https://gitcode.com/gh_mirrors/ph/phone2qq 你是否曾因忘记QQ号而无法登录重要账号&#xff1f;手机号逆向查询QQ号工具为你提供了一种简单高效的解决方案。这个基…...

HLAE高效创作指南:释放Source引擎电影级视觉潜能

HLAE高效创作指南&#xff1a;释放Source引擎电影级视觉潜能 【免费下载链接】advancedfx Half-Life Advanced Effects (HLAE) is a tool to enrich Source (mainly CS:GO) engine based movie making. 项目地址: https://gitcode.com/gh_mirrors/ad/advancedfx 一、核心…...

Qwen3交互界面开发:利用JavaScript实现网页端字幕编辑器

Qwen3交互界面开发&#xff1a;利用JavaScript实现网页端字幕编辑器 1. 引言 做视频的朋友们&#xff0c;不知道你们有没有过这样的经历&#xff1a;用AI工具生成了视频字幕&#xff0c;时间轴对得总差那么一点&#xff0c;要么是话还没说完字幕就跳了&#xff0c;要么是沉默…...

别光看公式了!用Multisim 14.0手把手仿真这8个经典运放电路(附工程文件)

别光看公式了&#xff01;用Multisim 14.0手把手仿真这8个经典运放电路&#xff08;附工程文件&#xff09; 在电子工程的学习过程中&#xff0c;运算放大器&#xff08;Op-Amp&#xff09;无疑是一个让人又爱又恨的存在。爱的是它强大的功能和广泛的应用&#xff0c;恨的是那些…...

终极指南:如何轻松解包Godot PCK文件并提取游戏资源

终极指南&#xff1a;如何轻松解包Godot PCK文件并提取游戏资源 【免费下载链接】godot-unpacker godot .pck unpacker 项目地址: https://gitcode.com/gh_mirrors/go/godot-unpacker 还在为Godot游戏的PCK文件无法解包而烦恼吗&#xff1f;无论你是游戏开发者想要复用资…...

5步定制UEFI启动界面:技术爱好者的HackBGRT实战指南

5步定制UEFI启动界面&#xff1a;技术爱好者的HackBGRT实战指南 【免费下载链接】HackBGRT Windows boot logo changer for UEFI systems 项目地址: https://gitcode.com/gh_mirrors/ha/HackBGRT 一、问题发现&#xff1a;启动界面定制的3大痛点 在计算机使用体验中&am…...

告别BibTeX混乱:在LaTeX中精准控制单条参考文献格式(颜色、字体)的实战技巧

告别BibTeX混乱&#xff1a;在LaTeX中精准控制单条参考文献格式&#xff08;颜色、字体&#xff09;的实战技巧 学术写作中&#xff0c;参考文献的视觉呈现往往被忽视。当审稿人要求"突出显示新增文献"时&#xff0c;当需要区分自己的前期工作与奠基性研究时&#x…...

媒体服务器功能解锁:打造专业级家庭媒体中心的完整方案

媒体服务器功能解锁&#xff1a;打造专业级家庭媒体中心的完整方案 【免费下载链接】emby-unlocked Emby with the premium Emby Premiere features unlocked. 项目地址: https://gitcode.com/gh_mirrors/em/emby-unlocked 在数字化娱乐时代&#xff0c;一个功能完善的媒…...