当前位置: 首页 > news >正文

戴尔 AI Factory 上的 Agentic RAG 搭载 NVIDIA 和 Elasticsearch 向量数据库

作者:来自 Elastic Hemant Malik, Dell Team

我们很高兴与戴尔合作撰写白皮书《戴尔 AI Factory with NVIDIA 上的 Agentic RAG》。白皮书是一份供开发人员参考的设计文档,概述了实施 Agentic 检索增强生成 (retrieval augmented generation - RAG) 应用程序的策略和解决方案组件。它是跨行业组织(特别是医疗保健行业)使用 AI 驱动的数据检索进行 Agentic RAG 框架决策的设计要点。

什么是戴尔 AI Factory with NVIDIA?

戴尔 AI Factory with NVIDIA 是一款全面的端到端 AI 解决方案,旨在简化和加速各行业企业的 AI 采用。目录产品基于一系列戴尔先进的 PowerEdge 服务器构建,并与 NVIDIA 的 AI 技术配对,提供处理、管理和分析大量数据所需的一切。了解详情。

Elasticsearch 向量数据库

由于组织将内部数据用于情境驱动的生成式 AI (GenAI) 解决方案,因此处理非结构化和半结构化数据并在不牺牲规模的情况下快速检索相关信息仍然具有挑战性。Agentic RAG on Dell AI Factory with NVIDIA 白皮书推荐使用 Elasticsearch 向量数据库进行大规模向量数据索引和检索。

Agentic RAG 堆栈采用 Dell AI Factory 上的 NVIDIA NIM 工具和 Elasticsearch 向量数据库

Elasticsearch 是全球下载次数最多的向量数据库,我们将继续扩大我们的优势。我们最近推出了 Better Binary Quantization (BBQ),它为存储大型向量化数据集带来了显著的速度和效率优势。Elastic 是唯一提供此功能的向量数据库(截至本文发布时)。BBQ 在索引速度(量化时间减少 20 至 30 倍)和查询速度(查询速度提高 2 至 5 倍)方面优于乘积量化 (PQ) 等传统方法,而且准确度没有额外损失。

面向 GenAI 开发人员的更简单、更强大的集成:Elastic AI 生态系统

戴尔 AI Factory 上的 Agentic RAG 和 NVIDIA 概述了开发人员构建真实 RAG 应用程序可能需要的所有解决方案组件 — 涵盖戴尔技术、Elasticsearch 向量数据库、LangChain 的 LangGraph、NVIDIA 推理微服务等。这份白皮书强调了集成良好的 AI 技术生态系统的价值,它可以加速客户开发和部署 RAG 应用程序。

除了与戴尔的合作外,Elastic 还与 LangChain 合作,为 LangGraph 提供了一个检索代理模板(retrieval agent template),该模板已针对 Elasticsearch 向量数据库进行了预配置。通过这样做,我们继续我们的主题,即为开发人员提供更简单、集成良好的生成式 AI 产品。

祝你 AI 代理愉快!

本文中描述的任何特性或功能的发布和时间均由 Elastic 自行决定。任何当前不可用的特性或功能可能无法按时交付或根本无法交付。

在这篇博文中,我们可能使用或提及了第三方生成式 AI 工具,这些工具由其各自的所有者拥有和运营。Elastic 无法控制第三方工具,我们对其内容、操作或使用不承担任何责任,也不对你使用此类工具可能产生的任何损失或损害承担任何责任。在使用 AI 工具处理个人、敏感或机密信息时,请谨慎行事。你提交的任何数据都可能用于 AI 培训或其他目的。我们无法保证你提供的信息将得到安全或保密。在使用任何生成式 AI 工具之前,你应该熟悉其隐私惯例和使用条款。

Elastic、Elasticsearch、ESRE、Elasticsearch Relevance Engine 和相关商标是 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。所有其他公司和产品名称均为其各自所有者的商标、徽标或注册商标。

原文:Agentic RAG on Dell AI Factory with NVIDIA and Elasticsearch Vector Database | Elastic Blog

相关文章:

戴尔 AI Factory 上的 Agentic RAG 搭载 NVIDIA 和 Elasticsearch 向量数据库

作者:来自 Elastic Hemant Malik, Dell Team 我们很高兴与戴尔合作撰写白皮书《戴尔 AI Factory with NVIDIA 上的 Agentic RAG》。白皮书是一份供开发人员参考的设计文档,概述了实施 Agentic 检索增强生成 (retrieval augmented generation - RAG) 应用…...

HarmonyOS4+NEXT星河版入门与项目实战(16)------ 状态管理 @State(页面数据刷新与渲染)

文章目录 1、@State装饰器2、视图渲染演示1、无嵌套的对象属性值变化时可以触发页面渲染2、嵌套对象的嵌套属性值变化时不能够触发页面刷新渲染3、数组中对象的属性值变化时不能触发页面刷新渲染3、总结1、@State装饰器 2、视图渲染演示 常规的 string、number 这里就不演示了…...

Origin教程003:数据导入(2)-从文件导入和导入矩阵数据

文章目录 3.3 从文件导入3.3.1 导入txt文件3.3.2 导入excel文件3.3.3 合并工作表3.4 导入矩阵数据3.3 从文件导入 所需数据 https://download.csdn.net/download/WwLK123/900267473.3.1 导入txt文件 选择【数据->从文件导入->导入向导】: 选择文件之后,点击完成即可…...

设计自己的网络通信协议

文章目录 一、为什么需要设计网络通信协议1. **标准化通信规则**2. **确保数据传输的可靠性**3. **支持网络的多样性和可扩展性**4. **分层设计,简化复杂性**5. **实现设备的互操作性**6. **支持多任务和多应用并发**7. **提供安全性**8. **支持不同的通信模式**总结…...

深入理解 Seata:分布式事务的最佳解决方案

随着微服务架构的广泛应用,分布式事务管理成为系统设计中一项重要且极具挑战的任务。在微服务架构下,服务之间通过网络调用,单个业务操作往往需要多个服务的协作来完成,这样分布式事务的问题就不可避免。Seata 是目前较为流行的一…...

JDK下载

jdk-8u421-windows-x64.exe : 阿里云盘 jdk-7u80-windows-x64.exe :阿里云盘...

如何使用 Python 开发一个简单的文本数据转换为 Excel 工具

目录 一、准备工作 二、理解文本数据格式 三、开发文本数据转换为Excel工具 读取CSV文件 将DataFrame写入Excel文件 处理其他格式的文本数据 读取纯文本文件: 读取TSV文件: 四、完整代码与工具封装 五、使用工具 六、总结 在数据分析和处理的日常工作中,我们经常…...

React(六)——Redux

文章目录 项目地址基本理解一、配置Redux store二、创建slice配置到store里并使用三、给Slice配置reducers,用来修改初始值 项目地址 教程作者:教程地址: 代码仓库地址: 所用到的框架和插件: dbt airflow基本理解 s…...

java抽奖系统(二)

3. 新建项目 3.1 选择相应的框架 pom文件配置如下&#xff1a; <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:s…...

STM32F10x 定时器

使用定时器实现&#xff1a;B5 E5的开关 添加相关的.h路径文件 添加相关的.c配置文件 led.h文件 用于声明LED函数 #ifndef __LED_H //没有定义__LED_H #define __LED_H //就定义__LED_H #define LED1_ON GPIO_ResetBits(GPIOB,GPIO_Pin_5) #defi…...

从0开始学PHP面向对象内容之常用设计模式(适配器,桥接,装饰器)

二&#xff0c;结构型设计模式 上两期咱们讲了创建型设计模式&#xff0c;都有 单例模式&#xff0c;工厂模式&#xff0c;抽象工厂模式&#xff0c;建造者模式&#xff0c;原型模式五个设计模式。 这期咱们讲结构型设计模式 1、适配器模式&#xff08;Adapter&#xff09; …...

玩转数字与运算:用C语言实现24点游戏的扑克牌魅力

✅作者简介&#xff1a;2022年博客新星 第八。热爱国学的Java后端开发者&#xff0c;修心和技术同步精进。 &#x1f34e;个人主页&#xff1a;Java Fans的博客 &#x1f34a;个人信条&#xff1a;不迁怒&#xff0c;不贰过。小知识&#xff0c;大智慧。 &#x1f49e;当前专栏…...

前端入门之VUE--基础与核心

前言 VUE是前端用的最多的框架&#xff1b;这篇文章是本人大一上学习前端的笔记&#xff1b;欢迎点赞 收藏 关注&#xff0c;本人将会持续更新。 Vue学习笔记 用于构建用户界面的渐进式框架 构建用户界面&#xff1a;基于数据动态渲染页面渐进式&#xff1a;循序渐近的学…...

logback 初探学习

logback 三大模块 记录器&#xff08;Logger&#xff09;、追加器&#xff08;Appender&#xff09;和布局&#xff08;Layout&#xff09; 配置文件外层最基本的标签如图示 xml中定义的就是这个三个东西下面进入学习 包引入参考springboot 官方文档 Logging :: Spring Boo…...

在Elasticsearch中,是怎么根据一个词找到对应的倒排索引的?

大家好&#xff0c;我是锋哥。今天分享关于【在Elasticsearch中&#xff0c;是怎么根据一个词找到对应的倒排索引的&#xff1f;】面试题。希望对大家有帮助&#xff1b; 在Elasticsearch中&#xff0c;是怎么根据一个词找到对应的倒排索引的&#xff1f; 在 Elasticsearch 中…...

1992-2021年 各省市县经过矫正的夜间灯光数据(GNLD、VIIRS)区域汇总:省份、城市、区县面板数据

1992-2021年 各省市县经过矫正的夜间灯光数据&#xff08;GNLD、VIIRS&#xff09;区域汇总&#xff1a;省份、城市、区县面板数据 .r.rar https://download.csdn.net/download/2401_84585615/90001905 从1992年至2021年&#xff0c;中国各省份、城市及区县的夜间灯光数据经过…...

linux实战-黑链——玄机靶场

黑链的特征&#xff1a; 隐藏链接&#xff1a;黑链通常隐藏在网站页面中&#xff0c;使用CSS、JavaScript或其他手段使其对普通用户不可见&#xff0c;但仍然能被搜索引擎爬虫检测到。恶意内容&#xff1a;这些链接指向的内容可能包含恶意软件、钓鱼页面或其他不良内容&#x…...

鸿蒙NEXT开发案例:字数统计

【引言】 本文将通过一个具体的案例——“字数统计”组件&#xff0c;来探讨如何在鸿蒙NEXT框架下实现这一功能。此组件不仅能够统计用户输入文本中的汉字、中文标点、数字、以及英文字符的数量&#xff0c;还具有良好的用户界面设计&#xff0c;使用户能够直观地了解输入文本…...

uniapp vue2项目迁移vue3项目

uniapp vue2项目迁移vue3项目&#xff0c;必须适配的部分 一、main.js 创建应用实例 // 之前 - Vue 2 import Vue from vue import App from ./App Vue.config.productionTip false // vue3 不再需要 App.mpType app // vue3 不再需要 const app new Vue({ ...App }) …...

16.C++STL 3(string类的模拟,深浅拷贝问题)

⭐本篇重点&#xff1a;string类的模拟&#xff0c;自己实现一个简单的string类 ⭐本篇代码&#xff1a;c学习/05.string类的学习 橘子真甜/c-learning-of-yzc - 码云 - 开源中国 (gitee.com) 目录 一. 经典string类的模拟 1.1 深浅拷贝问题 1.2 使用深拷贝完成经典string类的…...

Claude Code 总被封号或 Token 不足时如何通过 Taotoken 获得稳定替代方案

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 Claude Code 总被封号或 Token 不足时如何通过 Taotoken 获得稳定替代方案 对于依赖 Claude Code 这类编程助手进行日常开发的工程…...

机器学习笔记本崩溃深度解析:高频错误类型、根因与实战避坑指南

1. 项目概述与核心价值 在机器学习&#xff08;ML&#xff09;项目开发中&#xff0c;尤其是在Jupyter Notebook这类交互式环境中&#xff0c;代码执行到一半突然崩溃&#xff0c;弹出一堆令人费解的红色错误信息&#xff0c;是每个开发者都经历过的“日常”。这些崩溃不仅打断…...

MAA明日方舟助手:3步实现每日游戏时间从45分钟到5分钟的智能革命

MAA明日方舟助手&#xff1a;3步实现每日游戏时间从45分钟到5分钟的智能革命 【免费下载链接】MaaAssistantArknights 《明日方舟》小助手&#xff0c;全日常一键长草&#xff01;| A one-click tool for the daily tasks of Arknights, supporting all clients. 项目地址: h…...

机器学习加速格点QCD计算:流采样、轮廓变形、控制变量与代理观测量的无偏优化

1. 项目概述&#xff1a;当格点模拟遇见机器学习在计算物理&#xff0c;特别是格点量子色动力学&#xff08;Lattice QCD&#xff09;这个领域里&#xff0c;我们这些常年和超级计算机打交道的人&#xff0c;最常挂在嘴边的一个词可能就是“算力瓶颈”。一次完整的非微扰计算&a…...

终极模组管理指南:XXMI启动器让你的米哈游游戏体验提升10倍

终极模组管理指南&#xff1a;XXMI启动器让你的米哈游游戏体验提升10倍 【免费下载链接】XXMI-Launcher Modding platform for GI, HSR, WW and ZZZ 项目地址: https://gitcode.com/gh_mirrors/xx/XXMI-Launcher XXMI启动器是一款专为米哈游系列游戏设计的开源模组管理平…...

弦图与范畴论:统一混合量子-经典机器学习的形式化框架

1. 项目概述与核心价值如果你正在关注量子计算与机器学习的交叉领域&#xff0c;尤其是那些被称为“混合量子-经典”的算法&#xff0c;你可能会发现一个有趣的现象&#xff1a;相关的论文和代码库常常在两种截然不同的“语言”之间切换。一边是描述量子线路的狄拉克符号、酉矩…...

K-12机器学习整合教学:从数据与算法融合到课堂实践

1. 项目概述&#xff1a;为什么K-12机器学习教学需要整合路径&#xff1f; 在过去的几年里&#xff0c;我接触了上百位中小学信息技术老师、STEM教育从业者以及课程开发者&#xff0c;大家聊得最多的一个困惑就是&#xff1a; “机器学习这东西&#xff0c;到底该怎么教给孩子…...

结构可识别性映射:破解模型不可识别下的时间序列分类难题

1. 项目概述&#xff1a;当模型“看不清”时&#xff0c;如何让分类器“看得清”&#xff1f;在生物医学、工业过程监控等领域&#xff0c;我们常常面对这样的场景&#xff1a;你有一堆传感器记录下的时间序列数据&#xff0c;比如病人的心率变化、反应器内的温度波动&#xff…...

不只是open-vm-tools:让ArchLinux与VMware无缝协作的完整服务清单

不只是open-vm-tools&#xff1a;让ArchLinux与VMware无缝协作的完整服务清单在虚拟化环境中&#xff0c;ArchLinux以其极简和高度可定制的特性吸引着技术爱好者。然而&#xff0c;与VMware的深度集成往往被简化为"安装open-vm-tools"的单一操作&#xff0c;忽略了完…...

MLOps实战:从模型实验到生产部署的全流程自动化与监控

1. 项目概述&#xff1a;为什么我们需要MLOps&#xff1f;在数据科学和机器学习领域摸爬滚打了十几年&#xff0c;我见过太多“实验室里的冠军模型”在生产环境中折戟沉沙。一个在测试集上准确率高达99%的推荐模型&#xff0c;上线后用户点击率不升反降&#xff1b;一个精心调优…...