当前位置: 首页 > news >正文

实验场:在几分钟内使用 Bedrock Anthropic Models 和 Elasticsearch 进行 RAG 实验

作者:来自 Elastic Joe McElroy, Aditya Tripathi

我们最近发布了 Elasticsearch Playground,这是一个新的低代码界面,开发人员可以通过 A/B 测试 LLM、调整提示(prompt)和分块数据来迭代和构建生产 RAG 应用程序。今天,我们宣布 Amazon Bedrock 支持 Playground,为你带来更多来自 Amazon、Anthropic 和其他领先提供商的基础模型选择。使用 Amazon Bedrock 和 Elasticsearch 的开发人员现在可以使用私有或专有数据(索引到一个或多个 Elasticsearch 索引中)优化检索以获得答案。

使用 Amazon Bedrock 进行推理,对 LLM 和检索进行 A/B 测试

Playground 界面允许你试验和 A/B 测试来自 Amazon 和 Anthropic 等领先模型提供商的不同 LLMs。但是,选择模型只是问题的一部分。开发人员还必须考虑如何检索相关搜索结果以紧密匹配模型的上下文窗口大小(即模型可以处理的 token 数)。检索比上下文窗口长的文本段落可能会导致截断,从而导致信息丢失。小于上下文窗口的文本可能无法正确嵌入,从而导致表示不准确。下一个复杂性可能来自必须结合来自不同数据源的检索。

Playground 将许多 Elasticsearch 功能整合到一个简单但功能强大的界面中,用于调整 RAG 工作流程:

  • 使用不断增长的模型源列表(包括 Amazon Bedrock),以选择最适合你需求的 LLM
  • 使用 semantic_text,调整分块策略以适应数据和上下文窗口大小
  • 使用 retrievers 添加多阶段检索管道(包括重新排序)

将发送到模型的上下文调整为所需的生产标准后,你可以导出代码并使用 Python Elasticsearch 语言客户端或 LangChain Python 集成完成你的应用程序。

今天的公告通过 Open Inference API 集成提供对 Amazon Bedrock 上托管模型的访问,以及使用新的 semantic_text 字段类型的能力。我们真心希望你能享受这种体验!

Playground 采用了所有这些可组合元素,并为你带来了真正的开发人员工具集,可快速迭代和开发,以满足开发人员所需的速度。

使用 Playground

在 Kibana(Elasticsearch UI)中,从左侧的导航页面导航到 “Playground”。首先,你需要连接到模型提供商以提供你选择的 LLM。Playground 通过 Amazon Bedrock 支持聊天完成模型(例如 Anthropic)。

此博客提供了连接和配置 Playground 体验的详细步骤和说明。

连接 LLM 并选择 Elasticsearch 索引后,你可以开始询问有关索引中的信息的问题。LLM 将根据你的数据上下文提供答案。

将所选的 LLM 与 Elasticsearch 索引与私有专有信息相连接
立即与你的数据进行聊天并评估模型(例如本例中的 Anthropic Claude 3 Haiku)的响应

审查并定制存储向量嵌入的索引的文本和检索器查询

使用检索器和混合搜索获取最佳上下文

Elastic 的混合搜索可帮助你构建最佳上下文窗口。有效的上下文窗口由各种类型的向量化和纯文本数据构建,这些数据可以分布在多个索引中。开发人员现在可以利用新的 query retrievers 来简化查询创建。从版本 8.14 开始,Elastic Cloud Serverless 上提供了三种新的检索器,并且只需一个统一查询即可实现使用 RRF 规范化的混合搜索。你可以存储矢量化数据并使用 kNN 检索器,或者添加元数据和上下文来创建混合搜索查询。很快,你还可以添加语义重新排名以进一步改善搜索结果。

使用 Playground 快速交付对话式搜索

构建对话式搜索体验可能涉及多种方法,而选择可能会让人不知所措,尤其是考虑到新的重新排名和检索技术的创新速度,这两种技术都适用于 RAG 应用程序。

借助我们的 Playground,即使开发人员可以使用多种功能,这些选择也会变得简单直观。我们的独特方法是立即将混合搜索作为构建的主要支柱,直观地了解所选和分块数据的形状,并扩大 LLMs 的多个外部提供商的访问范围。

今年早些时候,Elastic 获得了 AWS 生成式 AI 能力奖,这一殊荣授予了极少数提供差异化​​生成式 AI 工具的 AWS 合作伙伴。Elastic 为 Playground 体验添加 Bedrock 支持的方法遵循相同的原则 —— 为 Elastic Cloud on AWS 开发人员带来新的创新功能。

使用 Playground 构建、测试、享受乐趣

立即前往 Playground 文档开始使用!探索 GitHub 上的搜索实验室,了解 Cohere、Anthropic、Azure OpenAI 等提供商的新手册和集成。

准备好自己尝试了吗?开始免费试用。
想要获得 Elastic 认证?了解下一期 Elasticsearch 工程师培训何时开始!

原文:Playground: Experiment with RAG using Bedrock Anthropic Models and Elasticsearch in minutes — Elastic Search Labs

相关文章:

实验场:在几分钟内使用 Bedrock Anthropic Models 和 Elasticsearch 进行 RAG 实验

作者:来自 Elastic Joe McElroy, Aditya Tripathi 我们最近发布了 Elasticsearch Playground,这是一个新的低代码界面,开发人员可以通过 A/B 测试 LLM、调整提示(prompt)和分块数据来迭代和构建生产 RAG 应用程序。今天…...

代理详解之静态代理、动态代理、SpringAOP实现

1、代理介绍 代理是指一个对象A通过持有另一个对象B,可以具有B同样的行为的模式。为了对外开放协议,B往往实现了一个接口,A也会去实现接口。但是B是“真正”实现类,A则比较“虚”,他借用了B的方法去实现接口的方法。A…...

Laravel - laravel-websockets 开发详解

1.我laravel-websockets 的开发环境 Laravel 9.0Laravel WebSockets (最新版)Laravel Vite 2. 安装服务器端包 beyondcode/laravel-websockets 运行以下命令安装laravel-websockets composer require beyondcode/laravel-websockets 安装完后&#…...

vue3 学习笔记04 -- axios的使用及封装

vue3 学习笔记04 – axios的使用及封装 安装 Axios 和 TypeScript 类型定义 npm install axios npm install -D types/axios创建一个 Axios 实例并封装成一个可复用的模块,这样可以在整个应用中轻松地进行 API 请求管理。 在 src 目录下创建一个 services 文件夹&…...

键盘快捷键设置录入

效果图: 代码: import React, {useContext, useEffect, useRef} from react import {message} from "antd"; import lodash from "lodash"; import {StateContext} from ../../index.tsx import {useUpdateEffect} from "ahoo…...

刷题Day49|647. 回文子串、516.最长回文子序列

647. 回文子串 647. 回文子串 - 力扣(LeetCode) 思路:递推公式的含义是[i, j]内的子串是否为回文子串(bolean[][])。一共两种情况:s[i] s[j],i和j相差1以外就得判断中间包含的的字符串是否为回文了&…...

关于transformers库验证时不进入compute_metrics方法的一些坑

生成式任务输入就是标签 transformers在进入compute_metrics前会有一个判断,源码如下: # 版本 transformers4.41.2 # 在trainer.py 的 3842 行 # Metrics! if (self.compute_metrics is not Noneand all_preds is not Noneand all_labels is not Nonea…...

苹果提出RLAIF:轻量级语言模型编写代码

获取本文论文原文PDF,请在公众号【AI论文解读】留言:论文解读 代码生成一直是一个充满挑战的领域。随着大型语言模型(LLM)的出现,我们见证了在自然语言理解和生成方面的显著进步。然而,当涉及到代码生成&a…...

[leetcode] shortest-subarray-with-sum-at-least-k 和至少为 K 的最短子数组

. - 力扣&#xff08;LeetCode&#xff09; class Solution { public:int shortestSubarray(vector<int>& nums, int k) {int n nums.size();vector<long> preSumArr(n 1);for (int i 0; i < n; i) {preSumArr[i 1] preSumArr[i] nums[i];}int res n…...

专业140+总分420+天津大学815信号与系统考研经验天大电子信息与通信工程,真题,大纲,参考书。

顺利上岸天津大学&#xff0c;专业课815信号与系统140&#xff0c;总分420&#xff0c;总结一些自己的复习经历&#xff0c;希望对于报考天大的同学有些许帮助&#xff0c;少走弯路&#xff0c;顺利上岸。专业课&#xff1a; 815信号与系统&#xff1a;指定教材吴大正&#xf…...

前端如何取消接口调用

&#x1f9d1;‍&#x1f4bb; 写在开头 点赞 收藏 学会&#x1f923;&#x1f923;&#x1f923; 1. xmlHttpRequest是如何取消请求的&#xff1f; 实例化的XMLHttpRequest对象上也有abort方法 const xhr new XMLHttpRequest(); xhr.addEventListener(load, function(e)…...

k8s 容器环境下的镜像如何转换为docker 使用

在无法连接registry 的环境中&#xff0c;想要把 crictl 中的镜像给docker 使用&#xff0c;应该怎么处理&#xff1f; 其实容器镜像是通用的&#xff0c;crictl 和ctr 以及docker 镜像是可以互相使用的&#xff0c;因为docker 在1.10版本之后遵从了OCI。所以crictl 环境下的镜…...

FreeRTOS 队列

队列是一种任务到任务、任务到中断、中断到任务数据交流的一种机制。在队列中可以存 储数量有限、大小固定的多个数据&#xff0c;队列中的每一个数据叫做队列项目&#xff0c;队列能够存储队列项 目的最大数量称为队列的长度&#xff0c;在创建队列的时候&#xff0c;就需要指…...

如何识别图片文字转化为文本?5个软件帮助你快速提取图片文字

如何识别图片文字转化为文本&#xff1f;5个软件帮助你快速提取图片文字 将图片中的文字提取为文本是一项非常有用的技能&#xff0c;特别是当你需要处理大量扫描文档、截图或其他图片时。以下是五款能够帮助你快速提取图片文字的软件&#xff1a; 迅捷文字识别 这是一款非…...

Flink SQL kafka连接器

版本说明 Flink和kafka的版本号有一定的匹配关系&#xff0c;操作成功的版本&#xff1a; Flink1.17.1kafka_2.12-3.3.1 添加kafka连接器依赖 将flink-sql-connector-kafka-1.17.1.jar上传到flink的lib目录下 下载flink-sql-connector-kafka连接器jar包 https://mvnreposi…...

glm-4 联网搜索 api 测试

今天测试了一下 glm-4 的联网搜索 web_search tool 调用&#xff0c;发现了 web_search 的网页检索返回结果中几个比较诡异的事情&#xff0c;特此记录&#xff1a; 有些检索结果没有 icon、link、media 字段&#xff0c;但从内容上看确实是联网搜索出来的结果&#xff0c;不知…...

Java毕业设计 基于SSM vue图书管理系统小程序 微信小程序

Java毕业设计 基于SSM vue图书管理系统小程序 微信小程序 SSM 图书管理系统小程序 功能介绍 用户 登录 注册 首页 图片轮播 图书信息推荐 图书详情 赞 踩 评论 收藏 系统公告 公告详情 用户信息修改 我的待还 图书归还 催还提醒 我的收藏管理 意见反馈 管理员 登录 个人中心…...

bert训练的一些技巧(rand() < self.skipgram_prb)

rand() < self.skip_gram_prb) 是一个条件表达式&#xff0c;用来判断是否进行skip-gram掩码操作。这种掩码操作通常用于自然语言处理中的数据增强&#xff0c;通过概率决定是否应用skip-gram掩码。下面是对这个表达式的详细解释&#xff1a; 解释 rand(): rand() 是一个随…...

pandas修改时间索引报错处理

import pandas as pd import numpy as np import osdfpd.DataFrame(index[a,b,c],data{序列:[1,2,3]}) df.rename(index{a:a1},inplaceTrue) print(df) print(df.index.dtype)df1pd.DataFrame(index[2024-01-01,2024-01-02,2024-01-03],data{序列:[1,2,3]}) df1.rename(index{2…...

Nginx Bla~Bla~

root 和 alias指令都用于指定服务器上的文件系统路径&#xff0c;但它们在用法和行为上有一些不同 root指令通常用于在Nginx配置中定义一个目录&#xff0c;该目录将作为请求的根目录。 server { location /static/ {root /var/www; 请求 /static/index.html 将映射到 /v…...

Ansible Playbook实战指南:从基础到高级技巧全解析

1. Ansible Playbook基础入门 第一次接触Ansible Playbook时&#xff0c;我被它简洁的YAML语法和强大的自动化能力惊艳到了。记得当时需要给50台服务器部署Nginx&#xff0c;传统方式要手动操作每台机器&#xff0c;而用Playbook只花了10分钟就搞定了全部部署。这种效率提升让我…...

解锁论文写作新境界:书匠策AI——学术探索的智能导航灯

在学术的浩瀚海洋中&#xff0c;每一位研究者、学生乃至教育博主&#xff0c;都如同勇敢的航海家&#xff0c;驾驶着知识的船只&#xff0c;追寻着真理的彼岸。然而&#xff0c;论文写作这一航程中的关键环节&#xff0c;往往让许多人感到迷茫与挑战重重。今天&#xff0c;就让…...

数仓实习实战|医疗报表电话指标缺失,完整上游排查思路

今天碰到一个问题&#xff1a;患者档案里明明有联系电话&#xff0c;但是最终报表展示的时候&#xff0c;这个字段就是空的。跟着师哥一步步排查下来&#xff0c;思路清晰了很多&#xff0c;也把完整的排查逻辑整理了一下&#xff0c;以后遇到类似问题可以直接参考一、问题场景…...

Elasticsearch-PHP聚合分析终极指南:7步掌握数据统计与可视化

Elasticsearch-PHP聚合分析终极指南&#xff1a;7步掌握数据统计与可视化 【免费下载链接】elasticsearch-php Official PHP client for Elasticsearch. 项目地址: https://gitcode.com/gh_mirrors/el/elasticsearch-php Elasticsearch-PHP是官方PHP客户端&#xff0c;提…...

2026届学术党必备的六大AI辅助论文工具实际效果

Ai论文网站排名&#xff08;开题报告、文献综述、降aigc率、降重综合对比&#xff09; TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 知网在近期对自己的 AIGC 检测服务进行了升级&#xff0c;其目的在于识别存在于论文之中的、…...

Codesys软运动控制进阶:用SMC_FreeEncoder为ECAT轴搭建一个“虚拟手轮”调试工具

Codesys软运动控制进阶&#xff1a;用SMC_FreeEncoder为ECAT轴搭建虚拟手轮调试工具 在自动化设备开发周期中&#xff0c;机械安装与电气调试往往存在时间差。当机械部件尚未就位或伺服驱动器临时故障时&#xff0c;如何提前验证运动控制逻辑&#xff1f;传统做法是等待硬件就绪…...

Jetson Orin Nano环境搭建避坑实录:从JetPack到PyQt5,我踩过的那些‘坑’都帮你填平了

Jetson Orin Nano环境搭建避坑实录&#xff1a;从JetPack到PyQt5的实战指南 第一次拿到Jetson Orin Nano这块开发板时&#xff0c;我天真地以为按照官方文档就能轻松搞定所有环境配置。结果从JetPack安装到PyQt5编译&#xff0c;几乎每一步都遇到了意想不到的问题。这篇文章不会…...

Visual C++运行库全解析:从问题诊断到高效部署的完整指南

Visual C运行库全解析&#xff1a;从问题诊断到高效部署的完整指南 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 问题诊断&#xff1a;运行库故障的典型表现与…...

为什么H5SC是每个开发者必备的安全工具?终极HTML5安全指南

为什么H5SC是每个开发者必备的安全工具&#xff1f;终极HTML5安全指南 【免费下载链接】H5SC HTML5 Security Cheatsheet - A collection of HTML5 related XSS attack vectors 项目地址: https://gitcode.com/gh_mirrors/h5/H5SC 在当今Web开发领域&#xff0c;HTML5安…...

快速构建tomcat配置可视化原型:用快马一键生成配置向导界面

今天想和大家分享一个快速验证Tomcat配置方案的小技巧。作为一个Java开发者&#xff0c;经常需要折腾Tomcat的安装配置&#xff0c;每次都要重复下载、配环境变量、改server.xml这些步骤&#xff0c;特别耗时。最近发现用InsCode(快马)平台可以快速生成一个可视化配置向导&…...