当前位置: 首页 > article >正文

Elasticsearch 中的索引模板:如何使用可组合模板

作者:来自 Elastic Kofi Bartlett

探索可组合模板以及如何创建它们。

更多阅读: Elasticsearch:可组合的 Index templates - 7.8 版本之后

想获得 Elastic 认证吗?查看下一期 Elasticsearch Engineer 培训的时间!

Elasticsearch 拥有大量新功能,帮助你为你的使用场景构建最佳搜索方案。深入学习我们的示例 notebook,了解更多信息,开始免费的 cloud 试用,或者现在就在你的本地机器上尝试 Elastic 吧。


Elasticsearch 索引可以通过 mapping、settings 和 aliases 进行配置:

  • Mapping 定义指定数据的 schema。

  • Settings 设置分片大小和刷新频率。

  • Aliases 用于为索引设置别名。

当我们第一次索引文档或使用 Create Index API 创建空索引时,该索引会使用默认设置创建,不包含数据 schema,也没有别名。这些默认设置在开发和测试环境中通常能正常工作,但在生产环境中我们可能需要对索引进行自定义。

在生产环境中使用默认的 mapping 和 settings 可能会导致索引和搜索性能不佳。手动创建索引既繁琐又耗时,尤其当我们有复杂的 mapping schema、自定义 settings 和 aliases 时,在每个环境中都重新创建这些索引非常不现实。

幸运的是,Elasticsearch 提供了一种工具,可以在创建索引时自动应用预定义的配置,这就是索引模板(index templates)。

索引模板

索引模板允许我们使用自定义配置来创建索引。索引在创建时可以从这些模板中获取配置,例如设置分片数量、副本数或字段 mapping。如果索引的名称与模板的命名模式匹配,Elasticsearch 就会使用模板中定义的配置来创建新索引。

Elasticsearch 在 7.8 版本中升级了模板功能,引入了 可组合模板(composable templates)。这一新版本提供了更高的模板重用性,本文就展示了这一点。

模板类型

索引模板可以分为两类:

  • 索引模板(或可组合索引模板):可组合索引模板可以独立存在,也可以由一个或多个组件模板(见下)组合而成。

  • 组件模板(component templates):组件模板是可复用的模板,定义了所需的配置。通常组件模板需要与索引模板关联使用。每个组件模板可以被一个或多个索引模板引用。

如下面的图片所示,索引模板 A 和 B 共享组件模板(此例中是 Template 3)。一个索引模板可以包含零个或多个组件模板,而每个组件模板也可以关联零个或多个索引模板。虽然这两种模板都可以独立存在,但组件模板如果没有附加到索引模板上,就没有实际用途。

总体思路是为组织开发一套组件模板目录,以满足各种需求(例如为不同环境指定不同的组件模板),并通过可组合索引模板将它们附加到各个索引上。

如何创建可组合(索引)模板

Elasticsearch 提供了一个 _index_template 端点,用于管理索引模板。用户在该模板中提供所有需要的 mappings、settings 和 aliases,以及一个索引名称模式。我们来看一个为微服务应用 customer-order-service 创建模板的例子,该服务负责订单生成逻辑。

假设我们的需求是为客户订单创建一个模板,名称模式使用通配符:*orders。此模板应包含某些 mappings 和 settings,例如 order_date 字段,以及分片数和副本数。

任何在创建过程中与该模板匹配的索引都会继承模板中定义的配置。例如,black_friday_orders 索引将包含 order_date 字段,分片数将设置为 5,副本数设置为 2。除此之外,所有从该模板创建的索引还会继承一个统一的别名。我们将创建一个名为 orders_template 的模板,索引模式为 *orders,其 mapping schema 包含一个 order_date 字段,使用预定义的日期格式 dd-MM-yyyy。以下是创建该索引模板的代码:

PUT _index_template/orders_template
{"index_patterns": ["*orders"],"priority": 300,"template": {"mappings": {"properties": {"order_date": {"type": "date","format":"dd-MM-yyyy"}}},"settings":{"number_of_shards":5,"number_of_replicas":2},"aliases":{"all_orders":{}}}
}

当你在 Kibana 的 DevTools 中执行这个查询时,模板会使用索引模式 *orders 被创建,并包含预定义的 mapping、settings 和一个 alias。index_patterns 是一个匹配模式数组;任何匹配该模式的索引都会继承模板配置。你可以执行以下命令来获取已保存的模板,以验证我们刚才所做的操作:

GET _index_template/orders_template 

创建模板时还定义了一个优先级属性,这是一个正整数:每个模板都有一个优先级,以便在多个模板之间存在冲突时,通过该值来决定使用哪个模板,优先级越高越优先。我们将在下面更深入地探讨模板优先级。

使用模板创建索引

现在我们已经有了一个模板——用于创建索引的蓝图——下一步是创建一个索引。当索引名称与给定模式匹配时,模板中的配置会被自动应用。为了验证这一点,如下所示的代码创建了一个全新的索引,名为:blackfriday_orders

PUT blackfriday_orders

由于索引名称(blackfriday_orders)与模板中定义的命名模式(即 *orders)匹配,该索引应继承模板中的所有配置。我们可以通过执行以下代码来获取这个新创建的索引,并检查是否确实如此:

GET blackfriday_orders

这应该返回:

{"blackfriday_orders" : {"aliases" : {"all_orders" : { }},"mappings" : {"properties" : {"order_date" : {"type" : "date","format" : "dd-MM-yyyy"}}},"settings" : {"index" : {..."number_of_shards" : "5","number_of_replicas" : "2"}}}
}

正如响应所示,blackfriday_orders 的配置已经从模板中继承。我们可以尝试不同的索引组合,这些组合将成功继承模板配置:

PUT blackfriday_orders
PUT americaorders
PUT cancelled--orders
PUT undefined101orders

然而,以下索引将不会继承配置,因为它们的名称与模式不匹配:

PUT blackfriday_orders2
PUT open_orders_
PUT allorders_total

需要记住的一件重要事情是,所有从模板派生的索引都拥有相同的别名 —— 在此情况下为 all_orders。拥有这样的别名是有优势的 —— 我们可以简单地查询这个单一的别名,而不是查询多个索引。

GET blackfriday_orders,americaorders,undefined101orders/_search
GET all_orders/_search 
{"query": {"range": {"order_date": {"gte": "01-12-2021","lte": "31-12-2021"}}}
}

在为 *orders 创建模板时,任何匹配的索引都应该采用该模板配置。通常,无论是有意还是无意,团队可能会根据各种原因创建更多模板。这意味着有时索引名称可能会匹配两个不同的模板模式!Elasticsearch 必须决定应用这两个模板中的哪一个配置。幸运的是,这个难题可以通过使用模板优先级来解决。

创建组件模板

我们在文章的前面部分了解了索引模板。直接在模板中内置配置有几个缺点 —— 其中一个缺点是配置不能导出供其他模板使用。如果我们希望有类似的配置,比如用于客户相关模板(*customers),可能需要重新创建整个模板。这意味着,在一个典型的组织中,我们可能需要创建数十个这样的模板(再加上根据环境可能需要更多模板)。

由于我们总是追求可重用性,Elasticsearch 重新设计了模板,考虑到了可重用性。组件模板正好满足了这一需求。如果你来自 DevOps 背景,很可能你需要为每个环境创建带有预设配置的索引。与其费力地手动应用这些配置,不如为每个环境创建一个组件模板。

组件模板不过是一个可重用的配置块,我们可以用它来构建更多的索引模板。请注意,组件模板只有与索引模板配合使用时才有意义。它们通过 _component_template 端点暴露出来。让我们看看这些是如何组合在一起的。

设置模板

让我们从之前在索引模板中定义的设置中提取,并创建一个组件模板。settings_component_template 预计将具有五个主分片,每个主分片有两个副本。第一步,如下面的代码所示,是声明并执行一个具有此配置的组件模板。

PUT _component_template/settings_component_template
{"template":{"settings":{"number_of_shards":5,"number_of_replicas":2}}
}

如上面的代码所示,我们使用 _component_template 端点来创建一个组件模板。请求的主体包含一个模板对象,其中包含模板信息。settings_component_template 现在可以在其他索引模板中使用。一个显著的区别是,这个模板没有定义任何索引模式;它只是一个配置我们一些属性的代码块。

映射模板

以相同的方式,让我们创建另一个模板。这次,我们将提取之前在独立索引模板中定义的映射 schema。下面的代码展示了脚本:

PUT _component_template/mappings_component_template
{"template": {"mappings": {"properties": {"order_date": {"type": "date","format":"dd-MM-yyyy"}}}}
}

别名模板

按照相同的流程,我们也可以创建一个包含别名的组件模板——两个别名(all_orderssales_orders):

PUT _component_template/aliases_component_template
{"template": {"aliases": {"all_orders": {},"sales_orders":{}}}
}

可组合索引模板

现在我们有了这三个组件模板,下一步是将它们投入使用。我们可以通过让一个索引模板(比如 christmas_orders)使用它们来实现:

PUT _index_template/composed_orders_template
{"index_patterns": ["*orders"],"priority": 500,"composed_of": ["settings_component_template","mappings_component_template","aliases_component_template"]
}

composed_of 标签是由所有构成该模板的组件模板组成的集合。在这个例子中,我们选择了 settingsmappingsaliases 组件模板。我们还提高了优先级,使得这个模板的优先级高于其他模板。一旦模板准备好,任何匹配 *orders 模式的索引将从这三个组件模板继承配置。

话虽如此,如果我们希望创建一个新的模板,比如 customers,只使用现有的一个模板(settings_component_template)和一个新创建的别名模板(aliases_component_template,见下文),我们可以通过以下方式实现:

PUT _component_template/aliases_component_template2
{"template": {"aliases": {"all_customers": {}}}
}

索引模板如下所示:

PUT _index_template/composed_customers_template
{"index_patterns": ["*customers*"],"priority": 200,"composed_of": ["settings_component_template","aliases_component_template2"]
}

你看到 settings_component_template 已经在两个不同的模板中被(重新)使用了吗?这就是组件模板的优势。

模板优先级

开发人员有可能创建多个索引模板,而没有查看现有的模板库。因此,为每个模板设置优先级很重要,这样具有更高优先级的模板将被使用。例如,my_orders_template_1 会覆盖 my_orders_template_2,如下代码片段所示:

PUT _index_template/my_orders_template_1
{"index_patterns": ["*orders"],"priority": 1000,"template": { ... }
}PUT _index_template/my_orders_template2
{"index_patterns": ["*orders"],"priority": 300,"template": { ... }
}

当你有多个模板匹配正在创建的索引时,Elasticsearch 会应用所有匹配模板的配置,但会覆盖具有更高优先级的配置。

模板的优先级

最后,你可能会想知道模板的优先级问题 —— 组件模板中定义的配置是否会覆盖主索引模板中定义的配置?还是反过来?实际上,有一些规则:

  • 使用显式配置创建的索引会优先于所有其他配置 —— 这意味着,如果你使用显式配置创建索引,不要期望这些配置会被模板覆盖。

  • 旧版本的模板(在 7.8 版本之前创建的模板)的优先级低于可组合模板。

总结

  • 一个索引包含映射、设置和别名:映射定义字段的架构,设置设置索引参数,如分片数和副本数,别名为索引提供备用名称。
  • 模板允许我们创建具有预定义配置的索引。将索引命名为与特定模板中定义的索引模式匹配的名称时,该索引会根据模板自动配置。
  • Elasticsearch 在 7.8 版本中引入了可组合索引模板。可组合索引模板允许模板的模块化和版本管理。
  • 可组合模板由一个或多个组件模板组成。
  • 索引模板也可以定义自己的配置。
  • 组件模板是一个具有预定义配置的可重用模板,就像一个可组合索引模板。
  • 然而,组件模板预计会成为索引模板的一部分;如果没有被“组合”到索引模板中,它们是无效的。
  • 组件模板中没有定义索引模式 —— 这也是它们 “预计” 成为索引模板一部分的原因。
  • 每个模板都有一个优先级 —— 一个正数。数字越大,应用该模板的优先级越高。

原文:Index templating in Elasticsearch: How to use composable templates - Elasticsearch Labs

相关文章:

Elasticsearch 中的索引模板:如何使用可组合模板

作者:来自 Elastic Kofi Bartlett 探索可组合模板以及如何创建它们。 更多阅读: Elasticsearch:可组合的 Index templates - 7.8 版本之后 想获得 Elastic 认证吗?查看下一期 Elasticsearch Engineer 培训的时间! El…...

内存泄漏系列专题分析之七:高通相机CamX--Android通用ION(dmabuf)内存分配和释放原理

【关注我,后续持续新增专题博文,谢谢!!!】 上一篇我们讲了:内存泄漏系列专题分析之六:高通camx 内存泄漏测试的未回收问题分析 这一篇我们开始讲:内存泄漏系列专题分析之七:高通相机CamX--Android通用ION(dmabuf)内存分配和释放原理 目录 一、背景 二、…...

【LeetCode 42】接雨水(单调栈、DP、双指针)

题面: 思路: 能接雨水的点,必然是比两边都低(小)的点。有两种思路,一种是直接计算每个点的最大贡献(也就是每个点在纵向上最多能接多少水),另一种就是计算每个点在横向上…...

【JS逆向基础】前端基础-HTML与CSS

1,flask框架 以下是一个使用flask框架写成的serve程序 # noinspection PyUnresolvedReferences #Flash框架的基本内容from flask import Flask app Flask(__name__)app.route(/index) def index():return "hello index"app.route(/login) def login():re…...

什么是HTML、CSS 和 JavaScript?

HTML、CSS 和 JavaScript 是构建网页的三大核心技术,它们分工明确又紧密协作。接下来我将分别介绍三者的定义、功能,并阐述它们如何共同构成网页,最后推荐学习资源。 一、HTML:网页的骨架与内容基础 HTML(HyperText …...

手机网页提示ip被拉黑名单什么意思?怎么办

‌当您使用手机浏览网页时,突然看到“您的IP地址已被列入黑名单”的提示,是否感到困惑和不安?这种情况在现代网络生活中并不罕见,但确实会给用户带来诸多不便。本文将详细解释IP被拉黑的含义、常见原因,并提供一系列实…...

CCF编程能力等级认证 一级 第一次课

介绍 CCF 编程能力等级认证(GESP)为青少年计算机和编程学习者提供学业能力验证的规则和平台,由中国计算机学会发起并主办。 每年考试分四次,时间是每年的3月、6月、9月、12月,以当年每期公布的时间为准。 GESP适用年…...

SpringBoot 讯飞星火AI WebFlux流式接口返回 异步返回 对接AI大模型 人工智能接口返回

介绍 用于构建基于 WebFlux 的响应式 Web 应用程序。集成了 Spring WebFlux 模块,支持响应式编程模型,构建非阻塞、异步的 Web 应用。WebFlux 使用了非阻塞的异步模型,能够更好地处理高并发请求。适合需要实时数据推送的应用场景。 WebClie…...

Python爬虫中time.sleep()与动态加载的配合使用

一、动态加载网页的挑战 动态加载网页是指网页的内容并非一次性加载完成,而是通过JavaScript等技术在用户交互或页面加载过程中逐步加载。这种设计虽然提升了用户体验,但对于爬虫来说,却增加了抓取的难度。传统的爬虫方法,如简单…...

学习Cesium Entities

🌐 Cesium中的Entities系统趣味学习 📊 Entities系统架构流程图 #mermaid-svg-Lkue5O3gYOkEVSbD {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-Lkue5O3gYOkEVSbD .error-icon{fill:#552222;}#mermaid-svg-Lku…...

如何减少锁竞争并细化锁粒度以提高 Rust 多线程程序的性能?

在并发编程中,锁(Lock)是一种常用的同步机制,用于保护共享数据免受多个线程同时访问造成的竞态条件(Race Condition)。然而,不合理的锁使用会导致严重的性能瓶颈,特别是在高并发场景…...

Logback官方文档翻译章节目录

Logback官方文档翻译章节目录 第一章 Logback简介 第二章 Logback的架构(一) Logback的架构(二) Logback的架构(三) 持续更新中…...

AtCoder Beginner Contest 404 A-E 题解

还是ABC好打~比ARC好打多了&#xff08; 题解部分 A - Not Found 给定你一个长度最大25的字符串&#xff0c;任意输出一个未出现过的小写字母 签到题&#xff0c;map或者数组下标查询一下就好 #include<bits/stdc.h>using namespace std;#define int long long #def…...

【mysql】常用命令

一 系统mysql用户密码查询 1、在工程目录如/usr/local/httpd/下的*.php中查找类似有db.inf的文件 以php为例。 2、在代码文件中确认有数据库连接的的功能实现 例如&#xff1a; $dbconf parse_ini_file(/usr/local/httpd/conf/db.inf); $link mysql_connect($dbconf[d…...

macOS Arduino IDE离线安装ESP8266支持包

其实吧&#xff0c;本来用platformio也是可以的&#xff0c;不过有时候用Arduino IDE可能更快一些&#xff0c;因为以前一直是Arduino.app和Arduino IDE.app共存了一段时间&#xff0c;后来下决心删掉Arduino.app并升级到最新的Arduino IDE.app。删除了旧的支持板级支持包之后就…...

网络靶场基础知识

一、网络靶场的核心概念 网络靶场&#xff08;Cyber Range&#xff09;是一种基于虚拟化和仿真技术的网络安全训练与测试平台&#xff0c;通过模拟真实网络环境和业务场景&#xff0c;为攻防演练、漏洞验证、安全测试和人才培养提供安全可控的实验空间。其核心目标是通过“虚实…...

基于Partial Cross Entropy的弱监督语义分割实战指南

一、问题背景:弱监督学习的挑战 在计算机视觉领域,语义分割任务面临最大的挑战之一是**标注成本**。以Cityscapes数据集为例,单张图像的像素级标注需要约90分钟人工操作。这催生了弱监督学习(Weakly Supervised Learning)的研究方向,其中partial cross entropy loss(部…...

【算法基础】选择排序算法 - JAVA

一、算法基础 1.1 什么是选择排序 选择排序是一种简单直观的排序算法&#xff0c;它的工作原理是&#xff1a;首先在未排序序列中找到最小&#xff08;或最大&#xff09;元素&#xff0c;存放到排序序列的起始位置&#xff0c;然后再从剩余未排序元素中继续寻找最小&#xf…...

电商平台的流量秘密:代理IP在用户行为分析中的角色

在电商江湖中&#xff0c;流量是氧气&#xff0c;用户行为数据是DNA。当你在电商平台点击商品、加入购物车时&#xff0c;背后有一套精密的系统正在分析你的每个动作。而在这套系统的运作中&#xff0c;代理IP正扮演着"隐形推手"的角色——它既是数据采集的"隐身…...

批量清洗与修改 YOLO 标签:删除与替换指定类别

在使用 YOLO 格式的数据进行训练或部署前&#xff0c;常常需要对标签文件进行清洗或修改。本文整理了两种常见场景的 Python 脚本&#xff1a;删除指定类别 和 修改某类为其他类&#xff0c;并支持自动打印检测到该类别的文件名&#xff0c;帮助你快速定位问题数据。 &#x1f…...

Python项目源码57:数据格式转换工具1.0(csv+json+excel+sqlite3)

1.智能路径处理&#xff1a;自动识别并修正文件扩展名&#xff0c;根据转换类型自动建议目标路径&#xff0c;实时路径格式验证&#xff0c;自动补全缺失的文件扩展名。 2.增强型预览功能&#xff1a;使用pandastable库实现表格预览&#xff0c;第三方模块自己安装一下&#x…...

TypeScript 中,属性修饰符

在 TypeScript 中&#xff0c;属性修饰符&#xff08;Property Modifiers&#xff09;是用于修饰类的属性或方法的关键字&#xff0c;它们可以改变属性或方法的行为和访问权限。TypeScript 提供了三种主要的属性修饰符&#xff1a;public、private 和 protected。此外&#xff…...

雷赛伺服电机

ACM0经济 编码器17位&#xff1a; ACM1基本 编码器23位磁编&#xff0c; ACM2通用 编码器24位光电&#xff0c; 插头定义&#xff1a;...

基础编程题目集 6-8 简单阶乘计算

本题要求实现一个计算非负整数阶乘的简单函数。 函数接口定义&#xff1a; int Factorial( const int N ); 其中N是用户传入的参数&#xff0c;其值不超过12。如果N是非负整数&#xff0c;则该函数必须返回N的阶乘&#xff0c;否则返回0。 裁判测试程序样例&#xff1a; #in…...

【deepseek教学应用】001:deepseek如何撰写教案并自动实现word排版

本文讲述利用deepseek如何撰写教案并自动实现word高效完美排版。 文章目录 一、访问deepseek官网二、输入教案关键词三、格式转换四、word进一步排版 一、访问deepseek官网 官网&#xff1a;https://www.deepseek.com/ 进入主页后&#xff0c;点击【开始对话】&#xff0c;如…...

CH32V208GBU6沁恒绑定配对获取静态地址

从事嵌入式单片机的工作算是符合我个人兴趣爱好的,当面对一个新的芯片我即想把芯片尽快搞懂完成项目赚钱,也想着能够把自己遇到的坑和注意事项记录下来,即方便自己后面查阅也可以分享给大家,这是一种冲动,但是这个或许并不是原厂希望的,尽管这样有可能会牺牲一些时间也有哪天原…...

【C/C++】RPC与线程间通信:高效设计的关键选择

文章目录 RPC与线程间通信&#xff1a;高效设计的关键选择1 RPC 的核心用途2 线程间通信的常规方法3 RPC 用于线程间通信的潜在意义4 主要缺点与限制4.1 缺点列表4.2 展开 5 替代方案6 结论 RPC与线程间通信&#xff1a;高效设计的关键选择 在C或分布式系统设计中&#xff0c;…...

跨线程和跨进程通信还有多种方式对比

📊 常见通信机制对比 通信方式跨线程支持跨进程支持同步/异步性能编程复杂度特点与适用场景SendMessage✅✅(同桌面)同步较高(阻塞)低简单窗口通信、控制PostMessage✅✅(同桌面)异步高低通知、事件触发COM/DCOM✅✅同步/异步中中高系统级服务、进程间服务封装Socket✅…...

RT Thread Studio创建软件和硬件RTC工程

MCU型号&#xff1a;STM32F103RET6 一.配置软件模拟RTC 1.生成一个带串口输出的工程文件&#xff0c;新建RT-Thread项目工程文件。 2.查看电路图中的串口输出管脚&#xff0c;根据STMCubeMx软件可知此串口为USART1&#xff0c;选择芯片型号为STM32F103RET6&#xff0c;控制台…...

Oracle EBS AP发票被预付款核算创建会计科目时间超长

背景 由于客户职能部门的水电、通信和物业等等费用统一管理或对接部门报销费,在报销费的时候,用户把所有费用分摊到各个末级部门,形成AP发票行有上千行, 问题症状 1、用户过账时,请求创建会计科目一直执行20多个小时未完成,只能手工强行取消请求。 2、取消请求以后,从后…...