当前位置: 首页 > news >正文

Elasticsearch的一些基本概念

文章目录

  • 基本概念:文档和索引
    • JSON文档
    • 元数据
    • 索引
    • REST API
  • 节点和集群
    • 节点
      • Master eligible节点和Master节点
      • Data Node 和 Coordinating Node
      • 其它节点
  • 分片(Primary Shard & Replica Shard)
    • 分片的设定
    • 操作命令

基本概念:文档和索引

Elasticsearch是面向文档的,文档是所有可搜索数据的最小单位。

  • 文档会被序列化成JSON格式,保存在Elasticsearch中。
  • JSON对象由字段组成,每个字段都有对应的字段类型(字符串/数值/布尔/日期/二进制/范围类型)。
  • 每个文档都有一个UniqueID,你可以自己指定ID,或者通过Elasticsearch自动生成。

JSON文档

一篇文档包含了一系列的字段,类似数据库表中一条记录,字段的类型可以指定或者通过Elasticsearch自动推算,支持数组,支持嵌套。
在这里插入图片描述

元数据

每一个文档都有一个元数据,元数据是用于标注文档的相关信息的。

  • _index: 文档所属的索引名
  • _type:文档所属的类型名
  • _id:文档唯一ld
  • _source:文档的原始Json数据
  • _all:整合所有字段内容到该字段,7.0版本已被废除
  • _version:文档的版本信息
  • _score:相关性打分
    在这里插入图片描述

索引

索引(Index)是文档的容器,是一类文档的结合。

  • Index体现了逻辑空间的概念:每个索引都有自己的Mapping定义,用于定义包含的文档的字段名和字段类型;
  • Shard体现了物理空间的概念:索引中的数据分散在Shard上
  • 索引的 Mapping定义文档字段的类型,Setting定义不同的数据分布
    在这里插入图片描述
{"settings": {"index": {"creation_date": "1690724511450","number_of_shards": "1","number_of_replicas": "1","uuid": "fl-Kf7M9TiiEpFPfAT6Iew","version": {"created": "7010099"},"provided_name": "movies"}}

REST API

补充:kibana显示中文界面,打开 kibana/config/kibana.yml,最后一行写入 i18n.locale: “zh-CN”,然后重新启动kibana

进入Kibana页面–>开发工具–>console:
在这里插入图片描述

//查看索引信息
GET kibana_sample_data_ecommerce//查看索引的文档总数
GET kibana_sample_data_ecommerce/_count//_cat相关
//根据索引名称关键词通配符查询
GET /_cat/indices/kibana*?&s=index//按照文档个数排序
GET /_cat/indices?v&s=docs.count:desc//查看状态为green的索引
GET /_cat/indices?v&health=green//查看每个索引占用的内存
GET /_cat/indices?v&h=i,tm&s=tm:desc

节点和集群

Elasticsearch分布式系统的高可用性和可扩展性:

  • 服务可用性-允许有节点停止服务
  • 数据可用性-部分节点丢失,不会丢失数据
  • 请求量提升/数据的不断增长(将数据分布到所有节点上)

Elasticsearch分布式架构的特点

  • 存储的水平扩容
  • 提高系统的可用性,部分节点停止服务,整个集群的服务不受影响
  • 不同的集群通过不同的名字来区分,默认名字“elasticsearch”,也可以通过配置文件修改,或者在命令行中-E cluster.name=geektime进行设定
  • 一个集群可以有一个或者多个节点

节点

  • 节点是一个 Elasticsearch的实例,其本质上就是一个 JAVA进程,一台机器 上可以运行多个Elasticsearch进程,但是生产环境一般建议一台机器上只运行一个Elasticsearch实例;
  • 每一个节点都有名字, 通过配置文件配置,或者启动时候 -E node.name=node1 指定。每一个节点在启动之后,会分配一个UID,保存在data目录下。

Master eligible节点和Master节点

  • 每个节点启动后,默认就是一个Master eligible节点(可以通过设置node.master: false 禁止)
  • Master-eligible节点可以参加选主流程,成为Master 节点;当第一个节点启动时候,它会将自己选举成Master节点。
  • 每个节点上都保存了集群的状态,只有Master节点才能修改集群的状态信息。
  • 集群状态(Cluster State) 维护了一个集群中必要的信息,包括:所有的节点信息、所有的索引和其相关的Mapping与Setting 信息、分片的路由信息。任意节点都能修改信息会导致数据的不一致性。

Data Node 和 Coordinating Node

  • 可以保存数据的节点,叫做Data Node,负责保存分片数据,在数据扩展上起到了至关重要的作用。
  • Coordinating Node:负责接受Client的请求,将请求分发到合适的节点,最终把结果汇集到一起;每个节点默认都起到了Coordinating Node的职责。

其它节点

  • Hot & Warm Node:不同硬件配置的Data Node, 用来实现Hot & Warm架构,降低集群部署的成本
  • Machine L earning Node:负责跑机器学习的Job,用来做异常检测
    *Tribe Node:(5.3开始使用Cross Cluster Serarch) Tribe Node连接到不同的Elasticsearch集群,并且支持将这些集群当成一个单独的集群处理

分片(Primary Shard & Replica Shard)

  • 主分片,用以解决数据水平扩展的问题。通过主分片,可以将数据分布到集群内的所有节点之上。一个分片是一个运行的Lucene的实例。主分片数在索引|创建时指定,后续不允许修改,除非Reindex。
  • 副本用以解决数据高可用的问题。分片是主分片的拷贝副本分片数,可以动态地调整。增加副本数,还可以在一定程度上提高服务的可用性(读取的吞吐)

分片的设定

  • 对于生产环境中分片的设定,需要提前做好容量规划。如果分片数设置过小,导致后续无法增加节点实现水品扩展;如果单个分片的数据量太大,导致数据重新分配耗时。
  • 分片数设置过大,7.0开始,默认主分片设置成1, 解决了over-sharding的问题,影响搜索结果的相关性打分,影响统计结果的准确性;单个节点上过多的分片,会导致资源浪费,同时也会影响性能。

操作命令

通过 GET _cluster/health 可以查看集群的健康度
在这里插入图片描述
其中 status的含义如下:

  • Green- 主分片与副本都正常分配
  • Yellow -主分片全部正常分配,有副本分片未能正常分配
  • Red -有主分片未能分配例如,当服务器的磁盘容量超过85%时,去创建了一个新的索引
#查看健康度(按下Command+/可以跳转到官网查看详细用法)
GET _cluster/health#查看node信息
GET _cat/nodes #查看shards信息
GET _cat/shards

相关文章:

Elasticsearch的一些基本概念

文章目录 基本概念:文档和索引JSON文档元数据索引REST API 节点和集群节点Master eligible节点和Master节点Data Node 和 Coordinating Node其它节点 分片(Primary Shard & Replica Shard)分片的设定操作命令 基本概念:文档和索引 Elasticsearch是面…...

Guitar Pro8专业版吉他学习、绘谱、创作软件

Guitar Pro 8 专业版更强大!更优雅!更完美!Guitar Pro 8.0 五年磨一剑!多达30项功能优化!Guitar Pro8 版本一共更新近30项功能,令吉他打谱更出色!Guitar Pro8 是自2017年4月发布7.0之后发布的最…...

SpringBoot复习(39)Servlet容器的自动配置原理

Servlet容器自动配置类为ServletWebServerFactoryAutoConfiguration 可以看到通过Import注解导入了三个配置类: 通过这个这三个配置类可以看出,它们都使用了ConditionalOnClass注解,当类路径存在tomcat相关的类时,会配置一个T…...

【前端 | CSS】盒模型clientWidth、clientHeight、offsetWidht、offsetHeight

图 先看一个例子 html <div class"container"><div class"item">内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容</div> </…...

Django 高级指南:深入理解和使用类视图和中间件

Django 是一款强大的 Python Web 框架&#xff0c;它提供了一套完整的解决方案&#xff0c;让我们能够用 Python 语言快速开发和部署复杂的 Web 应用。在本文中&#xff0c;我们将会深入研究 Django 中的两个高级特性&#xff1a;类视图&#xff08;Class-Based Views&#xff…...

《C语言深度解剖》.pdf

&#x1f407; &#x1f525;博客主页&#xff1a; 云曦 &#x1f4cb;系列专栏&#xff1a;深入理解C语言 &#x1f4a8;吾生也有涯&#xff0c;而知也无涯 &#x1f49b; 感谢大家&#x1f44d;点赞 &#x1f60b;关注&#x1f4dd;评论 C语言深度解剖.pdf 提取码:yunx...

【小梦C嘎嘎——启航篇】string介绍以及日常使用的接口演示

【小梦C嘎嘎——启航篇】string 使用&#x1f60e; 前言&#x1f64c;C语言中的字符串标准库中的string类string 比较常使用的接口对上述函数和其他函数的测试代码演示&#xff1a; 总结撒花&#x1f49e; &#x1f60e;博客昵称&#xff1a;博客小梦 &#x1f60a;最喜欢的座右…...

多个 Github 账户访问 Github

文章目录 多个 Github 账户访问 Github背景步骤 参考 多个 Github 账户访问 Github 背景 如果我想在这台电脑上同时使用两个 Github 账号怎么办呢&#xff1f; 你主机上的 SSH 公钥只能标识出一个账号。如果需要使用另外一个git账号&#xff0c;访问仓库&#xff0c;你需要创…...

c#实现命令模式

下面是一个使用C#实现命令模式的示例代码&#xff1a; using System; using System.Collections.Generic;// 命令接口 public interface ICommand {void Execute();void Undo(); }// 具体命令&#xff1a;打开文件 public class OpenFileCommand : ICommand {private FileMana…...

Kubernetes的默认调度和自定义调度详解

默认调度和自定义调度详解 默认调度 默认调度是 Kubernetes 中的内置机制&#xff0c;它使用调度器组件来管理分配容器的节点。调度器依据以下原则选择合适的节点&#xff1a; 资源需求 &#xff1a;调度器会为每个 Pod 根据其 CPU 和内存需求选择一个具有足够资源的节点。亲…...

使用Spring-Security后,浏览器不能缓存的问题

Spring-Security在默认情况下是不允许客户端进行缓存的&#xff0c;在使用时可以通过禁用Spring-Security中的cacheControl配置项允许缓存。 protected void configure(HttpSecurity http) throws Exception {// 允许缓存配置http.headers().cacheControl().disable(); }...

中睿天下入选河南省网信系统2023年度网络安全技术支撑单位

近日&#xff0c;河南省委网信办发布了“河南省网信系统2023年度网络安全技术支撑单位名单”&#xff0c;中睿天下凭借出色的网络安全技术能力和优势成功入选。 本次遴选由河南省委网信办会同国家计算机网络与信息安全管理中心河南分中心&#xff08;以下简称安全中心河南分中心…...

代码随想录day44 45 46

这部分的题目主要介绍了完全背包的内容&#xff1b; 主要考虑了两种情况&#xff0c;求组合数还是排列数 先遍历背包&#xff0c;再遍历物品&#xff0c;得到的就是组合数&#xff0c;也就是有顺序 for (int j 0; j < amount; j) { // 遍历背包容量for (int i 0; i <…...

一探Linux下的七大进程状态

文章目录 一、前言二、操作系统学科下的进程状态1、运行状态2、阻塞状态3、挂起状态 三、Linux下的7种进程状态1、运行状态R2、浅度睡眠状态S3、深度睡眠状态D一场有趣的官司 4、停止状态T5、进程跟踪状态t6、死亡状态X7、僵死状态Z —— 两个特殊进程① 僵尸进程② 孤儿进程 四…...

香港站群服务器为什么适合seo优化?

​  香港站群为什么适合seo优化?本文主要从以下四点出发进行原因阐述。 1.香港站群服务器的优势 2.香港站群服务器与国内服务器的对比 3.多IP站群服务器的优势 4.香港站群服务器在SEO优化中的注意事项 1.香港站群服务器的优势 香港站群服务器是为了满足企业SEO优化需求而提供…...

虚拟机内搭建CTFd平台搭建及CTF题库部署,局域网内机器可以访问

一、虚拟机环境搭建 1、安装docker、git、docker-compose ubuntu&#xff1a; sudo apt-get update #更新系统 sudo apt-get -y install docker.io #安装docker sudo apt-get -y install git #安装git sudo apt-get -y install python3-pip #安装pip3 sudo pip install dock…...

qq录屏怎么弄?手把手教会你!

“有没有人知道qq怎么录屏呀&#xff0c;听说qq可以录屏&#xff0c;刚好最近需要录制屏幕&#xff0c;就想用qq去录&#xff0c;但是找了很久&#xff0c;都没找到&#xff0c;有人知道吗&#xff0c;谢谢了。” 在如今数字化时代&#xff0c;屏幕录制已成为广泛使用的工具。…...

一文读懂c++语言

一文读懂C语言 C的发展C的设计目标C的特性C的挑战 C的发展 C是一种通用的、高级的编程语言&#xff0c;它是C语言的扩展。C由Bjarne Stroustrup于1983年首次引入&#xff0c;并在之后的几十年中不断发展壮大。C被广泛应用于各种领域&#xff0c;包括系统开发、游戏开发、嵌入式…...

BERT数据处理,模型,预训练

代码来自李沐老师《动手学pytorch》 在数据处理时&#xff0c;首先执行以下代码 def load_data_wiki(batch_size, max_len):"""加载WikiText-2数据集"""num_workers d2l.get_dataloader_workers()data_dir d2l.download_extract(wikitext-2, w…...

Oracle将与Kubernetes合作推出DevOps解决方案!

导读Oracle想成为云计算领域的巨头&#xff0c;但它不是推出自己品牌的云DevOps软件&#xff0c;而是将与CoreOS在Kubernetes端展开合作。七年前&#xff0c;Oracle想要成为Linux领域的一家重量级公司。于是&#xff0c;Oracle主席拉里埃利森&#xff08;Larry Ellison&#xf…...

身份证校验码的奥秘:从算法原理到实际应用

1. 身份证号码的结构解析 每次填写身份证号码时&#xff0c;你有没有好奇过这串数字背后的含义&#xff1f;其实这18位数字就像一个人的数字档案&#xff0c;每一段都藏着特定信息。前6位是地址码&#xff0c;相当于你的户籍所在地的"邮政编码"。接着的8位是出生日期…...

Vivado IP核管理指南:xci vs xcix,哪种方式更适合你的项目?

Vivado IP核管理实战&#xff1a;xci与xcix的深度选择策略 在FPGA开发领域&#xff0c;Vivado作为主流设计工具&#xff0c;其IP核管理方式直接影响着工程的可维护性和团队协作效率。xci和xcix两种IP核保存格式看似只是文件扩展名的差异&#xff0c;实则代表着完全不同的管理哲…...

周红伟:替代龙虾的是什么?从 OpenClaw 到 Hermes:会自己长大的 AI 代理

这篇文章介绍了由 Nous Research 开发的开源 AI 代理 Hermes Agent。与前代产品 OpenClaw 相比&#xff0c;Hermes 最大的突破在于内置了完整的学习闭环——能从经验中自动创建和优化技能、跨会话记忆用户偏好&#xff0c;真正实现"越用越聪明"。文章涵盖项目核心特性…...

AI 编程盛行的时代,为什么 “『DC- WFW』” 仍然具有必要性?淄

这&#xff0c;是一个采用C精灵库编写的程序&#xff0c;它画了一幅漂亮的图形&#xff1a; 复制代码 #include "sprites.h" //包含C精灵库 Sprite turtle; //建立角色叫turtle void draw(int d){for(int i0;i<5;i)turtle.fd(d).left(72); } int main(){ …...

新手必看!立知lychee-rerank-mm部署教程:从安装到调用全流程

新手必看&#xff01;立知lychee-rerank-mm部署教程&#xff1a;从安装到调用全流程 1. 什么是lychee-rerank-mm&#xff1f; lychee-rerank-mm是一个轻量级多模态重排序工具&#xff0c;它能帮你解决一个常见但棘手的问题&#xff1a;当系统返回一堆搜索结果后&#xff0c;如…...

AI时代新型的项目管理应该是什么样的?奔

AI训练存储选型的演进路线 第一阶段&#xff1a;单机直连时代 早期的深度学习数据集较小&#xff0c;模型训练通常在单台服务器或单张GPU卡上完成。此时直接将数据存储在训练机器的本地NVMe SSD/HDD上。 其优势在于IO延迟最低&#xff0c;吞吐量极高&#xff0c;也就是“数据离…...

HarmonyOS 5 + UniApp实战:从‘Hello World’到上架AGC,我的完整调试与提审避坑记录

HarmonyOS 5 UniApp实战&#xff1a;从‘Hello World’到上架AGC&#xff0c;我的完整调试与提审避坑记录 去年夏天接手公司鸿蒙生态迁移项目时&#xff0c;我完全没料到会在UniApp调试环节连续三天卡在证书签名问题上。这份记录不仅包含标准操作手册里的常规步骤&#xff0c;…...

大模型API网关性能暴跌67%?SITS2026认证的4种请求整形策略与实时QPS自适应限流算法

第一章&#xff1a;大模型API网关性能暴跌67%&#xff1f;SITS2026认证的4种请求整形策略与实时QPS自适应限流算法 2026奇点智能技术大会(https://ml-summit.org) 当某头部AI平台的LLM API网关在峰值时段突发QPS骤降67%&#xff0c;日志显示92%的超时请求集中于token长度>4…...

Block Copy 的内存布局详解勘

核心摘要&#xff1a;这篇文章能帮你 ?? 1. 彻底搞懂条件分支与循环的适用场景&#xff0c;告别选择困难。 ?? 2. 掌握遍历DOM集合修改属性的标准姿势与性能窍门。 ?? 3. 识别流程控制中的常见“坑”&#xff0c;并学会如何优雅地绕过去。 ?? 主要内容脉络 ?? 一、痛…...

外卖试吃、霸王餐活动API接口怎么对接?

以微客云为例&#xff0c;外卖试吃 / 霸王餐 API 采用RESTfulJSON&#xff0c;支持美团 / 饿了么双平台&#xff0c;覆盖活动列表、报名 / 领取、核销、订单与统计全链路&#xff0c;适配小程序 / APP/H5 多端&#xff0c;与你常用的PHP/ThinkPHP完美适配。 &#x1f50c; 核心…...