深入解析 Elasticsearch 集群配置文件参数
在自建 Elasticsearch 集群时,我们需要通过 elasticsearch.yml 文件对节点角色、网络设置、集群发现和数据存储路径等进行灵活配置。配置项的合理设置对集群的稳定性、性能与扩展性影响深远。本文将以一个示例配置文件为蓝本,逐条解析各参数的含义与建议用法。
以下为示例配置文件片段(IP 地址与节点名称使用泛指占位,实际部署中请根据实际情况替换):
cluster.name: my-application
node.name: node-2
path.data: /data/data
path.logs: /data/logs
network.host: 0.0.0.0
network.publish_host: <NODE_IP>
node.attr.ip: <NODE_IP>
http.port: 9200
discovery.seed_hosts: ['<IP_1>', '<IP_2>', '<IP_3>', ...]
cluster.initial_master_nodes: ['node-1', 'node-2', 'node-3']
action.destructive_requires_name: true
node.roles: [master]
下面我们将逐项进行说明。
1. 集群与节点命名
cluster.name: my-application
- 作用:定义集群的名称。
- 含义:Elasticsearch 在同一网络中可以存在多个集群,通过给定独立的 cluster.name,可使节点只加入对应名称的集群。
- 建议:为集群选择有意义的命名方案,便于在多集群环境中识别。
node.name: node-2
- 作用:指定该节点在集群中的唯一名称。
- 含义:人类可读的节点名称有助于在运维与监控中快速定位问题节点。
- 建议:为节点名称使用统一规则(如 node-1、node-2)或使用有意义的别名。
2. 存储与日志路径
path.data: /data/data
- 作用:定义存储 Elasticsearch 索引数据的目录。
- 含义:此目录应有足够的磁盘容量和高 IO 性能。
- 建议:在生产环境中使用独立存储卷(如 SSD),并确保权限和磁盘空间充足。
path.logs: /data/logs
- 作用:定义 Elasticsearch 日志文件的存放路径。
- 含义:日志有助于故障排查与审计分析。
- 建议:单独的日志目录便于日志轮转和监控,确保不与数据目录混用,以便更好地管理。
3. 网络配置
network.host: 0.0.0.0
- 作用:设置 Elasticsearch 监听的网络接口地址。
- 含义:
0.0.0.0表示监听所有网卡的 IP 地址,以便节点对集群内或外部请求开放访问。 - 建议:生产中可能希望更严格的访问控制,可设置为内网 IP 或使用防火墙限制访问。
network.publish_host: <NODE_IP>
- 作用:节点将该 IP 通告给集群中的其他节点作为其可访问地址。
- 含义:当集群节点相互通信时,将使用
publish_host指定的地址来连接。 - 建议:确保此 IP 为集群内其他节点可访问的稳定内网地址。
node.attr.ip: <NODE_IP>
- 作用:为节点添加自定义属性(如 ip 属性),在做 shard 分配或路由策略时可利用该属性。
- 含义:属性标签可在 Elasticsearch 中用于 shard 分配过滤(allocation filtering),从而把数据分配到特定节点上。
- 建议:仅在有高级调度和部署策略需求时使用此特性。
http.port: 9200
- 作用:指定 Elasticsearch HTTP 接口监听的端口(用于查询、索引和 REST API 访问)。
- 建议:默认是 9200,可根据需要更改。确保安全组/防火墙已开放此端口。
4. 集群发现与初始配置
discovery.seed_hosts: ['<IP_1>', '<IP_2>', '<IP_3>', ...]
- 作用:定义最初用于集群发现的节点列表。
- 含义:当新加入的节点启动时,会连接此列表中的种子节点以获取集群信息,并与主节点通信。
- 建议:列出集群中多个已知节点的内网 IP 地址,可提升集群发现的可靠性。
cluster.initial_master_nodes: ['node-1', 'node-2', 'node-3']
- 作用:在首次启动集群或全新集群节点时定义初始主节点投票成员。
- 含义:通过此配置,Elasticsearch 能在第一次启动时选举出主节点,避免集群处于无主状态。
- 建议:只在全新部署集群时设置,一旦集群形成后,通常无需再次修改。
5. 安全与危险操作限制
action.destructive_requires_name: true
- 作用:防止在执行删除索引操作时使用通配符(如
_all或*)导致误删所有索引。 - 含义:要求对 destructive 操作(如
DELETE /index*)明确指定索引名称,提升数据安全性。 - 建议:在生产环境中务必开启该设置,以减少误操作风险。
6. 节点角色配置
node.roles: [master]
- 作用:指定节点角色,如
master、data、ingest等。此处仅以master为例。 - 含义:主节点负责集群元数据管理、节点故障检测和分片分配决策,而数据节点负责存储和查询数据,ingest 节点负责预处理数据管道。
- 建议:将节点角色分离有助于提升集群稳定性和性能(如在大型集群中,有专门的 master-only 节点)。根据实际需求设置适合的角色组合。
总结
通过上面的参数解析,我们可以看出 elasticsearch.yml 文件对 Elasticsearch 集群运行行为有着关键影响。从基础的集群和节点命名,到数据和日志存储,再到网络配置和集群发现机制,每个参数都与集群的稳定性、可扩展性和安全性息息相关。
在实践中,请根据以下建议进行配置:
- 清晰定义集群和节点名称:易于识别和管理。
- 独立存储数据与日志:为数据提供高性能与安全的持久化存储。
- 安全的网络设置:使用内网 IP 作为 publish_host,根据需要限制访问。
- 合理的发现和主节点配置:确保集群在初次启动时能正常选举主节点,并有足够的 seed 节点进行自动发现。
- 安全保护措施:开启
action.destructive_requires_name避免误操作。 - 明确分配节点角色:根据业务规模和查询/索引需求进行角色分离,提升集群性能和可靠性。
通过理解并合理配置这些参数,您将能够搭建一个高效、稳定且易于扩展的 Elasticsearch 集群,为上层应用和数据分析业务提供坚实基础。
相关文章:
深入解析 Elasticsearch 集群配置文件参数
在自建 Elasticsearch 集群时,我们需要通过 elasticsearch.yml 文件对节点角色、网络设置、集群发现和数据存储路径等进行灵活配置。配置项的合理设置对集群的稳定性、性能与扩展性影响深远。本文将以一个示例配置文件为蓝本,逐条解析各参数的含义与建议…...
WebMvcConfigurer和WebMvcConfigurationSupport(MVC配置)
一:基本介绍 WebMvcConfigurer是接口,用于配置全局的SpringMVC的相关属性,采用JAVABean的方式来代替传统的XML配置文件,提供了跨域设置、静态资源处理器、类型转化器、自定义拦截器、页面跳转等能力。 WebMvcConfigurationSupport是webmvc的…...
用 javascript 来回答宇宙外面是什么
宇宙外面是什么呢? 估计这个问题要困扰很多人, 让我们用一段 javascript 代码来回答一下. 一, 从一段代码说起 var 地球 {名字 : "地球",女友 : "月亮",外面 : {名字 : "太阳系",老大 : "太阳",老二 : {名字 : "木星",二…...
我的性能优化经验
专业方向:App cpu/memory/gpu/流畅度/响应时间的优化,Anr,Framework CarPowerManagementService模块的(STR),从0~1完成性能监控体系搭建,完成3大版本迭代高质量性能交付 响应时间: …...
XSLT 编辑 XML
XSLT 编辑 XML 介绍 XSLT(可扩展样式表语言转换)是一种用于转换XML文档的语言。它允许开发人员将XML数据转换为其他格式,如HTML、PDF或纯文本。XSLT通过使用XPath查询来定位XML文档中的元素,并对这些元素应用转换规则。在本教程…...
数智读书笔记系列010 生命3.0:人工智能时代 人类的进化与重生
书名:生命3.0 生命3.0:人工智能时代,人类的进化与重生 著者:[美]迈克斯•泰格马克 迈克斯・泰格马克 教育背景与职业 教育背景:迈克斯・泰格马克毕业于麻省理工学院,获物理学博士学位。职业经…...
Transfomer的各层矩阵
一、输入 输入一句话:Hello CYZLAB the inspired world 每个单词为一个token 二、Embedding 这里的词向量维度为6,矩阵的行数为token数,列数是词向量的维度 这列是注释不算hello122694CYZLAB222372the222596inspired132440world431273 …...
代码随想录第51天
99.岛屿数量 深搜 import java.util.*;class Main{static int[][] directions {{0, 1}, {1, 0}, {0, -1}, {-1, 0}};static boolean[][] visited;public static void main(String[] args) {Scanner sc new Scanner(System.in);int n sc.nextInt();int m sc.nextInt();int…...
基础库httpx的使用
urllib 库和 requests 库的使用,已经可以爬取绝大多数网站的数据,但对于某些网站依然无能为力。什么情况?这些网站强制使用HTTP/2.0协议访问,这时 urllib 和requests 是无法爬取数据的,因为它们只支持 HTTP/1.1,不支持…...
c++中如何保持结构体的线程安全?3D坐标的线程安全:从理论到最优解
使用mutex的困扰 struct Point3d {std::mutex mtx;double x, y, z;void set(double nx, double ny, double nz) {std::lock_guard<std::mutex> lock(mtx);x nx; y ny; z nz;} };这种方案虽然安全,但性能开销确实不小。每次访问都需要加锁解锁,…...
Zabbix6.0升级为6.4
为了体验一些新的功能,比如 Webhook 和问题抑制等,升级个小版本。 一、环境信息 1. 版本要求 一定要事先查看官方文档,确认组件要求的版本,否则版本过高或者过低都会出现问题。 2. 升级前后信息 环境升级前升级后操作系统CentOS…...
答题考试系统v1.6.1高级版源码分享+uniapp+搭建测试环境
一.系统介绍 一款基于FastAdminThinkPHPUniapp开发的小程序答题考试系统,支持多种试题类型、多种试题难度、练题、考试、补考模式,提供全部前后台无加密源代码,支持私有化部署 二.测试环境 系统环境:CentOS、 运行环境&#x…...
【Lua热更新】下篇 -- 更新中
上篇链接:【Lua热更新】上篇 文章目录 三、xLua热更新📖1.概述📚︎2.导入xLua框架🔖3. C#调用Lua3.1Lua解析器3.2Lua文件夹的重定向3.3Lua解析器管理器3.4全局变量获取3.5全局函数获取3.6映射到List和Dictionary3.7映射到类3.8映…...
射频测试入门学习(三)——程控仪器是怎样和电脑连接通信的
目录 一、程控仪器需要哪些条件 二、可程控仪器 三、专业的仪器通信软件、驱动 四、编程语言 五、电脑控制仪器条件汇总 六、仪器指令查询 七、结语 一、程控仪器需要哪些条件 1、需要具备硬件条件(可程控的仪器、个人计算机(PC)) 2、专业的仪器通信软件、驱动 3、…...
并发控制之Semaphore
Semaphore 作用 信号量,用于控制同时访问特定资源的线程数量,通过协调各个线程,以确保对共享资源的访问不会导致冲突或数据不一致等问题,有点类似令牌桶,内部维护一组许可证, acquire获取许可证…...
第R3周:RNN-心脏病预测
🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 🍺要求: 1 本地读取并加载数据。 2 了解循环神经网络(RNN)的构建过程 3 测试集accuracy到达87% 🍻拔…...
【数值特性库】入口文件
数值特性库入口文件为lib.rs。该文件定义一系列数字特性的trait(特征),这些特性可以被不同的数字类型实现,从而提供一套通用的数值操作方法。下面是对代码中关键部分的解释: 一、基础设置 #![doc(html_root_url “h…...
RestTemplate实时接收Chunked编码传输的HTTP Response
学习调用AI接口的时候,流式响应都是使用的 Transfer-Encoding: chunked,图方便想用RestTemplate,但是平时用到的都是直接返回响应对象的类型。使用bing搜索到一种方式,使用下面的代码来读取,于是掉这个坑里了ÿ…...
GIT区域介绍及码云+GIt配置仓库
GIT区域介绍 创建文件夹git init 1、git有3个区域 工作区(working directory):项目的根目录,不包 括.git在内的其他文件暂存区(stage area):是一个看不见的区域,git add 命令就是将文…...
网络安全怎么学习
当我们谈论网络安全时,我们正在讨论的是保护我们的在线空间,这是我们所有人的共享责任。网络安全涉及保护我们的信息,防止被未经授权的人访问、披露、破坏或修改。 一、网络安全的基本概念 网络安全是一种保护:它涉及保护我们的设…...
synchronized 学习
学习源: https://www.bilibili.com/video/BV1aJ411V763?spm_id_from333.788.videopod.episodes&vd_source32e1c41a9370911ab06d12fbc36c4ebc 1.应用场景 不超卖,也要考虑性能问题(场景) 2.常见面试问题: sync出…...
基于当前项目通过npm包形式暴露公共组件
1.package.sjon文件配置 其中xh-flowable就是暴露出去的npm包名 2.创建tpyes文件夹,并新增内容 3.创建package文件夹...
Qt Http Server模块功能及架构
Qt Http Server 是 Qt 6.0 中引入的一个新模块,它提供了一个轻量级的 HTTP 服务器实现,主要用于构建基于 HTTP 的应用程序和服务。 功能介绍: 主要功能 HTTP服务器功能: 支持 HTTP/1.1 协议 简单的请求/响应处理模型 支持 GET…...
LLM基础1_语言模型如何处理文本
基于GitHub项目:https://github.com/datawhalechina/llms-from-scratch-cn 工具介绍 tiktoken:OpenAI开发的专业"分词器" torch:Facebook开发的强力计算引擎,相当于超级计算器 理解词嵌入:给词语画"…...
【学习笔记】深入理解Java虚拟机学习笔记——第4章 虚拟机性能监控,故障处理工具
第2章 虚拟机性能监控,故障处理工具 4.1 概述 略 4.2 基础故障处理工具 4.2.1 jps:虚拟机进程状况工具 命令:jps [options] [hostid] 功能:本地虚拟机进程显示进程ID(与ps相同),可同时显示主类&#x…...
C++八股 —— 单例模式
文章目录 1. 基本概念2. 设计要点3. 实现方式4. 详解懒汉模式 1. 基本概念 线程安全(Thread Safety) 线程安全是指在多线程环境下,某个函数、类或代码片段能够被多个线程同时调用时,仍能保证数据的一致性和逻辑的正确性…...
Aspose.PDF 限制绕过方案:Java 字节码技术实战分享(仅供学习)
Aspose.PDF 限制绕过方案:Java 字节码技术实战分享(仅供学习) 一、Aspose.PDF 简介二、说明(⚠️仅供学习与研究使用)三、技术流程总览四、准备工作1. 下载 Jar 包2. Maven 项目依赖配置 五、字节码修改实现代码&#…...
网站指纹识别
网站指纹识别 网站的最基本组成:服务器(操作系统)、中间件(web容器)、脚本语言、数据厍 为什么要了解这些?举个例子:发现了一个文件读取漏洞,我们需要读/etc/passwd,如…...
在QWebEngineView上实现鼠标、触摸等事件捕获的解决方案
这个问题我看其他博主也写了,要么要会员、要么写的乱七八糟。这里我整理一下,把问题说清楚并且给出代码,拿去用就行,照着葫芦画瓢。 问题 在继承QWebEngineView后,重写mousePressEvent或event函数无法捕获鼠标按下事…...
JVM虚拟机:内存结构、垃圾回收、性能优化
1、JVM虚拟机的简介 Java 虚拟机(Java Virtual Machine 简称:JVM)是运行所有 Java 程序的抽象计算机,是 Java 语言的运行环境,实现了 Java 程序的跨平台特性。JVM 屏蔽了与具体操作系统平台相关的信息,使得 Java 程序只需生成在 JVM 上运行的目标代码(字节码),就可以…...
