当前位置: 首页 > news >正文

Elasticsearch7.8.0版本优化——写入速度优化

目录

    • 一、 写入速度优化的概述
    • 二、如何写入速度优化
      • 2.1、 批量数据提交
      • 2.2、 优化存储设备
      • 2.31、 合理使用合并
      • 2.4、 减少 Refresh
      • 2.5、 加大 Flush
      • 2.6、 减少副本的数量

一、 写入速度优化的概述

  • ES 的默认配置,是综合了数据可靠性、写入速度、搜索实时性等因素。实使用时,我们需要根据公司要求,进行偏向性的优化。

  • 针对于搜索性能要求不高,但是对写入要求较高的场景,我们需要尽可能的选择恰当写
    优化策略。综合来说,可以考虑以下几个方面来提升写索引的性能:

    1、加大 Translog Flush ,目的是降低 Iops、Writeblock。

    2、增加 Index Refresh 间隔,目的是减少 Segment Merge 的次数。

    3、调整 Bulk 线程池和队列。

    4、优化节点间的任务分布。

    5、优化 Lucene 层的索引建立,目的是降低 CPU 及 IO。

二、如何写入速度优化

2.1、 批量数据提交

  • ES 提供了 Bulk API 支持批量操作,当我们有大量的写任务时,可以使用 Bulk 来进行批量写入。
  • 通用的策略如下:Bulk 默认设置批量提交的数据量不能超过 100M。数据条数一般是根据文档的大小和服务器性能而定的,但是单次批处理的数据大小应从 5MB~15MB 逐渐增加,当性能没有提升时,把这个数据量作为最大值。

2.2、 优化存储设备

  • ES 是一种密集使用磁盘的应用,在段合并的时候会频繁操作磁盘,所以对磁盘要求较高,当磁盘速度提升之后,集群的整体性能会大幅度提高。

2.31、 合理使用合并

  • Lucene 以段的形式存储数据。当有新的数据写入索引时,Lucene 就会自动创建一个新的段。
  • 随着数据量的变化,段的数量会越来越多,消耗的多文件句柄数及 CPU 就越多,查询效率就会下降。
  • 由于 Lucene 段合并的计算量庞大,会消耗大量的 I/O,所以 ES 默认采用较保守的策略,让后台定期进行段合并

2.4、 减少 Refresh

  • Lucene 在新增数据时,采用了延迟写入的策略,默认情况下索引的 refresh_interval 为1 秒。
  • Lucene 将待写入的数据先写到内存中,超过 1 秒(默认)时就会触发一次 Refresh,然后 Refresh 会把内存中的的数据刷新到操作系统的文件缓存系统中。
  • 如果我们对搜索的实效性要求不高,可以将 Refresh 周期延长,例如 30 秒。这样还可以有效地减少段刷新次数,但这同时意味着需要消耗更多的 Heap 内存。

2.5、 加大 Flush

  • Flush 的主要目的是把文件缓存系统中的段持久化到硬盘,当 Translog 的数据量达到512MB 或者 30 分钟时,会触发一次 Flush。
  • index.translog.flush_threshold_size 参数的默认值是 512MB,我们进行修改。
  • 增加参数值意味着文件缓存系统中可能需要存储更多的数据,所以我们需要为操作系统
    的文件缓存系统留下足够的空间。

2.6、 减少副本的数量

  • ES 为了保证集群的可用性,提供了 Replicas(副本)支持,然而每个副本也会执行分析、索引及可能的合并过程,所以 Replicas 的数量会严重影响写索引的效率。
  • 当写索引时,需要把写入的数据都同步到副本节点,副本节点越多,写索引的效率就越慢。
  • 如 果 我 们 需 要 大 批 量 进 行 写 入 操 作 , 可 以 先 禁 止 Replica 复 制 , 设 置index.number_of_replicas: 0 关闭副本。在写入完成后,Replica 修改回正常的状态。

相关文章:

Elasticsearch7.8.0版本优化——写入速度优化

目录一、 写入速度优化的概述二、如何写入速度优化2.1、 批量数据提交2.2、 优化存储设备2.31、 合理使用合并2.4、 减少 Refresh2.5、 加大 Flush2.6、 减少副本的数量一、 写入速度优化的概述 ES 的默认配置,是综合了数据可靠性、写入速度、搜索实时性等因素。实使…...

【Redis】Redis主从同步中数据同步原理

【Redis】Redis主从同步中数据同步原理 文章目录【Redis】Redis主从同步中数据同步原理1. 全量同步1.1 判断是否第一次数据同步2. 增量同步3. 优化Redis主从集群4. 总结1. 全量同步 主从第一次同步是全量同步。 数据同步包括以下三个阶段: 在从节点执行slaveof命令…...

Python基础—while循环

(1)while循环&#xff1a; 语法格式&#xff1a; while 条件&#xff1a;   执行语句1……   执行语句2…… 适用条件&#xff1a;无限循环 死循环 while True:print(条件是真的&#xff01;)代码实例&#xff1a; i 0 # 创建一个计数的变量 while i < 5: # Truepr…...

linux基础(管道符,检索,vim和vi编辑使用)

♥️作者&#xff1a;小刘在C站 ♥️个人主页&#xff1a;小刘主页 ♥️每天分享云计算网络运维课堂笔记&#xff0c;努力不一定有收获&#xff0c;但一定会有收获加油&#xff01;一起努力&#xff0c;共赴美好人生&#xff01; ♥️夕阳下&#xff0c;是最美的绽放&#xff0…...

GAN | 代码简单实现生成对抗网络(GAN)(PyTorch)

2014年GAN发表&#xff0c;直到最近大火的AI生成全部有GAN的踪迹&#xff0c;快来简单实现它&#xff01;&#xff01;&#xff01;GAN通过计算图和博弈论的创新组合&#xff0c;他们表明&#xff0c;如果有足够的建模能力&#xff0c;相互竞争的两个模型将能够通过普通的旧反向…...

华为面试题就这?00后卷王直接拿下30k华为offer......

先说一下我的情况&#xff0c;某211本计算机&#xff0c;之前在深圳那边做了大约半年多少儿编程老师&#xff0c;之后内部平调回长沙这边&#xff0c;回来之后发现有点难&#xff0c;这边可能是业绩难做&#xff0c;虚假承诺很厉害&#xff0c;要给那些家长虚假承诺去骗人家&am…...

html的常见标签使用

目录 1.vscode基础操作 2.html基础 语法 3.HTML文件的基本结构标签 4.注释标签 5.标题标签 6.段落标签:p 7.格式化标签 8.图片标签:img 绝对路径 相对路径 网络路径 alt属性 title属性 width/height属性 9.超链接标签:a 10.表格标签 11.列表标签 有序列表 无…...

STM32——毕设智能感应窗户

智能感应窗户 一、功能设计 以STM32F103芯片最小系统作为主控&#xff0c;实现自动监测、阈值设定功能和手动控制功能。 1、自动监测模式下&#xff1a; ① 采用温湿度传感器&#xff0c;实现采集当前环境的温度、湿度数值。 ② 采用光敏传感器&#xff0c;实现判断当前的环境…...

golang archive/tar库的学习

archive/tar 是 Golang 标准库中用于读取和写入 tar 归档文件的包。tar 是一种常见的文件压缩格式&#xff0c;它可以将多个文件和目录打包成单个文件&#xff0c;可以用于文件备份、传输等场景。 以下是一些学习 archive/tar 包的建议&#xff1a; 了解 tar 文件格式。在学习…...

MongoDB 详细教程,这一篇就够啦

文章目录1. 简介2. 特点3. 应用场景4. 安装&#xff08;docker&#xff09;5. 核心概念5.1 库5.2 集合5.3 文档6. 基本操作6.1 库6.1.1 增6.1.2 删6.1.3 改6.1.4 查6.2 集合6.2.1 增6.2.2 删6.2.3 改6.2.4 查6.3. 文档6.3.1 增6.3.2 删6.3.3 改6.3.4 查1. 语法2. 对比语法3. AN…...

python为什么慢

解释性 python是动态类型解释性语言&#xff0c;不管使用哪种解释器 因为“解释性语言”这个概念更多地是指代码的执行方式&#xff0c;而不是编译方式。在解释性语言中&#xff0c;代码在执行时会一行一行地解释并执行&#xff0c;而不是预先编译为机器语言。而即使使用了PyP…...

Android kotlin 组件间通讯 - LiveEventBus 及测试(更新中)

<<返回总目录 文章目录 一、LiveEventBus是什么二、测试一、LiveEventBus是什么 LiveEventBus是Android中组件间传递消息,支持AndroidX,Event:事件,Bus:总线 范围全覆盖的消息总线解决方案 进程内消息发送App内,跨进程消息发送App之间的消息发送更多特性支持 免配…...

linux服务器时间同步

Linux服务器时间同步 需求&#xff1a;两台以上服务器之间的时间同步&#xff0c;以其中一台服务器为时间源&#xff0c;其余服务器同步这台时间源服务器的时间 其中&#xff0c;时间源服务器需要有访问外网权限&#xff0c;不然时间源服务器无法同互联网同步最新的时间&#…...

扒系统CR8记录

目录 终极改造目标 过程记录 参考 为了将一套在线安装的系统&#xff0c;在不了解其架构、各模块细节的基础上&#xff0c;进行扒弄清楚&#xff0c;作以下记录。 终极改造目标 最终的目标&#xff0c;就是只通过CreMedia8_20230207.tar.gz解压 install 就把业务包安装了&…...

面试题(基础篇)

1、你是怎样理解OOP面向对象的面向对象是利于语言对现实事物进行抽象。面向对象具有以下特征&#xff1a;&#xff08;1&#xff09;继承&#xff1a;继承是从已有类得到继承信息创建新类的过程&#xff08;2&#xff09;封装&#xff1a;通常认为封装是把数据和操作数据的方法…...

如何利用ReconPal将自然语言处理技术应用于信息安全

关于ReconPal 网络侦查一直是网络安全研究以及渗透测试活动中最重要的阶段之一&#xff0c;而这一阶段看起来很容易&#xff0c;但往往需要很大的努力和很强的技术才能做好来。首先&#xff0c;我们需要使用正确的工具、正确的查询/语法以及正确的操作&#xff0c;并将所有信息…...

攻略 | 6步帮助中小微企业开拓东盟机电产品市场

如何帮助中小微外贸企业在东盟市场拓展机电产品一般贸易&#xff1f;随着全球化的发展&#xff0c;越来越多的中小微外贸企业开始涉足国际贸易。对于机电产品行业而言&#xff0c;东盟市场是一个非常重要的出口目的地。本文将为您介绍如何帮助中小微外贸企业在东盟市场拓展机电…...

Linux服务器磁盘分区、挂载、卸载及报错处理

整体操作是&#xff1a;先对磁盘进行格式化&#xff0c;格式化后挂载到需要的挂载点&#xff0c;最后添加分区启动表&#xff0c;以便下次系统启动时自动挂载。一、linux分区1、Linux来说wulun有几个分区&#xff0c;分给哪一目录使用&#xff0c;他归根结底只有一个根目录&…...

JavaScript基础语法入门

一. JS简介 JavaScript , 简称JS, JS最初只是为了进行前端页面开发, 但随这后来JS越来越火之后, JS就被赋予了更多的功能, 可以用来开发桌面程序, 手机App, 服务器端的程序等… JS是一种动态类型, 弱类型的脚本语言, 通过解释器运行, 主要在客户端和浏览器上运行, 比如Chrome…...

Linux基础命令-ln创建链接文件

文章目录 ln 命令介绍 命令格式 基本参数 参考实例 1&#xff09; 创建文件的硬链接 2&#xff09;创建文件的软链接 3&#xff09;创建链接文件时&#xff0c;相同目标文件创建备份文件 命令总结 ln 命令介绍 先看下帮助文档中的含义 NAME ln - make links …...

TradingView-ML-GUI:量化交易者的机器学习策略可视化实验平台

1. 项目概述&#xff1a;一个为交易者打造的机器学习图形界面 如果你是一个对量化交易和机器学习都感兴趣的开发者或交易员&#xff0c;大概率遇到过这样的困境&#xff1a;你有一个绝佳的交易策略想法&#xff0c;也懂一些机器学习模型&#xff0c;但每次想验证一个想法&…...

如何用PyWxDump破解微信数据解析的三大技术壁垒:从困境到突破的完整指南

如何用PyWxDump破解微信数据解析的三大技术壁垒&#xff1a;从困境到突破的完整指南 【免费下载链接】PyWxDump 删库 项目地址: https://gitcode.com/GitHub_Trending/py/PyWxDump 微信数据解析一直是个技术难题&#xff0c;就像试图打开一个不断变换密码的智能保险箱。…...

【信息科学与工程学】【物理/化学科学和工程技术】知识体系018 第十八篇 界面科学02 界面化学特征 (1)

表3 界面化学特征 完整知识地图框架 第一部分:3.1 界面结构与缺陷 3.1.1 界面原子构型 (50个) 3.1.1.1 共格界面 3.1.1.2 半共格界面 3.1.1.3 非共格界面 3.1.1.4 重构界面 3.1.1.5 驰豫界面 3.1.1.6 晶格失配 3.1.1.7 临界厚度 3.1.1.8 失配位错 3.1.1.9 失配位错…...

UCSC基因组浏览器可视化配置实战:从参数调优到多组学数据呈现

1. UCSC基因组浏览器入门&#xff1a;为什么选择它&#xff1f; 第一次接触UCSC基因组浏览器是在分析RNA-seq数据时&#xff0c;当时需要直观展示基因表达差异。这个由加州大学圣克鲁兹分校维护的工具&#xff0c;已经成为生物信息学领域的标准配置。它最吸引我的特点是零代码…...

【2025最新】基于SpringBoot+Vue的汽车资讯网站管理系统源码+MyBatis+MySQL

摘要 随着互联网技术的快速发展&#xff0c;汽车行业的信息化需求日益增长&#xff0c;传统的汽车资讯获取方式已无法满足用户对实时性、交互性和个性化服务的需求。汽车资讯网站作为信息传播的重要平台&#xff0c;亟需一套高效、稳定且易于维护的管理系统&#xff0c;以提升用…...

一天2710亿Token!“爱马仕”反超“龙虾”,AI Agent进入真实用量竞争阶段

“爱马仕”登顶全球应用调用榜5月9日&#xff0c;Hermes Agent&#xff08;昵称&#xff1a;爱马仕&#xff09;登顶OpenRouter全球应用调用量榜首&#xff0c;首次超越OpenClaw&#xff08;昵称&#xff1a;龙虾&#xff09;。据OpenRouter应用Token消耗榜最新数据&#xff0c…...

linux学习进展 I/O复用函数——poll详解

在前几篇笔记中&#xff0c;我们学习了I/O复用的基础概念以及select函数的使用&#xff0c;了解到select通过监视多个文件描述符的读写状态&#xff0c;实现了单进程处理多I/O事件的需求。但select存在明显的局限性&#xff0c;比如最大文件描述符数量限制、参数传递繁琐、内核…...

Wireshark抓包实战:手把手教你解析IEC61850 GOOSE报文(附ASN.1解码技巧)

Wireshark实战解析IEC61850 GOOSE报文&#xff1a;从抓包到ASN.1解码全流程 在智能变电站自动化系统中&#xff0c;GOOSE&#xff08;Generic Object Oriented Substation Event&#xff09;报文作为IEC61850标准的核心通信机制&#xff0c;承担着保护跳闸、断路器位置信号等关…...

10分钟为Royal TSX打造完美中文界面:从英文迷茫到母语掌控

10分钟为Royal TSX打造完美中文界面&#xff1a;从英文迷茫到母语掌控 【免费下载链接】Royal_TSX_Chinese_Language_Pack Royal_TSX的简体中文汉化包 项目地址: https://gitcode.com/gh_mirrors/ro/Royal_TSX_Chinese_Language_Pack 当您第一次打开Royal TSX这款强大的…...

OpenClaw用户迁移至Taotoken平台的具体配置步骤详解

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 OpenClaw用户迁移至Taotoken平台的具体配置步骤详解 如果你正在使用OpenClaw这类Agent框架&#xff0c;并希望将后端模型服务切换至…...