当前位置：首页 > news >正文

Elastic Stack--16--ES三种分页策略

news 2026/5/19 16:17:38

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

方式一：from + size
- 实现原理
- 使用方式
- 优缺点
方式二：scroll
- 实现原理
- 使用方式
- 优缺点
方式三：search_after
- 实现原理
- 使用方式
- 优缺点
三种方式总结

在这里插入图片描述

方式一：from + size

from + size是Elasticsearch中最直观的分页方式。其中，from参数表示从第几条记录开始返回，size参数表示返回的记录数。

实现原理

在这里插入图片描述

使用方式

在Elasticsearch中，使用from和size进行分页查询的DSL（Domain Specific Language）：

GET /your_index/_search
{"query": {"match_all": {}  // 这里可以替换为任何你需要的查询条件},"from": 0,           // 从第几条记录开始，索引从0开始"size": 10,          // 返回的记录条数"sort": [{ "field_name": {"order": "asc"}}  // 可选，根据某个字段进行排序]
}

from参数指定了从哪一条记录开始返回，size参数指定了要返回的记录条数。

假设一个名为products的索引，搜索名称中包含"apple"的产品，并且从第10条记录开始返回10条结果，按价格升序排序：

GET /products/_search
{"query": {"match": {"name": "apple"}},"from": 9,  // 注意，索引从0开始，所以第10条记录的索引是9"size": 10,"sort": [{ "price": {"order": "asc"}}]
}

from设置为9以跳过前9条记录，size设置为10以返回接下来的10条记录，并且结果按照price字段的升序排列。

Elasticsearch会返回如下响应：

{"took": 5,"timed_out": false,"_shards": {"total": 1,"successful": 1,"skipped": 0,"failed": 0},"hits": {"total": {"value": 100,  // 假设总共有100条符合查询条件的产品"relation": "eq"},"max_score": 1.0,"hits": [{"_index": "products","_type": "_doc",  // 注意：在Elasticsearch 7.x及之后的版本中，_type字段通常被设置为"_doc""_id": "10","_score": 1.0,"_source": {"name": "Apple iPhone 12","price": 999.99,// ... 其他字段}},// ... 其他9条产品的结果{"_index": "products","_type": "_doc","_id": "19","_score": 1.0,"_source": {"name": "Apple Watch Series 6","price": 399.99,// ... 其他字段}}]}
}

优缺点

在这里插入图片描述

使用场景

适用于数据量不大、实时性要求高的场景。

方式二：scroll

scroll是一种基于游标的分页方式，它允许我们遍历大量数据而不需要在每次请求时重新计算整个搜索。

实现原理

在这里插入图片描述

使用方式

在Elasticsearch中，scroll是一种用于检索大量数据（可能是数百万条记录）的分页机制，它允许你保持一个搜索的“上下文”并继续检索结果，而不需要为每一页都重新计算整个搜索。以下是使用scroll进行分页的DSL代码示例：

DSL 代码示例

// 初始化scroll搜索
POST /_search/scroll
{"size": 100,           // 每次返回的文档数量"scroll": "1m",        // 保持scroll上下文的活动时间，这里是1分钟"query": {"match_all": {}    // 可替换为任何需要的查询条件}
}// 后续的scroll请求（在第一次请求返回后）
POST /_search/scroll
{"scroll": "1m",        // 保持与第一次请求相同的scroll上下文时间"scroll_id": "你的scroll_id" // 第一次请求返回的scroll_id
}

在这里插入图片描述
响应结果

第一次请求会返回如下结果：

{"_scroll_id": "DnF1ZXJ5THV6QXRlbl84791547351","took": 1,"timed_out": false,"_shards": {"total": 5,"successful": 5,"failed": 0},"hits": {"total": {"value": 1000,"relation": "eq"},"max_score": 1.0,"hits": [{"_index": "your_index","_type": "_doc","_id": "1","_score": 1.0,"_source": {// ... 文档的源数据 ...}},// ... 其他文档 ...]}
}

在这里插入图片描述

响应中可以看到_scroll_id字段，这个值需要用于后续的scroll请求。

后续的scroll请求

使用上面响应中的_scroll_id进行后续的scroll请求：

POST /_search/scroll
{"scroll": "1m","scroll_id": "DnF1ZXJ5THV6QXRlbl84791547351"
}

这个请求会返回下一批文档，直到所有的文档都被检索完或者scroll上下文过期。
根据你的Elasticsearch集群的实际设置和性能需求来调整size和scroll参数的值。

优缺点

在这里插入图片描述

方式三：search_after

search_after是一种基于排序值的分页方式，它允许我们根据上一页的最后一条数据的排序值来获取下一页的数据。

实现原理

在这里插入图片描述

使用方式

在这里插入图片描述

GET /products/_search
{"size": 10,"query": {"match_all": {}  // 或者你可以添加具体的查询条件},"sort": [{ "price": {"order": "desc"}},{ "created_at": {"order": "asc"}}]
}

在这里插入图片描述

{"_index": "products","_type": "_doc","_id": "最后一个产品的ID","_score": null,"_sort": [129.99,  // 最后一个产品的price值"2023-10-23T12:00:00Z"  // 最后一个产品的created_at值],"_source": {// ... 产品的详细信息 ...}
}

在这里插入图片描述

GET /products/_search
{"size": 10,"query": {"match_all": {}  // 保持与初始查询相同的查询条件},"sort": [{ "price": {"order": "desc"}},{ "created_at": {"order": "asc"}}  // 保持与初始查询相同的排序字段和顺序],"search_after": [129.99,  // 上一页最后一个产品的price值"2023-10-23T12:00:00Z"  // 上一页最后一个产品的created_at值]
}

在这里插入图片描述

优缺点

在这里插入图片描述

三种方式总结

在这里插入图片描述

Elastic Stack--16--ES三种分页策略

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录方式一：from size实现原理使用方式优缺点方式二：scroll实现原理使用方式优缺点方式三：search_after实现原理使用方式优缺点三…...

编程日记 2024/10/10 6:00:06

[LeetCode] 315. 计算右侧小于当前元素的个数

题目描述： 给你一个整数数组 nums ，按要求返回一个新数组 counts 。数组 counts 有该性质： counts[i] 的值是 nums[i] 右侧小于 nums[i] 的元素的数量。题目链接： . - 力扣（LeetCode） 题目主要思路&a…...

编程日记 2024/10/10 5:58:05

二叉树篇。 /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* TreeNode right;* TreeNode() {}* TreeNode(int val) { this.val val; }* TreeNode(int val, TreeNode left, TreeNode right) {* …...

编程日记 2024/10/10 5:57:03

如何在在 YOLOv3模型中添加Attention机制

在YOLOv3模型中添加Attention机制需要以下几个步骤： 1. 规定格式当添加新的模块（如Attention机制模块）时，需要像定义[convolutional]、[maxpool]等层在cfg文件中的格式一样，对新模块进行格式规定。例如对于SE模块&a…...

编程日记 2024/10/10 5:56:02

单点登录Apereo CAS 7.1安装配置教程

笔者目前正在做一个单点登录的课题，历时较长总算摸到一些门路，其中的辛酸不易按下不表。截至本文发布，CAS的最新版本为7.1。由于涉及到课题内容，而且内容比较新，整理试验不容易，暂时只对VIP开放，后续课题完成后会完全开放，敬请谅解。 CAS项目区别在CAS的项目选择上，…...

编程日记 2024/10/10 5:54:00

windows C++-移除界面工作线程(一)

本文档演示了如何使用并发运行时将 Microsoft 基础类 (MFC) 应用程序中由用户界面 (UI) 线程执行的工作移动到工作线程。本文档还演示了如何提高冗长绘制操作的性能。通过将阻塞性操作（例如，绘制）卸载到工作线程来从 UI 线程中移除工作&am…...

编程日记 2024/10/10 5:51:57

Qt小bug — LINK : fatal error LNK1158: 无法运行“rc.exe“

Qt小bug —— LINK ：fatal error LNK1158：无法运行"rc.exe" 环境 Qt 5.14.2 MSVC 2015 x64 现象解决在电脑上找到rc.exe 和rcdll.dll （一般在C:\Program Files(x86)\Windows Kits*\bin\x64下面）拷贝到 C:\Qt\Qt5…...

编程日记 2024/10/10 5:50:57

c++小游戏

目录狼人杀走迷宫炸弹人贪吃蛇飞翔的小鸟跑酷吃豆人飞机大战人生模拟器坦克大战修仙模拟器搜集了一些小游戏，名字下是个人是个人喜欢度，可供参考~ 狼人杀 ❤❤❤❤ #include<bits/stdc.h> #include<cstdio> #incl…...

编程日记 2024/10/10 5:49:55

k8s为什么用Calico

‌Calico是一种开源的网络和安全解决方案，主要用于容器、虚拟机、宿主机之间的网络连接。‌ 它支持Kubernetes、OpenShift、Docker EE、OpenStack等PaaS或IaaS平台，提供高效的网络通信和安全控制功能‌12。 Calico的核心组件包括Felix、etcd、BIRD等。F…...

编程日记 2024/10/10 5:48:51

HashMap 和 Hashtable 有什么区别？

HashMap和Hashtable都是Java中常用的存储键值对的集合类，它们都实现了Map接口，但二者之间存在一些显著的区别。以下是对HashMap和Hashtable区别的详细归纳： 一、线程安全性 HashMap：是非线程安全的，即多个线程可以同…...

编程日记 2024/10/10 5:47:50

【机器学习】深度学习、强化学习和深度强化学习？

深度学习、强化学习和深度强化学习是机器学习的三个重要子领域。它们有着各自独特的应用场景和研究目标，虽然都属于机器学习的范畴，但各自的实现方式和侧重点有所不同。 1. 深度学习（Deep Learning） 深度学习是一种基于神经网络的…...

编程日记 2024/10/10 5:45:48

fastadmin 多商户模式下侧边栏跳转路径BUG

记录：仅作自己项目记录，在一个域名下部署多套项目时，若不是多商户模式项目会出现跳转路径问题。修改 \manystore\library\Auth.php 文件的 getSidebar 方法 // 1 改为： $v[url] isset($v[url]) && $v[url] ? $v[url]…...

编程日记 2024/10/10 5:44:47

java内置的四种函数式接口

供给型：Supplier 无入参，有返回值。 FunctionalInterface public interface Supplier<T> {T get();}消费型：Consumer 有入参，无返回值。 FunctionalInterface public interface Consumer<T> {void accept(T t);de…...

编程日记 2024/10/10 5:43:45

如何获取 uni-app 应用发布所需的证书、私钥与配置文件

引言在开发和发布iOS应用时，开发者常常会面临一系列复杂的证书、私钥密码以及配置文件的管理问题。这些配置不仅影响到应用的开发调试，还决定了应用是否能够顺利通过审核并发布到App Store。对于使用uni-app进行开发的开发者来说，自动生成的…...

编程日记 2024/10/10 5:42:43

TCP网络通信——多线程

前面分别用多进程和多路复用完成了TCP网络通信，本文就来讲讲多线程的TCP通信。首先来了解一下线程的概念： 1、线程是进程的执行路线，它是进程内部的控制序列，或者说线程是进程的一部分(进程是一个资源单位，线程是执行单…...

编程日记 2024/10/10 5:41:41

【exp报错注入】

整数范围最大整数 exp 函数介绍报错盲注注入 payload分析 709C-ASCII 值就等于我们下面的 7091-1 ，C就是我们要猜的值，当我们猜测的值和ASCII码相等时，那么exp就不会出现报错，因为1-1还是等于709： 练习 id1 an…...

编程日记 2024/10/10 5:40:39

基于SpringBoot问卷调查系统小程序【附源码】

基于SpringBoot问卷调查系统小程序效果如下： 管理员登录界面管理员功能界面调查人管理界面问卷调查管理界面问卷题目管理界面用户登录界面 APP首页界面公告信息界面研究背景随着科学技术的飞速发展，各行各业都在努力与现代先进技术接轨&…...

编程日记 2024/10/10 5:38:37

LLM - 配置 GraphRAG + Ollama 服务构建中文知识图谱

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/142795151 免责声明：本文来源于个人知识与公开资料，仅用于学术交流，欢迎讨论，不支持转载。 GraphR…...

编程日记 2024/10/10 5:34:33

简单认识redis - 6 redis 存储速度快的原因

1基于内存存储缓存（内存）读写速度很快，相比于磁盘存储的Mysql 省去了磁盘I/O的次数。 2.高效的数据结构 SDS动态字符串： 1.字符串长度处理：Redis获取字符串长度，时间复杂度为O(1)，而C语言中&am…...

编程日记 2024/10/10 5:33:30

【Qt Quick】状态：State 使用

State 是 Qt Quick 中管理界面组件状态的关键工具。它允许我们定义组件的不同状态，并且在用户交互或事件发生时进行状态切换，从而实现属性、外观和行为的动态变化。通过使用 State，可以避免复杂的条件逻辑，使代码更加简洁和可维护…...

编程日记 2024/10/10 5:32:29

MoocDownloader：三步轻松下载中国大学MOOC课程，实现离线学习自由

MoocDownloader：三步轻松下载中国大学MOOC课程，实现离线学习自由【免费下载链接】MoocDownloader An MOOC downloader implemented by .NET. 一枚由 .NET 实现的 MOOC 下载器. 项目地址: https://gitcode.com/gh_mirrors/mo/MoocDownloader 你是…...

编程新知 2026/5/19 15:11:55

技术博主都在悄悄用的Perplexity高级搜索语法，11个未公开符号组合全曝光

更多请点击： https://kaifayun.com 第一章：Perplexity高级搜索语法的底层逻辑与设计哲学 Perplexity 的高级搜索语法并非简单的关键词匹配扩展，而是基于语义意图建模与查询图谱重构的设计实践。其核心在于将用户自然语言查询实时编译为可执行…...

编程新知 2026/5/19 15:03:13

考研数学避坑指南：那些课本不讲但真题爱考的极限与无穷小细节

考研数学避坑指南：那些课本不讲但真题爱考的极限与无穷小细节考研数学中，极限与无穷小的概念看似基础，却暗藏玄机。每年都有大量考生在看似简单的题目上失分，原因往往是对这些概念的深层理解不足。本文将聚焦真题中最常见的陷阱&…...

编程新知 2026/5/19 14:48:42

告别手写UI！用VSCode+QtDesigner+PyQt5，5分钟搞定你的第一个Python图形界面

5分钟极速构建Python GUI：VSCodeQtDesignerPyQt5全流程实战每次看到同事用代码逐行构建UI界面时，总忍不住想起自己初学时的痛苦经历——调整一个按钮位置要反复运行程序，修改边距像素值就像在玩"猜数字"游戏。直到发现QtDesigner这…...

编程新知 2026/5/19 14:46:34

3分钟掌握LaTeX公式转换Word的终极指南

3分钟掌握LaTeX公式转换Word的终极指南【免费下载链接】LaTeX2Word-Equation Copy LaTeX Equations as Word Equations, a Chrome Extension 项目地址: https://gitcode.com/gh_mirrors/la/LaTeX2Word-Equation 还在为学术论文中的数学公式复制烦恼吗？LaTeX…...

编程新知 2026/5/19 13:34:44

从静态地图到动态避障：图解ROS中global_costmap与local_costmap如何协同工作

从静态地图到动态避障：图解ROS中global_costmap与local_costmap如何协同工作在机器人自主导航领域，理解代价地图的工作原理是构建可靠导航系统的关键。想象一下，当人类在陌生城市中导航时，我们会同时参考静态的城市地图和实时观察…...

编程新知 2026/5/19 13:21:25

测试09测试09测试09测试09测试09

测试09测试09测试09测试09测试09...

编程新知 2026/5/19 12:38:06

数字孪生+高斯泼溅+CIMPro孪大师，打造申报“硬通货”

当前，2026年全国智能工厂梯度培育申报窗口期正在密集推进中。从四川、江苏到福建、安徽，各地工信部门纷纷下发《关于做好2026年度智能工厂梯度培育有关工作的通知》，2025年至2027年是基础级、卓越级、领航级智能工厂建设的三年关键窗口期。你…...

编程新知 2026/5/19 11:33:28

别再手动画图了！用Graphviz + Python自动生成流程图，效率提升10倍

用PythonGraphviz实现自动化图表生成：告别低效手绘时代你是否曾在PPT中反复调整箭头位置，只为让一张流程图看起来更专业？或是花半小时拖拽图形，却发现某个节点的颜色需要全局修改？在技术文档、系统架构设计或算法可视…...

编程新知 2026/5/19 10:31:31

如何快速解锁WeMod高级功能：面向游戏玩家的完整免费方案

如何快速解锁WeMod高级功能：面向游戏玩家的完整免费方案【免费下载链接】Wand-Enhancer Advanced UX and interoperability extension for Wand (WeMod) app 项目地址: https://gitcode.com/gh_mirrors/we/Wand-Enhancer 你是否为WeMod免费版的诸多限制感到…...

编程新知 2026/5/19 9:19:04

文章目录

方式一：from + size

实现原理

使用方式

优缺点

方式二：scroll

实现原理

使用方式

优缺点

方式三：search_after

实现原理

使用方式

优缺点

三种方式总结

相关文章：