当前位置: 首页 > news >正文

Elasticsearch检索方案之一:使用from+size实现分页

      前面两篇文章介绍了elasticsearch以及Kibana的安装,检索引擎以及可视化工具都已经安装完成,接下来介绍下如何使用golang的sdk实现简单的分页查询。

1、下载Elastic官方golang sdk

在讲解elasticsearch检索之前,需要先把golang的环境安装好,go的安装可以参考官方文档,mac、linux下的安装都非常简单,参考以下文档:

go下载地址:https://go.dev/dl/
安装说明:https://go.dev/doc/install

安装完成后,把goproxy改成国内代理,执行以下命令:

go env -w GOPROXY=https://goproxy.cn,direct

下载elasticsearch官方golang包:

go get github.com/elastic/go-elasticsearch/v8

或者直接在代码里引入该包,之后通过命令:

go mod tidy

来下载各种依赖包。

2、测试数据说明

es中一共写入了11000条数据,doc_id字段标识了数据的索引,有助于说明本文分享的使用from+size参数的检索。

3、使用from+size实现分页检索

首先定义检索结果的基础数据结构:


// 最外层数据结构
type Documents struct {Shards   Shards      `json:"_shards"`Hits     HitOutLayer `json:"hits"`TimedOut bool        `json:"timed_out"`Took     int         `json:"took"`
}
type Shards struct {Failed     int `json:"failed"`Skipped    int `json:"skipped"`Successful int `json:"successful"`Total      int `json:"total"`
}
type HitOutLayer struct {Hits     []Hits  `json:"hits"`MaxScore float64 `json:"max_score"`Total    Total   `json:"total"`
}
type Hits struct {ID     string         `json:"_id"`Index  string         `json:"_index"`Score  float64        `json:"_score"`Source map[string]any `json:"_source"`Type   string         `json:"_type"`
}
type Total struct {Relation string `json:"relation"`Value    int    `json:"value"`
}

连接es,es8默认是通过https进行连接,因此在连接时需要设置证书,证书的位置在es路径下的config文件夹中:

 连接es的代码如下:

cert, _ := os.ReadFile("/Users/liupeng/Documents/study/elasticsearch-8.17.0/config/certs/http_ca.crt")
client, err := elasticsearch.NewClient(elasticsearch.Config{Username:  "elastic",Password:  "XBS=adqa799j_Aoz=A+h",Addresses: []string{"https://127.0.0.1:9200"},CACert:    cert,
})

构建检索dsl,跳过前面1000个文档,检索10条文档:

dslQuery := esbuilder.NewDsl()
boolQuery := esbuilder.NewBoolQuery()
boolQuery.Filter(esbuilder.NewRangeQuery("doc_id").Gte(1))
dslQuery.SetQuery(boolQuery)
dslQuery.SetFrom(1000)
dslQuery.SetSize(3)
dslQuery.SetOrder(esbuilder.NewSortQuery("doc_id", "asc"))
dsl := dslQuery.BuildJson()

构建dsl我使用了自研的构建dsl的库:

github.com/liupengh3c/esbuilder

主打一个方便,就不用开发者自行去拼凑dsl了,开发成本降低了许多。

执行检索过程,并把检索到的内容进行打印:

search := esapi.SearchRequest{Index: []string{"new_tag_202411"},Body:  strings.NewReader(dsl),
}
resp, err := search.Do(context.Background(), client)
if err != nil {fmt.Println("search err:", err.Error())return
}
json.NewDecoder(resp.Body).Decode(&docs)
strDoc, _ := json.MarshalToString(docs)
fmt.Println(strDoc)

理论上,应该打印doc_id从1001开始到1003的3条数据,打印出来的数据如下:

{"_shards": {"failed": 0,"skipped": 0,"successful": 1,"total": 1},"hits": {"hits": [{"_id": "JME17xx_adc_behavior_NOJUNCTION_STRAIGHT_1_1732982184160_1732982184860_1733030180041","_index": "new_tag_202411","_score": 0,"_source": {"adc_behavior": "NOJUNCTION_STRAIGHT","car_id": "JME17xx","create_time": "2024-12-23 21:34:51","doc_id": 1001,"end_time": 1732982184860,"rule_id": 1,"rule_priority": 1,"rule_version": "2.1.0.0","start_time": 1732982184160,"tag_additional_info": {"adc_driving_mode": "COMPLETE_MANUAL","average_speed": 0.003893,"driving_mode": 0,"end_point": {"x": 222294.311402,"y": 3373118.699096,"z": 14.721843},"start_point": {"x": 222294.312234,"y": 3373118.698359,"z": 14.721373}},"tag_name": "adc_behavior","user": "liupeng"},"_type": ""},{"_id": "JME18xx_adc_behavior_NOJUNCTION_STRAIGHT_1_1732982184140_1732982218540_1733030184257","_index": "new_tag_202411","_score": 0,"_source": {"adc_behavior": "NOJUNCTION_STRAIGHT","car_id": "JME18xx","create_time": "2024-12-23 21:34:51","doc_id": 1002,"end_time": 1732982218540,"rule_id": 1,"rule_priority": 1,"rule_version": "2.1.0.0","start_time": 1732982184140,"tag_additional_info": {"adc_driving_mode": "COMPLETE_AUTO_DRIVE","average_speed": 3.86589,"driving_mode": 1,"end_point": {"x": 219886.247841,"y": 3374513.249021,"z": 8.882025},"start_point": {"x": 219576.290596,"y": 3374298.199175,"z": 9.130117}},"tag_name": "adc_behavior","user": "liupeng"},"_type": ""},{"_id": "ARCFxx_adc_behavior_U_TURN_1_1732982184047_1732982227367_1733030187627","_index": "new_tag_202411","_score": 0,"_source": {"adc_behavior": "U_TURN","car_id": "ARCFxx","create_time": "2024-12-23 21:34:52","doc_id": 1003,"end_time": 1732982227367,"rule_id": 1,"rule_priority": 1,"rule_version": "2.1.0.0","start_time": 1732982184047,"tag_additional_info": {"adc_driving_mode": "COMPLETE_AUTO_DRIVE","average_speed": 10.146669,"driving_mode": 1,"end_point": {"x": 228474.086367,"y": 3392800.40123,"z": 8.736978},"start_point": {"x": 228502.4916,"y": 3392823.01595,"z": 8.714573}},"tag_name": "adc_behavior","user": "liupeng"},"_type": ""}],"max_score": 0,"total": {"relation": "gte","value": 10000}},"timed_out": false,"took": 2
}

结果的返回是符合预期的,perfect。

4、一个很重要的知识点

form+size的这种分页方式,是有前提的,就是只能检索10000条以内的数据,如果超过10000,那就不灵了,超过10000后,一条数据都不会返回,比如我们将设置from、size的代码改成如下:

dslQuery := esbuilder.NewDsl()
boolQuery := esbuilder.NewBoolQuery()
boolQuery.Filter(esbuilder.NewRangeQuery("doc_id").Gte(1))
dslQuery.SetQuery(boolQuery)
dslQuery.SetFrom(9998)
dslQuery.SetSize(3)
dslQuery.SetOrder(esbuilder.NewSortQuery("doc_id", "asc"))
dsl := dslQuery.BuildJson()

跳过前面9998条,检索3条数据出来,很明显,这样的检索条件是超过了10000条的,执行代码后,检索没有结果:

所以这种检索分页方式存在局限性,在10000条数据之内可以这么使用,但是一旦超过10000就会有问题,当然,我们也不用担心,elastic是有解决方案的,我会再单独写文章来介绍。

5、one more thing

我在自己的macbook上【在家里】安装了es,注意关键信息,是【在家里】安装的,上班的时候把自己电脑带到了公司,上班摸鱼的时候我打开了自己电脑,连接wifi,启动es、kibana,准备把公司mac上es的数据copy到自己mac上,问题来了,自己mac上kibnan启动不了了,启动不了了......,我很纳闷,啥情况?为啥启动不了了?难道是我替换了es文件夹下data的缘故吗?重新恢复为自己的data,问题依旧。

下班心想,还得把公司电脑上es的数据拷贝一份到自己mac上,以用来测试,就把公司mac带回家,连接家里的wifi,我满怀期待的打开电脑准备倒数据,结果公司电脑的kibana也启动不了,启动不了了,我的天哪,这是见鬼了吗,啥情况呢?自己电脑上的kibana能启动了,这是在外面认生吗,得回到自己家才能启动,这是问题1,这个时候我心想,公司电脑上kibana启动不了就算了,我直接用自己mac跑代码读取公司mac上es的数据,然后写入到本地的es上,问题又来了,竟然连接不上,提示证书授权的ip没有当前ip,这完蛋了,这是问题2。

于是我就停下来,大概想了一下问题的始末,大概明白了,es8的安全证书对网络加了校验,既然我通过自己mac连接不上公司mac,现在所处的网络是家里,那就说明自己mac的证书是有效的,于是就调换一下,从公司mac上跑代码,读取本机,写入到自己mac上,结果还真成了。

但是kibana更换网络无法启动的问题还未解决,这个问题不解决,也就是说只要不是在家里,kibana就打不开,es不能做的这么傻吧,于是今天到公司后,请教了elastic中国社区首席布道师刘晓国老师,刘老师非常热情的直接电话过来,解释了kibana无法打开的原因以及解决办法,在这里对刘老师的帮助表达诚挚感谢,非常感谢刘老师。推荐大家看看刘老师的博客:Elastic:开发者上手指南-CSDN博客

接下来我们说kibana无法打开的原因,还是证书问题,kibana在启动时,对本机的ip做了校验,更换网络后,ip发生变更,因此kibana无法启动,kibana的配置文件中有这么一行代码:

我们只要这行代码更改为以下即可:

elasticsearch.hosts: ['https://localhost:9200']

es8的证书除了对本机的实际ip做了校验,也对localhost做了验证,因此,只要改成localhost问题就会解决,即使更换网络,localhost是不会改变的。

另外再更换网络的情况下,如果要通过未更换网络的机器连接更换网络的机器,只有一个办法,那就是在当前网络下更新证书,除此别无他法。

6、所有代码

package mainimport ("context""fmt""os""strings""time""github.com/elastic/go-elasticsearch/v7/esapi""github.com/elastic/go-elasticsearch/v8"jsoniter "github.com/json-iterator/go""github.com/liupengh3c/esbuilder"
)// 最外层数据结构
type Documents struct {Shards   Shards      `json:"_shards"`Hits     HitOutLayer `json:"hits"`TimedOut bool        `json:"timed_out"`Took     int         `json:"took"`
}
type Shards struct {Failed     int `json:"failed"`Skipped    int `json:"skipped"`Successful int `json:"successful"`Total      int `json:"total"`
}
type HitOutLayer struct {Hits     []Hits  `json:"hits"`MaxScore float64 `json:"max_score"`Total    Total   `json:"total"`
}
type Hits struct {ID     string         `json:"_id"`Index  string         `json:"_index"`Score  float64        `json:"_score"`Source map[string]any `json:"_source"`Type   string         `json:"_type"`
}
type Total struct {Relation string `json:"relation"`Value    int    `json:"value"`
}func main() {SearchFromSize()
}func SearchFromSize() {st := time.Now()defer func() {fmt.Println("cost:", time.Since(st).Milliseconds(), "ms")}()var json = jsoniter.ConfigCompatibleWithStandardLibrarydocs := Documents{}cert, _ := os.ReadFile("/Users/liupeng/Documents/study/elasticsearch-8.17.0/config/certs/http_ca.crt")client, err := elasticsearch.NewClient(elasticsearch.Config{Username:  "elastic",Password:  "xpE4DQGWE9bCkoj7WXYE",Addresses: []string{"https://127.0.0.1:9200"},CACert:    cert,})if err != nil {fmt.Println("create client err:", err.Error())return}dslQuery := esbuilder.NewDsl()boolQuery := esbuilder.NewBoolQuery()boolQuery.Filter(esbuilder.NewRangeQuery("doc_id").Gte(1))dslQuery.SetQuery(boolQuery)dslQuery.SetFrom(9998)dslQuery.SetSize(3)dslQuery.SetOrder(esbuilder.NewSortQuery("doc_id", "asc"))dsl := dslQuery.BuildJson()search := esapi.SearchRequest{Index: []string{"new_tag_202411"},Body:  strings.NewReader(dsl),}resp, err := search.Do(context.Background(), client)if err != nil {fmt.Println("search err:", err.Error())return}json.NewDecoder(resp.Body).Decode(&docs)strDoc, _ := json.MarshalToString(docs)fmt.Println(strDoc)
}

 最后祝各位同学圣诞节快乐~~~~~~~~~~~~~

相关文章:

Elasticsearch检索方案之一:使用from+size实现分页

前面两篇文章介绍了elasticsearch以及Kibana的安装,检索引擎以及可视化工具都已经安装完成,接下来介绍下如何使用golang的sdk实现简单的分页查询。 1、下载Elastic官方golang sdk 在讲解elasticsearch检索之前,需要先把golang的环境安装好&…...

知识图谱+大模型:打造全新智慧城市底层架构

在数字化时代,智慧城市的建设正迎来新一轮的变革。本文将探讨如何结合知识图谱和大模型技术,构建智慧城市的全新底层架构,以应对日益增长的数据量和复杂性,提升城市管理的智能化水平。 知识图谱:智慧城市的知识库 知识…...

Flutter开发HarmonyOS 鸿蒙App的好处、能力以及把Flutter项目打包成鸿蒙应用

Flutter开发HarmonyOS的好处: Flutter是谷歌公司开发的一款开源、免费的UI框架,可以让我们快速的在Android和iOS上构建高质量App。它最大的特点就是跨平台、以及高性能。 目前 Flutter 已经支持 iOS、Android、Web、Windows、macOS、Linux 的跨平台开发…...

vscode安装fortran插件配置

本章教程,主要介绍如何在vscode上安装fortran插件,以便于使用vscode运行fortran编写的程序。 一、安装插件 首先在插件商店安装这个扩展插件 然后再把Code Runner扩展插件装上 二、下载mingw64 通过网盘分享的文件:mingw64 链接: https://pan.baidu.com/s/1fwS-CwC7dgI...

容器化平台Docker初识

Docker 是一个容器化平台,可以让你打包、分发和运行应用程序。它的核心思想是通过容器技术,让应用程序在任何环境下都能以一致的方式运行。 通俗易懂的理解 快餐盒的比喻: 假设你做了一顿饭(开发了一个应用程序)&#…...

【C语言程序设计——选择结构程序设计】预测你的身高(头歌实践教学平台习题)【合集】

目录😋 任务描述 相关知识 1、输入数值 2、选择结构语句 3、计算结果并输出 编程要求 测试说明 通关代码 测试结果 任务描述 本关任务:编写一个程序,该程序需输入个人数据,进而预测其成年后的身高。 相关知识 为了完成本…...

简单两步使用ssh配置内网穿透

解决问题:内网主机没有公网IP,无法从外网登录 流程 首先去阿里云租一台最便宜的服务器作为中转服务器 登录中转服务器(cloudserver) ssh [cloudserver] # 开放对应中转服务 ufw allow [remote_port] #remote_port 2222 vim /etc/ssh/sshd_config将对…...

M系列芯片切换镜像源并安装 openJDK17

1. 查找openjdk版本 执行:brew search openjdk,注意:执行命令后,如果得到的结果中没有红框内容,则需要更新一下 brew 更新 brew 分别执行以下命令: cd "$(brew --repo)" export HOMEBREW_API_D…...

图像处理-Ch6-彩色图像处理

Ch6 彩色图像处理 无广告更易阅读&#xff0c;个人博客点此进入<– 文章目录 Ch6 彩色图像处理彩色基础彩色模型(Color models)RGB(red, green, blue)CMY & CMYK(cyan, magenta, yellow/and black)HSI(hue, saturation, intensity)HSV(hue, saturation, value) 颜色空…...

Redis可视化工具 RDM mac安装使用

第一步&#xff1a;https://pan.baidu.com/s/10vpdhw7YfDD7G4yZCGtqQg?at1673701651004将dmg下载 第二部&#xff1a;点击下载的dmg文件进行安装、mac可能会提示&#xff1a; 无法验证此App不包含恶意软件 解决方法&#xff1a; 打开系统偏好设置>安全性与隐私>通用&am…...

单元测试/系统测试/集成测试知识总结

&#x1f345; 点击文末小卡片&#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 一、单元测试的概念 单元测试是对软件基本组成单元进行的测试&#xff0c;如函数或一个类的方法。当然这里的基本单元不仅仅指的是一个函数或者方法&#xff0…...

多目标应用(一):多目标麋鹿优化算法(MOEHO)求解10个工程应用,提供完整MATLAB代码

一、麋鹿优化算法 麋鹿优化算法&#xff08;Elephant Herding Optimization&#xff0c;EHO&#xff09;是2024年提出的一种启发式优化算法&#xff0c;该算法的灵感来源于麋鹿群的繁殖过程&#xff0c;包括发情期和产犊期。在发情期&#xff0c;麋鹿群根据公麋鹿之间的争斗分…...

机器学习和深度学习中的种子设置

一、常见的随机数生成器及其对应的设置方法&#xff1a; Python内置的随机数生成器&#xff1a; import random random.seed(manual_seed)NumPy的随机数生成器&#xff1a; import numpy as np np.random.seed(manual_seed)PyTorch的随机数生成器&#xff1a; import torch tor…...

[手机Linux] 七,NextCloud优化设置

安装完成后在个人设置里发现很多警告&#xff0c;一一消除。 只能一条一条解决了。 关于您的设置有一些错误。 1&#xff0c;PHP 内存限制低于建议值 512 MB。 设置php配置文件&#xff1a; /usr/local/php/etc/php.ini 把里面的&#xff1a; memory_limit 128M 根据你自…...

Ruby+Selenium教程

什么是 Minitest&#xff1f; Minitest 是 Ruby 的测试框架&#xff0c;提供一整套测试工具。它运行速度快&#xff0c;支持 TDD、BDD、模拟和基准测试 以下是使用Ruby、Selenium WebDriver和Minitest 的脚本&#xff0c;用于断言 Restful Booker Platform 的“页面标题”等于…...

【论文阅读笔记】Learning to sample

Learning to sample 前沿引言方法问题声明S-NET匹配ProgressiveNet: sampling as ordering 实验分类检索重建 结论附录 前沿 这是一篇比较经典的基于深度学习的点云下采样方法 核心创新点&#xff1a; 首次提出了一种学习驱动的、任务特定的点云采样方法引入了两种采样网络&…...

边缘计算收益稳定

要使自己的PCDN&#xff08;Personal Content Delivery Network&#xff0c;个人内容分发网络&#xff09;收益更稳定&#xff0c;可以从以下几个方面进行努力&#xff1a; 一、选择合适的PCDN平台 平台稳定性&#xff1a;选择技术成熟、稳定性高的PCDN平台&#xff0c;确保内…...

域名和服务器是什么?域名和服务器是什么关系?

在互联网的生态系统中&#xff0c;域名和服务器是两个至关重要的组成部分。它们共同构成了我们访问网站和使用在线服务的基础。那么域名和服务器是什么?域名和服务器是什么关系? 1、域名的概念 域名是互联网中用于标识特定地址的一种文字形式。它是用户访问网站时输入的易记…...

IBatis和MyBatis在细节上的不同有哪些

iBatis 和 MyBatis 都是流行的 Java 持久化框架&#xff0c;用于简化数据库交互。MyBatis 是从 iBatis 演化而来&#xff0c;MyBatis 在 iBatis 的基础上做了很多改进和优化&#xff0c;因此两者在设计和功能上存在一些差异。以下是它们在细节上的主要区别&#xff1a; 1. 框架…...

使用Python获取PDF文本和图片的精确位置

在处理和分析PDF文档时&#xff0c;获取文本和图片在页面上的精确位置是一个重要的操作。通过确定这些元素的具体坐标&#xff0c;我们可以实现对PDF内容的更精细控制和理解&#xff0c;这对于自动化文档处理、信息提取以及内容重组等工作流程尤为关键。通过Python编程语言&…...

[特殊字符] 智能合约中的数据是如何在区块链中保持一致的?

&#x1f9e0; 智能合约中的数据是如何在区块链中保持一致的&#xff1f; 为什么所有区块链节点都能得出相同结果&#xff1f;合约调用这么复杂&#xff0c;状态真能保持一致吗&#xff1f;本篇带你从底层视角理解“状态一致性”的真相。 一、智能合约的数据存储在哪里&#xf…...

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…...

ubuntu搭建nfs服务centos挂载访问

在Ubuntu上设置NFS服务器 在Ubuntu上&#xff0c;你可以使用apt包管理器来安装NFS服务器。打开终端并运行&#xff1a; sudo apt update sudo apt install nfs-kernel-server创建共享目录 创建一个目录用于共享&#xff0c;例如/shared&#xff1a; sudo mkdir /shared sud…...

从深圳崛起的“机器之眼”:赴港乐动机器人的万亿赛道赶考路

进入2025年以来&#xff0c;尽管围绕人形机器人、具身智能等机器人赛道的质疑声不断&#xff0c;但全球市场热度依然高涨&#xff0c;入局者持续增加。 以国内市场为例&#xff0c;天眼查专业版数据显示&#xff0c;截至5月底&#xff0c;我国现存在业、存续状态的机器人相关企…...

关于iview组件中使用 table , 绑定序号分页后序号从1开始的解决方案

问题描述&#xff1a;iview使用table 中type: "index",分页之后 &#xff0c;索引还是从1开始&#xff0c;试过绑定后台返回数据的id, 这种方法可行&#xff0c;就是后台返回数据的每个页面id都不完全是按照从1开始的升序&#xff0c;因此百度了下&#xff0c;找到了…...

基于Docker Compose部署Java微服务项目

一. 创建根项目 根项目&#xff08;父项目&#xff09;主要用于依赖管理 一些需要注意的点&#xff1a; 打包方式需要为 pom<modules>里需要注册子模块不要引入maven的打包插件&#xff0c;否则打包时会出问题 <?xml version"1.0" encoding"UTF-8…...

听写流程自动化实践,轻量级教育辅助

随着智能教育工具的发展&#xff0c;越来越多的传统学习方式正在被数字化、自动化所优化。听写作为语文、英语等学科中重要的基础训练形式&#xff0c;也迎来了更高效的解决方案。 这是一款轻量但功能强大的听写辅助工具。它是基于本地词库与可选在线语音引擎构建&#xff0c;…...

中医有效性探讨

文章目录 西医是如何发展到以生物化学为药理基础的现代医学&#xff1f;传统医学奠基期&#xff08;远古 - 17 世纪&#xff09;近代医学转型期&#xff08;17 世纪 - 19 世纪末&#xff09;​现代医学成熟期&#xff08;20世纪至今&#xff09; 中医的源远流长和一脉相承远古至…...

【无标题】路径问题的革命性重构:基于二维拓扑收缩色动力学模型的零点隧穿理论

路径问题的革命性重构&#xff1a;基于二维拓扑收缩色动力学模型的零点隧穿理论 一、传统路径模型的根本缺陷 在经典正方形路径问题中&#xff08;图1&#xff09;&#xff1a; mermaid graph LR A((A)) --- B((B)) B --- C((C)) C --- D((D)) D --- A A -.- C[无直接路径] B -…...

力扣热题100 k个一组反转链表题解

题目: 代码: func reverseKGroup(head *ListNode, k int) *ListNode {cur : headfor i : 0; i < k; i {if cur nil {return head}cur cur.Next}newHead : reverse(head, cur)head.Next reverseKGroup(cur, k)return newHead }func reverse(start, end *ListNode) *ListN…...