Elasticsearch基础_4.ES搜索功能
文章目录
- 一、搜索辅助功能
- 1.1、指定返回的字段
- 1.2、结果计数
- 1.3、结果分页
- 二、搜索匹配功能
- 2.1、查询所有文档
- 2.2、term级别查询
- 2.2.1、term查询
- 2.2.2、terms查询
- 2.2.3、range查询
- 2.2.4、exists查询
- 2.3、布尔查询
- 2.3.1、must,should,must_not
- 2.3.2、filter
- 2.4、全文搜索
- 2.4.1、match查询
- 2.4.2、multi_match查询
- 2.4.3、match_phrase查询
- 三、按字段值排序
一、搜索辅助功能
1.1、指定返回的字段
考虑到性能问题,需要对搜索结果进行“瘦身”——指定返回的字段。在ES中,可以通过_source
子句可以设定返回结果的字段。_source
指向一个JSON数组,数组中的元素是希望返回的字段名称。
GET /hotel/_search
{"_source":["title","city"],"query":{"term":{"city":{"value":"成都"}}}
}
1.2、结果计数
为提升搜索体验,需要给前端传递搜索匹配结果的文档条数,即需要对搜索结果进行计数。针对这个需求,ES提供了_count
API功能,在该API中,用户提供query子句用于结果匹配,ES会返回匹配的文档条数。下面的DSL功能会返回城市为“成都”的酒店个数:
GET /hotel/_count
{"query":{"term":{"city":{"value":"成都"}}}
}
返回结果为:
{"_count":3,"_shards":{...}
}
1.3、结果分页
在实际的搜索应用中,分页是必不可少的功能。用户可以通过from和size来设置搜索位置和每页显示的文档数量,from表示查询结果的起始下标,默认值为0,size表示从起始下标开始返回的文档个数,默认值为10。例如:
GET /hotel/_search
{"from":0,"size":20,"query":{"term":{"city":{"value":"成都"}}}
}
在默认情况下,用户最多可以取得10000个文档,如果请求超过该值,ES会返回报错信息。如果确实需要返回多于10000条数据,可以适当调整max_result_window的值:
PUT /hotel/_settings
{"index":{"max_result_window":20000}
}
注意,如果将配置修改的很大,一定要有足够的硬件作为支撑。
二、搜索匹配功能
2.1、查询所有文档
在ES中可以使用match_all
实现查询所有文档的数据,使用match_all查询文档时,ES不对文档进行打分计算,默认情况下给每一个文档赋予1.0的得分。
GET /hotel/_search
{"_source":["title","city"],"query":{"match_all":{...}}
}
2.2、term级别查询
2.2.1、term查询
term查询是结构化精准查询的主要查询方式,用于查询待查字段和查询值是否完全匹配,其请求形式如下:
GET /hotel/_search
{"query":{"term":{"${FIELD}":{"value":"${VALUE}"}}}
}
其中FIELD和VALUE分别代表字段名称和查询值,例如搜索城市为成都的酒店:
GET /hotel/_search
{"query":{"term":{"city":{"value":"成都"}}}
}
2.2.2、terms查询
terms
查询是term
查询的扩展形式,用于查询一个或多个值与待查字段是否完全匹配,以下是搜索城市为“北京”或者“成都”的酒店实例:
GET /hotel/_search
{"query":{"terms":{"city":["北京","成都"]}}
}
2.2.3、range查询
range查询用于范围查询,一般是对数值型和日期型数据的查询使用range进行范围查询时,用户可以根据需求中是否包含边界数值进行选项设置可供组合的选项如下:
- gt:大于
- lt:小于
- gte:大于或等于
- lte:小于或等于
以下为数值类型的查询示例,查询住宿价格大于300(不包含边界值)的酒店:
GET /hotel/_search
{"query":{"range":{"price":{"gt":300}}}
}
2.2.4、exists查询
在某些场景下,我们希望找到某个字段不为空的文档,可以使用exists搜索,字段不为空的条件有:
- 值存在且不为null
- 值不是空数组
- 值是数组,但不是[null]
例如:
GET /hotel/_search
{"query":{"exists":{"field":"tag" //字段名}}
}
2.3、布尔查询
复合搜索,顾名思义,是一种在一个搜索语句中包含一种或多种搜索子句的查询,布尔查询是常用的复合查询。它把多个子查询组合成一个布尔表达式,这些子查询之间的逻辑关系是与,即所有子查询的结果都为true,布尔查询的结果才为真。
布尔查询支持的子查询有四种,各子查询的名称和功能如下所示:
- must:必须匹配该查询条件
- should:可以匹配该查询条件
- must_not:必须不匹配该查询条件
- filter:必须匹配过滤条件,不进行打分计算
2.3.1、must,should,must_not
这三种查询ES会将子查询与文档的匹配程度值加入到总得分里,搜索时后面都可以包含一个数组,例如:
GET /hotel/_search
{"query":{"bool":{"must":[ // must查询,数组内可以封装各类子查询{ // 第一个子查询:城市为成都"term":{"city":{"value":"成都"}}},{ // 第二个子查询:价格>=350且价格<=450"range":{"price":{"gte":350,"lte":450}}}]}}
}
2.3.2、filter
filter
查询即过滤查询,该查询是布尔查询里非常独特的一种查询,其他布尔查询关注的是查询条件和文档的匹配程度,并按照匹配程度进行打分。而filter查询关注的是查询条件和文档是否匹配,不进行相关的打分计算(这可以减少不小的时间开销),但是会对部分匹配结果进行缓存。
GET /hotel/_search
{"query":{"bool":{"filter":[ // filter查询,数组内可以封装各类子查询{ // 第一个子查询:城市为成都"term":{"city":{"value":"成都"}}},{ // 第二个子查询:价格>=350且价格<=450"range":{"price":{"gte":350,"lte":450}}}]}}
}
2.4、全文搜索
不同于结构化搜索,全文搜索首先对查询词进行分析,然后根据查询词的分词结果构建查询。这里所说的全文指的是文本类型数据(text类型)。结构化搜索关注的是数据是否匹配,全文搜索关注的是匹配的程;结构化搜索一般用于精确匹配,而全文搜索用于部分匹配。
2.4.1、match查询
match
查询是全文搜索的主要代表。对于最基本的match搜索来说,只要分词结果中的一个或者多个词在文档中存在即可,例如搜索金都酒店:
GET /hotel/_search
{"_source":["title"], //只返回title字段"query":{"match":{ //匹配title字段为“金都酒店”的文档"title":"金都酒店"}}
}
或者按照如下方式搜索:
GET /hotel/_search
{"_source":["title"], //只返回title字段"query":{"match":{ //匹配title字段为“金都酒店”的文档"title":{"query":"金都酒店"}}}
}
2.4.2、multi_match查询
有时用户需要在多个字段中查询关键词,除了使用布尔查询封装多个match查询之外,可替代的方案是使用multi_match
。可以在multi_match的query
子句中组织数据匹配规则,并在fields
子句中指定需要搜索的字段列表:
GET /hotel/_search
{"_source":["title","amenities"], //匹配的关键字为“假日”"query":{"multi_match":{ //设置匹配的字段为title和amenities"query":"假日","fields":["title","amenities"]}}
}
2.4.3、match_phrase查询
match_phrase
用于匹配短语,与match查询不同的是,match_phrase用于搜索确切的短语或临近的词语。
三、按字段值排序
在默认情况下,ES对搜索结果是按照相关性降序排序的,有时需要按照某些字段的值进行升序或者降序排序。ES提供了sort
子句,可以对数据进行排序。sort子句一般是按照字段信息进行排序,不受相关性影响,而且打分步骤需要耗费一定的硬件资源和时间,因此默认情况下不对文档进行打分。
使用sort字句对字段值进行排序时,需要指定排序的字段。ES默认的是按照字段值进行升序,排序可以设置sort参数为asc
或desc
,指定按照字段值进行升序或者降序排序。
以下示例为搜索名称包含“金都”的酒店,并对酒店按照价格进行降序排列:
GET /hotel/_search
{"_source":["title","price"], //只返回部分字段"query":{ //搜索条件"match":{ "title":"金都"}},{"sort":[ //按照价格降序排序{"price":{"order":"desc"}}]}
}
相关文章:

Elasticsearch基础_4.ES搜索功能
文章目录 一、搜索辅助功能1.1、指定返回的字段1.2、结果计数1.3、结果分页 二、搜索匹配功能2.1、查询所有文档2.2、term级别查询2.2.1、term查询2.2.2、terms查询2.2.3、range查询2.2.4、exists查询 2.3、布尔查询2.3.1、must,should,must_not2.3.2、f…...

Elasticsearch要点简记
Elasticsearch要点简记 1、ES概述2、基础概念(1)索引、文档、字段(2)映射(3)DSL 3、架构原理4、索引字段的数据类型5、ES的三种分页方式(1)深度分页(fromsize)…...

【通信协议】IIC通信协议详解
IIC(Inter-Integrated Circuit)通信协议,又称为I2C(Inter-Integrated Circuit 2)协议,是一种广泛使用的串行通信协议。它由Philips Semiconductor(现NXP Semiconductors)开发&#x…...

2024年中国科技核心期刊目录(社会科学卷)
2024年中国科技核心期刊目录 (社会科学卷) 序号 期刊代码 期刊名称 1 SC02 JOURNAL OF S…...

用Python集成免费IP归属地查询API
IP查询的优势是什么? IP查询是一种强大的工具,能够快速提供关于IP地址的信息,如地理位置、互联网服务提供商(ISP)、连接类型等。这些数据在多种场景下都非常有用,帮助用户理解网络环境和用户行为。 首先&…...

C 数组
C 数组 数组是C语言中的一种基本数据结构,用于存储一系列相同类型的数据。它是连续的内存分配,允许通过索引快速访问元素。本文将详细介绍C数组的概念、使用方法、以及注意事项。 1. 数组的概念 数组是一个集合,可以存储一定数量的元素。在…...

【Unity】unity安卓打包参数(个人复习向/有不足之处欢迎指出/侵删)
1.Texture Compression 纹理压缩 设置发布后的纹理压缩格式 Use Player Settings:使用在播放器设置中设置的纹理压缩格式 ETC:使用ETC格式(兼容) ETC2:使用ETC2格式(很多设备不支持) ASTC:使用…...

C0016.Clion中qDebug()打印输出中文时,都是问号??????的解决办法
问题描述 在clion中使用qDebug打印输出中文内容时,都是?????如下图: 注意:修改该文件的编码格式就行,该文件名为apr.cpp; 解决办法...

C++ priority_queue 优先队列构造大根堆和小根堆
priority_queue的三个参数 template <class T, class Container std::vector<T>, class Compare std::less<typename Container::value_type>> class priority_queue;1、元素类型 2、底层容器类型,默认vector 3、比较函数(传入的是…...

音视频入门基础:FLV专题(9)——Script Tag简介
一、SCRIPTDATA 根据《video_file_format_spec_v10_1.pdf》第75页到76页,如果某个Tag的Tag header中的TagType值为18,表示该Tag为Script Tag(脚本Tag,又称Data Tag、SCRIPTDATA tag)。这时如果Filter的值不为1表示未加…...

Vue页面,基础配置
最简单页面 日期范围及字符搜索,监听器处理日期范围搜索控件清空重置问题导出、导出文件文件名称带日期时间表格日期指定格式显示。。。 <template><div class"app-container"><el-form :model"queryParams" ref"queryForm…...

(杨辉三角) 攻防世界--->notsequence
学习笔记。(不想看可以直接跳正文。) 前言:仿佛又回到高中 - - 只不过,是以另一种形式再次出现。 学习思维为主,做题位次。(后面再补。) 前置知识: 什么是杨辉三角: 杨辉三角_百度百科 (bai…...

【CTF Web】Pikachu CSRF(get) Writeup(CSRF+GET请求+社会工程学)
CSRF(跨站请求伪造)概述 Cross-site request forgery 简称为“CSRF”,在CSRF的攻击场景中攻击者会伪造一个请求(这个请求一般是一个链接),然后欺骗目标用户进行点击,用户一旦点击了这个请求,整个攻击就完成…...

智能工厂的软件设计 作为“程序Program”的中台 之2
Q11、现在,我们再重新理解一下前面所说:三种中台(数据中台、技术中台和业务中台)作为这个整体的三个整子Holon,合起来是一个 融合了三分法( 三分部 的三个中台构成三段式 程序框架,分别用 <h…...

GB28181信令交互流程及Android端设备对接探讨
GB28181规范必要性 好多开发者在做比如执法记录仪、智能安全帽、智能监控等设备端视频回传技术方案选型的时候,不清楚到底是用RTSP、RTMP还是GB28181,对GB28181相对比较陌生,我们就GB28181规范的必要性,做个探讨: 实现…...

OpenCV视频I/O(14)创建和写入视频文件的类:VideoWriter介绍
操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 视频写入器类。 该类提供了用于写入视频文件或图像序列的 C API。 cv::VideoWriter 类是 OpenCV 库中用于创建和写入视频文件的一个类。它提供了…...

c语言学习(书本目录)
关键字 变量 3.typedef的使用: 定义一个结构体,名字是Person: struct Person { char name[50]; int age; }; 给结构体取一个别名:struct Person---》Person typedef struct Person Person; 上面带标签的结构体等效于 …...

2024年最新版本神马TV8.5影视APP源码 293TV影视点播系统源码搭建教程 神马TV8.2加强版反编译教程 保姆级小白可搭建 完整版本视频教程
2024年最新版的神马TV影视APP源码,版本号8.5,提供了前所未有的定制化选项和高级功能。用户可以轻松更换应用的包名和名称,确保品牌个性化。此外,该应用采用了动态域名加密技术,增强了数据传输的安全性。它支持自动切换…...

衍生品交易的隐藏风险:认识CCR和xVA
作为一名资深的量化交易专家和金融自媒体人,我经常被问到:"衍生品交易真的像传说中那么危险吗?"这个问题背后,隐藏着许多投资者对金融市场的担忧和好奇。今天,让我们一起揭开衍生品交易中两个关键概念的面纱…...

我的项目管理生涯
1 前言 从好几年前就想写几篇关于自己职业生涯的文章了,一直由于各种原因没有写成,正好借新的工作机会,尤其是项目管理这段工作经历,计划通过这一二篇文章进行总结和反思一下,以期更顺利的开展相关工作或是自己能更上…...

ChatGPT Canvas:交互式对话编辑器
自两年前 ChatGPT 发布以来,主流 AI 均以对话形式进行交互。传统的对话式界面可以直观看到反馈结果,但在需要深度编辑和协作的项目中就略显局限。为了解决此问题,几个月前 Claude 就发布过 Artifacts 功能,用来拓展原有对话。而现…...

[Linux] Linux 的进程如何调度——Linux的 O(1)进程调度算法
标题:[Linux] Linux 的进程如何调度——优先级与进程调度 个人主页水墨不写bug 目录 一、前言 二、将要出现的概念 1.进程调度队列 2.位图 3.进程的优先级 三、Linux进程的调度过程 1.活动队列(*active指向的队列) 2.过期队列&#…...

Python使用Selenium动态爬取CSDN社区帖子的URL链接
前几天读了一篇CSDN社区的帖子,发现文章内容写得极好,值得借鉴学习。于是我想将那个社区的帖子都爬下来,但是那个社区发布的贴子挺多的,一直往下拉才到2022年5月的发布。于是我就只将5月份之前的爬下来就行,但是帖子是…...

【ShuQiHere】双系统指南:如何在 Linux 系统情况下安装 Windows 11,处理引导与网络问题 ️
【ShuQiHere】 🖥️💡 在安装 Windows 11 和 Linux 双系统时,常常会遇到各种棘手的问题,特别是在网络连接、BIOS 设置和引导修复方面。今天我将详细带你解决这些问题,让你顺利完成 Windows 11 安装,并恢复…...

jQuery EasyUI 扩展
jQuery EasyUI 扩展 引言 jQuery EasyUI 是一个流行的 HTML5 框架,用于构建交互式网页界面。它提供了一系列的 UI 组件,如布局、窗口、数据网格等,使得网页开发变得更加简单快捷。然而,尽管 EasyUI 功能丰富,但在某些特定场景下,开发者可能需要更多的定制化功能或组件。…...

408算法题leetcode--第24天
#378. 有序矩阵中第 K 小的元素 378. 有序矩阵中第 K 小的元素思路:值二分,如注释时间:O(log(r-l) * n);空间:O(1) class Solution { public:int check(vector<vector<int>>& matrix, int target){/…...

【CKA】二、节点管理-设置节点不可用
2、节点管理-设置节点不可用 1. 考题内容: 2. 答题思路: 先设置节点不可用,然后驱逐节点上的pod 这道题就两条命令,直接背熟就行。 也可以查看帮助 kubectl cordon -h kubectl drain -h 参数详情: –delete-empty…...

STM32中断编程指南:NVIC和中断优先级
在STM32微控制器编程中,中断是实现多任务处理和实时响应的关键技术。NVIC(Nested Vectored Interrupt Controller)是STM32中的中断控制器,负责管理中断请求、优先级和中断向量。本文将详细介绍STM32的NVIC配置和中断优先级设置&am…...

ThreadLocal底层原理及数据结构详解
ThreadLocal允许为每个线程创建独立的变量副本,使得同一个ThreadLocal对象在不同的线程中拥有不同的值。它的主要作用是在并发环境下提供线程隔离,避免多个线程共享同一个变量,从而减少线程间的相互干扰。 ThreadLocal的核心在于为每个线程维…...

Android Framework AMS(02)AMS启动及相关初始化5-8
该系列文章总纲链接:专题总纲目录 Android Framework 总纲 本章关键点总结 & 说明: 说明:本章节主要涉及systemserver启动AMS及初始化AMS相关操作。同时由于该部分内容过多,因此拆成2个章节,本章节是第二章节&…...