当前位置：首页 > news >正文

elasticsearch term match 查询

news 2026/5/22 21:12:12

1. 准备数据

PUT h1/doc/1
{"name": "rose","gender": "female","age": 18,"tags": ["白", "漂亮", "高"]
}PUT h1/doc/2
{"name": "lila","gender": "female","age": 18,"tags": ["黑", "漂亮", "高"]
}PUT h1/doc/3
{"name": "john","gender": "male","age": 18,"tags": ["黑", "帅", "高"]
}

运行结果：

{"_index" : "h1","_type" : "doc","_id" : "1","_version" : 1,"result" : "created","_shards" : {"total" : 2,"successful" : 1,"failed" : 0},"_seq_no" : 0,"_primary_term" : 1
}

2. match 查询

2.1 match 按条件查询

# 查询性别是男性的结果
GET h1/doc/_search
{"query": {"match": {"gender": "male"}}
}

查询结果：

{"took" : 59,"timed_out" : false,"_shards" : {"total" : 5,"successful" : 5,"skipped" : 0,"failed" : 0},"hits" : {"total" : 1,"max_score" : 0.2876821,"hits" : [{"_index" : "h1",		# 索引"_type" : "doc",		# 文档类型"_id" : "3",			# 文档唯一 id"_score" : 0.2876821,	# 打分机制打出来的分数"_source" : {			# 查询结果"name" : "john","gender" : "male","age" : 18,"tags" : ["黑","帅","高"]}}]}
}

2.2 match_all 查询全部

# 查询 h1 中所有文档
GET h1/doc/_search
{"query": {"match_all": {}}
}

match_all的值为空，表示没有查询条件，那就是查询全部。就像select * from table_name 一样。

查询结果：

{"took" : 2,"timed_out" : false,"_shards" : {"total" : 5,"successful" : 5,"skipped" : 0,"failed" : 0},"hits" : {"total" : 3,"max_score" : 1.0,"hits" : [{"_index" : "h1","_type" : "doc","_id" : "2","_score" : 1.0,"_source" : {"name" : "lila","gender" : "female","age" : 18,"tags" : ["黑","漂亮","高"]}},{"_index" : "h1","_type" : "doc","_id" : "1","_score" : 1.0,"_source" : {"name" : "rose","gender" : "female","age" : 18,"tags" : ["白","漂亮","高"]}},{"_index" : "h1","_type" : "doc","_id" : "3","_score" : 1.0,"_source" : {"name" : "john","gender" : "male","age" : 18,"tags" : ["黑","帅","高"]}}]}
}

2.3 match_phrase 短语查询

match 查询时散列映射，包含了我们希望搜索的字段和字符串，即只要文档中有我们希望的那个关键字，但也会带来一些问题。

es 会将文档中的内容进行拆分，对于英文来说可能没有太大的影响，但是中文短语就不太适用，一旦拆分就会失去原有的含义，比如以下：

1、准备数据：

PUT t1/doc/1
{"title": "中国是世界上人口最多的国家"
}PUT t1/doc/2
{"title": "美国是世界上军事实力最强大的国家"
}PUT t1/doc/3
{"title": "北京是中国的首都"
}

2、先使用 match 查询含有中国的文档：

GET t1/doc/_search
{"query": {"match": {"title": "中国"}}
}

查询结果：

{"took" : 5,"timed_out" : false,"_shards" : {"total" : 5,"successful" : 5,"skipped" : 0,"failed" : 0},"hits" : {"total" : 3,"max_score" : 0.68324494,"hits" : [{"_index" : "t1","_type" : "doc","_id" : "1","_score" : 0.68324494,"_source" : {"title" : "中国是世界上人口最多的国家"}},{"_index" : "t1","_type" : "doc","_id" : "3","_score" : 0.5753642,"_source" : {"title" : "北京是中国的首都"}},{"_index" : "t1","_type" : "doc","_id" : "2","_score" : 0.39556286,"_source" : {"title" : "美国是世界上军事实力最强大的国家"}}]}
}

发现三篇文档都被返回，与我们的预期有偏差；这是因为 title 中的内容被拆分成一个个单独的字，而 id=2 的文档包含了国字也符合，所以也被返回了。es 自带的中文分词处理不太好用，后面可以使用 ik 中文分词器来处理。

3、match_phrase 查询短语

不过可以使用 match_phrase 来匹配短语，将上面的 match 换成 match_phrase 试试：

# 短语查询
GET t1/doc/_search
{"query": {"match_phrase": {"title": "中国"}}
}

查询结果：

{"took" : 2,"timed_out" : false,"_shards" : {"total" : 5,"successful" : 5,"skipped" : 0,"failed" : 0},"hits" : {"total" : 2,"max_score" : 0.5753642,"hits" : [{"_index" : "t1","_type" : "doc","_id" : "1","_score" : 0.5753642,"_source" : {"title" : "中国是世界上人口最多的国家"}},{"_index" : "t1","_type" : "doc","_id" : "3","_score" : 0.5753642,"_source" : {"title" : "北京是中国的首都"}}]}
}

4、slop 间隔查询

当我们要查询的短语，中间有别的词时，可以使用 slop 来跳过。比如上述要查询 中国世界，这个短语中间被是隔开了，这时可以使用 slop 来跳过，相当于正则中的中国.*?世界：

# 短语查询，查询中国世界，加 slop 
GET t1/doc/_search
{"query": {"match_phrase": {"title": {"query": "中国世界","slop": 1}}}
}

查询结果：

{"took" : 4,"timed_out" : false,"_shards" : {"total" : 5,"successful" : 5,"skipped" : 0,"failed" : 0},"hits" : {"total" : 1,"max_score" : 0.7445889,"hits" : [{"_index" : "t1","_type" : "doc","_id" : "1","_score" : 0.7445889,"_source" : {"title" : "中国是世界上人口最多的国家"}}]}
}

2.4 match_phrase_prefix 最左前缀查询

场景：当我们要查询的词只能想起前几个字符时

# 最左前缀查询，查询名字为 rose 的文档
GET h1/doc/_search
{"query": {"match_phrase_prefix": {"name": "ro"}}
}

查询结果：

{"took" : 1,"timed_out" : false,"_shards" : {"total" : 5,"successful" : 5,"skipped" : 0,"failed" : 0},"hits" : {"total" : 1,"max_score" : 0.2876821,"hits" : [{"_index" : "h1","_type" : "doc","_id" : "1","_score" : 0.2876821,"_source" : {"name" : "rose","gender" : "female","age" : 18,"tags" : ["白","漂亮","高"]}}]}
}

限制结果集

最左前缀查询很费性能，返回的是一个很大的集合，一般很少使用，使用的时候最好对结果集进行限制，max_expansions 参数可以设置最大的前缀扩展数量：

# 最左前缀查询
GET h1/doc/_search
{"query": {"match_phrase_prefix": {"gender": {"query": "fe","max_expansions": 1}}}
}

查询结果：

{"took" : 2,"timed_out" : false,"_shards" : {"total" : 5,"successful" : 5,"skipped" : 0,"failed" : 0},"hits" : {"total" : 2,"max_score" : 0.2876821,"hits" : [{"_index" : "h1","_type" : "doc","_id" : "2","_score" : 0.2876821,"_source" : {"name" : "lila","gender" : "female","age" : 18,"tags" : ["黑","漂亮","高"]}},{"_index" : "h1","_type" : "doc","_id" : "1","_score" : 0.2876821,"_source" : {"name" : "rose","gender" : "female","age" : 18,"tags" : ["白","漂亮","高"]}}]}
}

2.5 multi_match 多字段查询

1、准备数据：

# 多字段查询
PUT t3/doc/1
{"title": "maggie is beautiful girl","desc": "beautiful girl you are beautiful so"
}PUT t3/doc/2
{"title": "beautiful beach","desc": "I like basking on the beach,and you? beautiful girl"
}

2、查询包含 beautiful 字段的文档：

GET t3/doc/_search
{"query": {"multi_match": {"query": "beautiful",				# 要查询的词"fields": ["desc", "title"]		# 要查询的字段}}
}

还可以当做 match_phrase和match_phrase_prefix使用，只需要指定type类型即可：

GET t3/doc/_search
{"query": {"multi_match": {"query": "gi","fields": ["title"],"type": "phrase_prefix"}}
}GET t3/doc/_search
{"query": {"multi_match": {"query": "girl","fields": ["title"],"type": "phrase"}}
}

3. term 查询

3.1 初始 es 的分析器

term 查询用于精确查询，但是不适用于 text 类型的字段查询。

在此之前我们先了解 es 的分析机制，默认的标准分析器会对文档进行：

删除大多数的标点符号
将文档拆分为单个词条，称为 token
将 token 转换为小写

最后保存到倒排序索引上，而倒排序索引用来查询，如 Beautiful girl 经过分析后是这样的：

POST _analyze
{"analyzer": "standard","text": "Beautiful girl"
}# 结果，转换为小写了
{"tokens" : [{"token" : "beautiful","start_offset" : 0,"end_offset" : 9,"type" : "<ALPHANUM>","position" : 0},{"token" : "girl","start_offset" : 10,"end_offset" : 14,"type" : "<ALPHANUM>","position" : 1}]
}

3.2 term 查询

1、准备数据：

# 创建索引，自定义 mapping，后面会讲到
PUT t4
{"mappings": {"doc":{"properties":{"t1":{"type": "text"    # 定义字段类型为 text}}}}
}PUT t4/doc/1
{"t1": "Beautiful girl!"
}PUT t4/doc/2
{"t1": "sexy girl!"
}

2、match 查询：

GET t4/doc/_search
{"query": {"match": {"t1": "Beautiful girl!"}}
}

经过分析后，会得到 beautiful、girl 两个 token，然后再去 t4 索引上去查询，会返回两篇文档：

{"took" : 1,"timed_out" : false,"_shards" : {"total" : 5,"successful" : 5,"skipped" : 0,"failed" : 0},"hits" : {"total" : 2,"max_score" : 0.5753642,"hits" : [{"_index" : "t4","_type" : "doc","_id" : "1","_score" : 0.5753642,"_source" : {"title" : "Beautiful girl"}},{"_index" : "t4","_type" : "doc","_id" : "2","_score" : 0.2876821,"_source" : {"title" : "sex girl"}}]}
}

3、但是我们只想精确查询包含 Beautiful girl 的文档，这时就需要使用 term 来精确查询：

GET t4/doc/_search
{"query": {"term": {"title": "beautiful"}}
}

查询结果：

{"took" : 0,"timed_out" : false,"_shards" : {"total" : 5,"successful" : 5,"skipped" : 0,"failed" : 0},"hits" : {"total" : 1,"max_score" : 0.2876821,"hits" : [{"_index" : "t4","_type" : "doc","_id" : "1","_score" : 0.2876821,"_source" : {"title" : "Beautiful girl"}}]}
}

注意：term 查询不适用于类型是 text 的字段，可以使用 match 查询；另外 Beautiful 经过分析后变为 beautiful，查询时使用 Beautiful 是查询不到的~

3.3 查询多个

精确查询多个字段：

GET t4/doc/_search
{"query": {"terms": {"title": ["beautiful", "sex"]}}
}

elasticsearch term match 查询

1. 准备数据 PUT h1/doc/1 {"name": "rose","gender": "female","age": 18,"tags": ["白", "漂亮", "高"] }PUT h1/doc/2 {"name": "lila","gender&quo…...

编程日记 2023/2/11 11:33:27

canal使用说明：MySQL、Redis实时数据同步

1. canal简介 canal是阿里开源的数据同步工具，基于bin log可以将数据库同步到其他各类数据库中，目标数据库支持mysql,postgresql,oracle,redis,MQ,ES等 canal分成服务端deployer和客户端adapter，我们可以部署多个，同时为了方便管…...

编程日记 2023/2/11 11:32:17

计算机视觉框架OpenMMLab开源学习（三）：图像分类实战

前言：本篇主要偏向图像分类实战部分，使用MMclassification工具进行代码应用，最后对水果分类进行实战演示，本次环境和代码配置部分省略，具体内容建议参考前一篇文章：计算机视觉框架OpenMMLab开源学习&#x…...

编程日记 2023/2/11 11:31:10

awk命令

一.介绍 awk是专门为文本处理设计的编程语言，是一门数据驱动的编程语言。与sed类似，都是以数据驱动的行处理软件，主要用于数据扫描，过滤和汇总。数据可以来自于标准输入，管道或者文件。二.语法 awk是一种处理文本文件…...

编程日记 2023/2/11 11:30:04

LocalDateTime获取时间的年、月、日、时、分、秒、纳秒

如何把String/Date转成LocalDateTime参考String、Date与LocalDate、LocalTime、LocalDateTime之间互转 String、Date、LocalDateTime、Calendar与时间戳之间互相转化参考String、Date、LocalDateTime、Calendar与时间戳之间互相转化方法介绍 getYear() 获取日期的年 getMon…...

编程日记 2023/2/11 11:28:55

MoveIT Rviz和Gazebo联合仿真

文章目录环境安装概述ros_control框架ros_control数据流文件配置附加工具故障问题解决参考接前两篇：ROS MoveIT1（Noetic）安装总结 Solidworks导出为URDF用于MoveIT总结（带prismatic） MoveIT1 Assistant 总结环境 Ubu…...

编程日记 2023/2/11 11:27:46

ESP32S2(12K)-DS18B20数码管显示温度

一、物料清单： NODEMCU-32-S2 (ESP32-12K)四段数码管（共阴）DS18B20（VCC/DQ/GND）Arduino-IDE 2.0.3二、实现方法及效果图： 2.1 引用库 // #include <OneWire.h> //可以不引入，因为DallasTemperature.h中已经引入了OneWire.h #include <DallasTemperature.h>#…...

编程日记 2023/2/11 11:26:38

linux栈溢出定位

一、编译选项定位堆栈溢出来源：堆栈溢出检测机制 - SkrSky - 博客园 1、栈溢出可能打印 unhandled level 1 translation fault (11) at 0x7f8d0347, esr 0x92000005 2、栈溢出保护机制 gcc提供了栈保护机制stack-protector（编译选项-fstack-protec…...

编程日记 2023/2/11 11:25:29

CSS基础：选择器和声明样式

CSS概念 CSS（Cascading Style Sheets）层叠样式表，又叫级联样式表，简称样式表 CSS用于HTML文档中元素样式的定义使用css让网页具有美观一致的页面语法 CSS 规则由两个主要的部分构成：选择器和声明样式选择器通常…...

编程日记 2023/2/11 11:24:20

VS中安装gismo库

文章目录前言一、下载安装paraview直接下载压缩包安装就可以了解压后按步骤安装即可二、gismo库的安装gismo库网址第一种方法：第二种方法第三种方法：用Cmake软件直接安装首先下载cmake软件[网址](https://cmake.org/download/)安装gismo库三、gismo库的使…...

编程日记 2023/2/11 11:23:09

元学习方法解决CDFSL以及两篇SOTA论文讲解

来源：投稿作者：橡皮编辑：学姐带你学习跨域小样本系列1-简介篇跨域小样本系列2-常用数据集与任务设定详解跨域小样本系列3：元学习方法解决CDFSL以及两篇SOTA论文讲解（本篇） 跨域小样本系列4&#xf…...

编程日记 2023/2/11 11:21:57

大数据之------------数据中台

一、什么是数据中台 **数据中台是指通过数据技术，对海量数据进行采集、计算、存储、加工，同时统一标准和口径。**数据中台的目标是让数据持续用起来，通过数据中台提供的工具、方法和运行机制，把数据变为一种服务能力，…...

编程日记 2023/2/11 11:20:45

Python 中字符串是什么？

字符串是 Python 中最常用的数据类型。我们可以使用引号 ( ’ 或 " ) 来创建字符串。创建字符串很简单，只要为变量分配一个值即可。例如： var1 ‘Hello World!’ var2 “Python Runoob” Python 访问字符串中的值 Python 不支持单字符类型&…...

编程日记 2023/2/11 11:19:34

OJ刷题Day1 · 一维数组的动态和 · 将数字变成 0 的操作次数 · 最富有的客户资产总量 · Fizz Buzz · 链表的中间结点 · 赎金信

一、一维数组的动态和二、将数字变成 0 的操作次数三、最富有的客户资产总量四、Fizz Buzz五、链表的中间结点六、赎金信一、一维数组的动态和给你一个数组 nums 。数组「动态和」的计算公式为：runningSum[i] sum(nums[0]…nums[i]) 。请返回 nums 的动态和。示…...

编程日记 2023/2/11 11:18:21

【数据结构】栈——必做题

逆波兰表达式后缀表达式的出现是为了方便计算机处理，它的运算符是按照一定的顺序出现，所以求值过程中并不需要使用括号来指定运算顺序，也不需要考虑运算符号（比如加减乘除）的优先级。先介绍中简单的人工转化方法&#…...

编程日记 2023/2/11 11:17:12

LearnOpenGL 笔记 - 入门 04 你好，三角形

系列文章目录 LearnOpenGL 笔记 - 入门 01 OpenGLLearnOpenGL 笔记 - 入门 02 创建窗口LearnOpenGL 笔记 - 入门 03 你好，窗口文章目录系列文章目录前言你好，三角形顶点输入顶点着色器（Vertex Shader）编译着色器片段着色器&…...

编程日记 2023/2/11 11:16:03

keepalived+mysql高可用

一.设置mysql同步信息两节点安装msyql略#配置节点11.配置权限允许远程访问mysql -u root -p grant all on *.* to root% identified by Root1212# with grant option; flush privileges;2.修改my.cnf#作为主节点配置(节点1)#作为主节点配置 server-id 1 …...

编程日记 2023/2/11 11:14:52

JAVA工具篇--1 Idea中 Gradle的使用

前言： 既然我们已经使用Maven 来完成对项目的构建，为什么还要使用Gradle 进行项目的构建；gradle和maven都可以作为java程序的构建工具，但两者还是有很大的不同之处的：1.可扩展性，gradle比较灵活&#xff0c…...

编程日记 2023/2/11 11:13:40

弄懂自定义 Hooks 不难，改变开发认知有点不习惯

前言我之前总结逻辑重用的时候，就一直在思考一个问题。对于逻辑复用，render props 和高阶组件都可以实现，同样官方说 Hooks 也可以实现，且还是在不增加额外的组件的情况下。但是我在项目代码中，没有找到自定义 …...

编程日记 2023/2/11 11:12:30

Java面向对象基础

文章目录面向对象类注意事项内存机制构造器this关键字封装javabean格式成员变量和局部变量区别static静态关键字使用成员方法使用场景内存机制注意事项static应用：工具类static应用：代码块静态代码块实例代码块（用的比较少）static…...

编程日记 2023/2/11 11:09:07

中小型企业服务器常见隐患 + 标准化运维维护方案总结

做运维多年，接触过大量中小企业服务器，总结几个最常见、最致命的问题：1、服务器常年不关机、不巡检，磁盘爆满无人察觉；2、对外开放端口过多，没有安全策略，极易被暴力破解；3、数据库无…...

编程新知 2026/5/22 20:39:50

百考通：AI一键生成期刊论文写作，全流程智能化支撑，让学术创作更高效

在学术研究领域，期刊论文的撰写是成果输出的关键环节，却也让众多科研工作者与学生倍感压力：选题迷茫、逻辑梳理困难、格式规范复杂、内容提炼耗时，严重拖慢了学术成果的发表节奏。百考通（https://www.baikaotongai.com…...

编程新知 2026/5/22 20:08:35

yolo26 语义分割特征融合：全网首发--使用 ERM 模块改进 Neck 多尺度特征融合能力 ✨

1. 工程简介 🚀 本工程基于 Ultralytics 框架扩展，面向语义分割与 YOLO 系列模型改进实验。核心特点是通过切换 yaml 配置文件，即可快速完成不同网络结构的训练、对比与验证，无需为每个模型单独编写训练脚本。当前已支持的主要模型家族 🧩 语义分割模型：UNet、UNet+…...

编程新知 2026/5/22 19:54:19

Dism++终极指南：轻松掌握Windows系统优化与维护的10个关键技巧

Dism终极指南：轻松掌握Windows系统优化与维护的10个关键技巧【免费下载链接】Dism-Multi-language Dism Multi-language Support & BUG Report 项目地址: https://gitcode.com/gh_mirrors/di/Dism-Multi-language 你是否曾经因为Windows系统变得越来越慢…...

编程新知 2026/5/22 16:37:14

LoRA参数高效微调：低秩适配原理与可视化实战

1. 项目概述：这不是调参，是给大模型“打补丁”的手艺活LoRA（Low-Rank Adaptation）不是什么新潮概念，它本质上是一种参数高效微调（PEFT）的工程实践智慧——当你要让一个百亿参数的GPT或BERT模型去…...

编程新知 2026/5/22 15:40:11

如何通过精细风扇控制优化Windows电脑的散热与静音体验

如何通过精细风扇控制优化Windows电脑的散热与静音体验【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/fa/FanContro…...

编程新知 2026/5/22 15:04:41

Unity科幻隧道系统：模块化语法与三层材质架构

1. 这不是“贴图模型”的资源包，而是一套可复用的科幻空间语法系统你有没有试过在Unity里搭一个像《银翼杀手2049》里那种泛着冷光、布满管线与全息界面的通道？我去年做一款赛博朋克风格的VR导览项目时，就卡在这一步——买了三套号称“科幻隧…...

编程新知 2026/5/22 14:45:07

FanControl：重新定义Windows风扇控制，告别恼人噪音与散热烦恼

FanControl：重新定义Windows风扇控制，告别恼人噪音与散热烦恼【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/…...

编程新知 2026/5/22 14:29:37