当前位置：首页 > news >正文

Elasticsearch总结笔记

news 2026/5/11 19:52:33

文章目录

- 简介
- 类型
- 增删改查操作
- 索引原理

简介

底层使用的lucene引擎，lucene引擎直接使用相对复杂，有一定的学习成本，同样是使用Java编写，Elasticsearch使用的rest风格的进行交互，而数据呢则是以JSON的方式进行传输。
学习Elasticsearch要求使用的JDK版本在8以上。Elasticsearch主要用于检索，尤其是其全文检索的能力，以及自带乐观锁以及友好的集群，让它越来越受欢迎。
使用Elasticsearch首先要指定是如何定位数据。即三要素进行定位，index索引，type类型，id主键（_index,_type,_id）
PUT,DELETE,POST,GET(使用的方法都是大写，大括号在请求下一行)4种REST请求方式即完成增删改查，当然在ES中改其实是先把旧的移除，重新创建一个新的文档，PUT也可以更新，但是是整体更新，POST则是可以内容追加，不过也是一个新的文档。
1.映射（Mapping）
描述数据在每个字段内如何存储
2.分析（Analysis）
全文是如何处理使之可以被搜索的
3.领域特定查询语言（Query DSL）
Elasticsearch 中强大灵活的查询语言

类型

ES的基本类型有:(和关系型SQL区别不需要设置字段的长度)
字符串:text,keyword
数字类型:integer,long
浮点类型"float,double,
布尔类型:boolean,
时间类型:date

在ES中默认只有text类型可以分词，分词使用英文引擎，按照单词分词，如果是中文进行查询的话，则是将数据变成单字分词

增删改查操作

查:

GET /索引名(即数据库)/_doc/_id(记录id值)

增(覆盖式)

PUT /索引名(即数据库)/_doc/_id(记录id值)
{_id:''
}

改:(增量式)

POST  /索引名(即数据库)/_doc/_id(记录id值)
{要修改的字段
}

删除

DELETE /索引名(即数据库)/_doc/_id(记录id值)

批量操作

POST /索引名(即数据库)/_doc/_bulk
{批量的文档（需注意每行文档记录不能换行）
}

高级查询:（Query DSL）
1.查询所有

GET /索引名(即数据库)/_search
{"query":{"match_all":{}}
}

2.term条件查询

GET /索引名(即数据库)/_search
{"query":{"term":{}}
}

3.range范围查询

GET /索引名(即数据库)/_search
{"query":{"range":{"字段":{"gt":"值","lte":"值"}}}
}

3.前缀查询

GET /索引名(即数据库)/_search
{"query":{"prefix":{"字段":"值"}}
}

4.通配符查询

*是通配(可以匹配多个长度的)，?是占位(匹配固定长度,如goo?,可匹配good，但不能god,匹配的字符长度是固定的)

GET /索引名/_search
{"query": {"wildcard": {"字段": {"value": "值* "}}}
}

5.ids查询

GET /索引名/_search
{"query": {"ids": {"values": id数组}}
}

6.模糊查询[fuzzy]

GET /products/_search
{"query": {"fuzzy": {"字段":"值"}}
}

模糊查询[fuzzy]，切记使用有以下规则

fuzzy 关键字: ⽤来模糊查询含有指定关键字的⽂档
注意: fuzzy 模糊查询最⼤模糊错误必须在0-2之间
搜索关键词⻓度为 2 不允许存在模糊
搜索关键词⻓度为3-5 允许⼀次模糊
搜索关键词⻓度⼤于5 允许最⼤2模糊

7.布尔查询
这个其实就是基本类似于关系性SQL中的：exist,not exist 等语法

bool 关键字: ⽤来组合多个条件实现复杂查询
must: 相当于&& 同时成⽴
should: 相当于|| 成⽴⼀个就⾏
must_not: 相当于! 不能满⾜任何⼀个

GET /索引名/_search
{"query": {"bool": {"must": [{"term":{要求的条件JSON}}]}}
}

8.多字段查询[multi_match]
GET /索引名/_search

{"query": {"multi_match": {"query": "值","fields":字段数组}}
}

注意: 字段类型分词,将查询条件分词之后进⾏查询改字段如果该字段不分词就会
将查询条件作为整体进⾏查询

9.默认字段分词查询[query_string]

GET /索引名/_search
{"query": {"query_string": {"default_field": "查询字段","query": "值"}}
}

注意: 查询字段分词就将查询条件分词查询,查询字段不分词将查询条件不分词查询

10.⾼亮查询[highlight]

highlight 关键字: 可以让符合条件的⽂档中的关键词⾼亮

GET /索引名/_search
{"query": {"term": {"字段": {"value": "值"}}},"highlight": {"fields": {"*":{}}}
}

⾃定义⾼亮html标签: 可以在highlight中使⽤ pre_tags 和 post_tags

GET /索引名/_search
{"query": {"term": {"字段": {"value": "值"}}},"highlight": {"post_tags": ["</span>"],"pre_tags": ["<span style='color:red'>"],"fields": {"*":{}}}
}

多字段⾼亮使⽤ require_field_match 开启多个字段⾼亮

GET /索引名/_search
{"query": {"term": {"字段": {"value": "值"}}},"highlight": {"require_field_match": "false","post_tags": ["</span>"],"pre_tags": ["<span style='color:red'>"],"fields": {"*":{}}}
}

11.分页查询
利用from，和size，起始页同样是0开始，0即第一页

返回指定条数[size]
size 关键字: 指定查询结果中返回指定条数。默认返回值10条
分⻚查询[form]
from 关键字: ⽤来指定起始返回位置，和size关键字连⽤可实现分⻚效
果

GET /索引/_search
{"query": {"match_all": {}},"size": 5,"from": 0
}

指定字段排序[sort]

GET /索引名/_search
{"query": {"match_all": {}},"sort": [{"字段": {"order": "desc"}}]
}

12.返回指定字段[_source]
_source 关键字: 是⼀个数组,在数组中⽤来指定展示那些字段

GET /索引名/_search
{"query": {"match_all": {}},"_source": 要展示的指定字段数组
}

索引原理

倒排索引（Inverted Index） 也叫反向索引，有反向索引必有正向索引。
通俗地来讲，正向索引是通过key找value，反向索引则是通过value找key。
ES底层在检索时底层使⽤的就是倒排索引。

在ES中除了text类型分词，其他类型不分词，因此根据不同字段创建索引。就将文档的内容根据text字段内容先进行一个默认分词，然后将每个分词有默认的，id映射，当我们查询的时候，ES会将我们搜索条件进行分词，再用搜索的分词条件和我们数据的分词内容进行一定的算法匹配，然后找到id，再关联回我们的文档数据，形成一个命中记录集合，并根据匹配算法的匹配程度给文档打分，并返回整一个结果集

本质是使用了空间换时间的实现，搜索来了只要拿搜索关键词和我们的分词关键词比较即可，所以会很快。

注意: Elasticsearch : Elasticsearch分别为每个字段都建⽴了⼀个倒排索引。因此查询
时查询字段的term, term,就能知道⽂档ID，就能快速找到⽂档。

Elasticsearch总结笔记

文章目录

简介

类型

增删改查操作

索引原理

相关文章：

Elasticsearch总结笔记

Ubuntu 安装指定版本 Mysql，并设置远程连接（以安装mysql 5.5 为例）

NumPy：Python中的强大数学工具

Hbase资源隔离操作指南

TPS2012B泰克Tektronix隔离通道示波器

9.4 PIM-DM

程序员推荐的良心网站合集！

信息安全概论之《密码编码学与网络安全----原理与实践（第八版）》

跬智信息全新推出云原生数据底座玄武，助力国产化数据服务再次升级

【离线数仓-9-数据仓库开发DWS层设计要点-DWS层汇总表以及数据装载】

我的十年编程路序

xs 180

时间序列分析 | BiLSTM双向长短期记忆神经网络时间序列预测（Matlab完整程序）

0101基础-认证授权-springsecurity

一文简单了解THD布局要求

[C++]多态

中国版ChatGPT高潮即将到来，解密ChatGPT底层网络架构

PingCAP 唐刘：一个咨询顾问对 TiDB Chat2Query Demo 提出的脑洞

力扣-销售分析III

U-Boot 之七详解 Driver Model 架构、配置、命令、初始化流程

科研人狂喜！AI生成的位图可以转矢量图了

Mac小白必看：手把手教你找回丢失的Recovery HD分区（附diskutil命令详解）

Android HWASan 详解：硬件标记原理、Clang 启用与排障实践

MyBatis 二级缓存脏读真实原因

性价比好的深圳除甲醛公司

反射式红外光电管ITR9909：从基础测试到智能车竞赛应用实战

WarcraftHelper：让魔兽争霸3在现代电脑重获新生的终极解决方案

自建S3兼容对象存储：Shebe部署、集成与运维全指南

在飞腾FT-2000/4与麒麟V10上源码编译VLC：从依赖解析到播放验证的完整实践

Simulink仿真报错‘积分器发散’？别慌，试试把ode45换成ode3并固定步长