ES中must与filter的区别
在 Elasticsearch 的布尔查询(bool query
)中,must
和 filter
是两个核心子句,它们的核心区别在于 是否影响相关性评分,这直接决定了它们在查询性能、使用场景和结果排序上的差异。以下是详细对比:
一、核心区别
二、底层原理
1. must
子句
-
执行流程:
- 对每个文档执行查询条件
- 计算匹配条件的相关性评分(
_score
) - 合并所有
must
子句的评分(默认相加) - 按总分排序结果
- 典型应用:
{"query": {"bool": {"must": [{ "match": { "title": "elasticsearch" } }, // 全文搜索{ "range": { "price": { "gte": 100 } } } // 范围条件(但需要影响排序)]}}
}
2. filter
子句
-
执行流程:
- 使用倒排索引快速过滤文档(无需计算评分)
- 结果集返回匹配文档(不排序)
- 若与其他评分查询组合,仅传递过滤后的文档给评分模块
-
典型应用:
{"query": {"bool": {"must": [ { "match": { "title": "elasticsearch" } } ],"filter": [ { "term": { "status": "published" } }, // 精确匹配{ "range": { "publish_date": { "gte": "2023-01-01" } } }]}}
}
三、使用场景对比
1. 必须使用 must
的场景
- 需求涉及相关性排序: 例如:搜索商品时,关键词匹配度高的结果需要排在前面。
- 需要组合多个相关性条件: 例如:同时匹配标题和内容的关键词,且两者的匹配度共同影响排序。
2. 必须使用 filter
的场景
- 精确筛选数据: 例如:过滤出状态为“已发布”、价格在 100-500 元之间的商品。
- 高频重复查询: 例如:电商平台首页的“促销商品”筛选(同样条件会被多次执行)。
- 不关心排序的过滤: 例如:审计日志的时间范围过滤,结果按时间倒序即可。
四、性能优化技巧
1. 层级优化原则
将过滤条件尽量放在 filter
中,优先缩小数据集:
{"query": {"bool": {"must": [ { "match": { "content": "性能优化" } } ],"filter": [{ "term": { "category": "技术文档" } },{ "range": { "view_count": { "gte": 1000 } } }]}}
}
2. 强制跳过评分
对 must
中的非相关性条件使用 constant_score
:
{"query": {"bool": {"must": [{ "match": { "title": "elasticsearch" } },{ "constant_score": { // 此条件不贡献评分"filter": { "term": { "version": "7.x" } },"boost": 0 // 评分权重设为0}}]}}
}
3. 缓存验证
通过 _search
API 的 profile
参数验证是否命中缓存:
GET /index/_search?request_cache=true
{"query": { "bool": { "filter": [ {...} ] } }
}
五、错误使用案例
1. 误用 must
导致性能下降
// 错误:用 must 处理精确匹配
{"bool": {"must": [{ "term": { "status": "active" } }, // 精确条件应放在 filter{ "range": { "age": { "gte": 18 } } }]}
}
2. 误用 filter
导致排序失效
// 错误:用 filter 处理需要影响排序的条件
{"bool": {"must": [ { "match": { "title": "紧急通知" } } ],"filter": [ { "range": { "priority": { "gte": 5 } } } ] // priority 应影响排序}
}
六、高级组合用法
1. 混合使用提升性能
{"query": {"bool": {"must": [ { "match": { "text": "error" } } ],"filter": [{ "term": { "service": "gateway" } },{ "range": { "@timestamp": { "gte": "now-1h" } } }]}}
}
2. 嵌套 bool 查询
{"query": {"bool": {"must": [{ "match": { "title": "系统故障" } },{ "bool": { "filter": [ // 嵌套的过滤条件{ "term": { "environment": "prod" } },{ "range": { "severity": { "gte": 3 } } }]}}]}}
}
七、总结
must
的本质:贡献相关性评分的条件,适用于需要影响结果排序的场景。filter
的本质:高效的二进制过滤器,适用于精确匹配和高频查询。- 黄金法则: 能用
filter
的不要用must
—— 除非明确需要该条件影响评分。
相关文章:

ES中must与filter的区别
在 Elasticsearch 的布尔查询(bool query)中,must 和 filter 是两个核心子句,它们的核心区别在于 是否影响相关性评分,这直接决定了它们在查询性能、使用场景和结果排序上的差异。以下是详细对比: 一、核心…...

qt之开发大恒usb3.0相机三
上一篇大恒相机的开发 是基于Qt Creator msvc工具链编译的,大恒相机msvc使用的的lib库是c版的。如果想要使用mingw工具链开发大恒相机,那么找连接对相应的lib库。mingw对应的库是c的。 配置如下: 图像获取核心代码如下 void __stdcall Wid…...

Transformer架构详解:从Attention到ChatGPT
Transformer架构详解:从Attention到ChatGPT 系统化学习人工智能网站(收藏):https://www.captainbed.cn/flu 文章目录 Transformer架构详解:从Attention到ChatGPT摘要引言一、Attention机制:Transformer的…...

数据中台(大数据平台)之数据安全管理
数据安全管理是结合大数据技术和行业特性,数据中台产品应具备数据分类分级、敏感数据智能识别的功能,并结合敏感数据管理、数据脱敏、数据加密等安全管控方式,保障数据安全可用。 1.安全分级分类:数据分级分类是一种将不同数据按…...

github双重验证密码忘记或者获取不了了怎么办
背景 近期由于换了新手机,之前配置好的Authenticator这个App无法使用,导致获取不到二次验证的Authenticator code,登陆不上GitHub,不知道有没有人和我遇到同样的问题? 当我们配置2FA双重验证后,每次登陆gi…...

告别复杂操作!电脑极简风格计时使用
无论是工作、学习还是日常生活,这款小巧实用的计时工具都能成为你掌控时间的好帮手。特别适合需要频繁切换正计时、倒计时和查看当前时间的场景。界面简洁,操作便捷,助你高效管理每一刻。 这是一款免安装的工具,下载后可直接打开…...
stm32cube ide如何将工具链替换成arm-none-eabi-gcc
在 STM32Cube IDE 中替换工具链为GNU Arm Embedded Toolchain (arm-none-eabi-gcc),可按以下步骤操作: 1. 检查是否已安装工具链 首先确认系统中是否已安装 arm-none-eabi-gcc: Windows:检查环境变量 PATH 中是否包含工具链路径…...

[STM32问题解决(2)]STM32通过串口与PC通信,打开串口助手后无法在打开状态下下载程序和复位STM32
问题回顾 最近学习STM32单片机,经常使用STM32通过USART1串口与PC的串口助手进行通信。为了简单便捷,通常在打开串口的状态下下载程序。这样子下载程序后,STM32发出的信号,PC马上可以收到。 但是,突然出现了一个问题&a…...
RabbitMQ 与其他 MQ 的对比分析:Kafka/RocketMQ 选型指南(二)
四、三者性能大比拼 4.1 吞吐量 吞吐量是衡量消息队列处理能力的重要指标,它反映了在单位时间内消息队列能够处理的消息数量。在这方面,Kafka 表现最为出色,其独特的设计使其能够轻松处理每秒数百万条消息 。Kafka 采用分布式架构和分区机制…...

OpenHarmony定制系统组合按键(一)
一、开发环境 系统版本:OpenHarmony 4.0.10.13 设备平台:rk3568 SDK版本:fullSDK 4.0.10.13 DevEco Studio版本:4.1.0.400 二、需求背景 定制OpenHarmony 系统组合按键功能,例如仿Android Power VOL_Up组合键实现截…...
ORDER BY子句在一个 SQL 查询中只能出现一次
order by A.create_time,A.update_time desc和 order by A.create_time desc,A.update_time desc有区别吗? 关键区别 第一个排序中 create_time 是升序(默认是ASC),第二个是降序(DESC) 只有在 DESC 关键字紧跟在列名后面时,该列才会按降序排…...

Spring Boot 3 整合 MQ 构建聊天消息存储系统
引子 在构建实时聊天服务时,我们既要保证消息的即时传递,又需要对消息进行持久化存储以便查询历史记录。然而,直接同步写入数据库在高并发场景下容易成为性能瓶颈,影响消息的实时性。秉承"没有什么问题是加一层解决不了的&q…...
DeepSeek实战:打造智能数据分析与可视化系统
DeepSeek实战:打造智能数据分析与可视化系统 1. 数据智能时代:DeepSeek数据分析系统入门 在数据驱动的决策时代,智能数据分析系统正成为企业核心竞争力。本节将使用DeepSeek构建一个从数据清洗到可视化分析的全流程智能系统。 1.1 系统核心功能架构 class DataAnalysisS…...

非线性声学计算与强化学习融合框架:突破复杂环境人机交互的新技术
随着人工智能的快速发展,尤其是在深度学习和强化学习领域,声学计算和人机交互进入前所未有的扩展和创新阶段。尽管传统声学方法取得了显著成功,但这些线性或准线性方法在实际环境中往往存在关键的不足,尤其在动态、复杂或混响环境…...

C++ - STL #什么是STL #STL的版本 #闭源开源 #STL的六大组件
文章目录 前言 一、什么是STL 二、STL的版本 1、原始版本 2、P.J.版本 3、RW版本 4、SGI版本 三、闭源、开源 四、STL的六大组件 总结 前言 路漫漫其修远兮,吾将上下而求索; 一、什么是STL STL(standard template libaray 标准模板库)&#…...

Flutter - 原生交互 - 相机Camera - 01
环境 Flutter 3.29 macOS Sequoia 15.4.1 Xcode 16.3 集成 Flutter提供了camera插件来拍照和录视频,它提供了一系列可用的相机,并使用特定的相机展示相机预览、拍照、录视频。 添加依赖 camera: 提供使用设备相机模块的工具path_provider: 寻找存储图…...

湖北理元理律师事务所:个人债务管理的温度与精度
湖北理元理律师事务所:个人债务管理的温度与精度 面对信用卡、网贷、医疗债等多重债务压力,普通人常陷入“拆东墙补西墙”的恶性循环。湖北理元理律师事务所通过计划集团公司服务平台,推出“有温度的债务优化计划”,其人性化设计…...

Compose原理 - 整体架构与主流程
一、整体架构 在官方文档中(Jetpack Compose 架构层 | Android Developers),对Compose的分层有所阐述: 其中 Runtime:提供Compose的基础运行能力,包括State、Side-effects、CompositionLocal、Compositio…...
从0开始学vue:实现一个简单页面
Vue.js 是一个渐进式JavaScript框架,用于构建用户界面。下面我将带你从零开始学习Vue.js并创建一个简单的可运行页面。 1. 准备工作 首先,你需要了解几种学习Vue.js的方式: 方式一:使用CDN引入(最简单的方式&#x…...
在机器视觉测量和机器视觉定位中,棋盘格标定如何影响精度
棋盘格标定是机器视觉(尤其是基于相机的系统)中进行相机内参(焦距、主点、畸变系数)和外参(相机相对于世界坐标系的位置和姿态)标定的经典且广泛应用的方法。它的质量直接、显著且多方面地影响最终的视觉测量和定位精度。 以下是棋盘格标定如何影响精度的详细分析: 标定…...

CppCon 2014 学习: C++ Test-driven Development
“Elephant in the Room”这个比喻常用来形容那些大家都知道但没人愿意讨论的重大问题。 这段内容讲的是软件质量管理的经典做法和潜在的问题: 经典做法:开发完成后才进行人工测试(manual testing after creation)。隐喻“Cape o…...

RAGflow详解及实战指南
目录 前言 一、RAGflow核心技术解析 1. 技术原理:检索与生成的协同进化 2. 架构设计:分层模块化与高扩展性 3. 核心优势:精准、高效、安全 二、RAGflow实战应用场景 1. 企业知识库搭建 2. 智能客服系统 3. 投资分析报告生成 4. 制造…...
JWT 不对外,Session ID 对外:构建安全可控的微服务认证架构
以下是一篇围绕“JWT不对外,Session ID对外”的专业架构设计文章,适用于技术团队评审、技术博客发布或系统设计文档引用: JWT 不对外,Session ID 对外:构建安全可控的微服务认证架构 在构建分布式微服务系统时&#x…...

[Godot] 如何导出安卓 APK 并在手机上调试
在之前的文章中,我们已经详细介绍了如何配置 Godot 的安卓应用开发环境,包括安装 Android SDK、配置 Java 环境、设置 Godot 的 Android 导出模板等。本篇文章将进一步讲解如何将 Godot 项目导出为安卓 APK 文件,并实现在手机上进行调试运行。…...
React 路由管理与动态路由配置实战
React 路由管理与动态路由配置实战 前言 在现代单页应用(SPA)开发中,路由管理已经成为前端架构的核心部分。随着React应用规模的扩大,静态路由配置往往难以满足复杂业务场景的需求,尤其是当应用需要处理权限控制、动态菜单和按需加载等高级…...
ZYNQ sdk lwip配置UDP组播收发数据
🚀 一、颠覆认知:组播 vs 单播 vs 广播 通信方式目标设备网络负载典型应用场景单播1对1O(n)SSH远程登录广播1对全网O(1)ARP地址解析组播1对N组O(1)视频会议/物联网群控创新价值:在智能工厂中,ZYNQ通过组播同时控制100台AGV小车,比传统单播方案降低92%网络流量! 🔧 二、…...
11.21 LangGraph多轮对话系统实战:三步构建高效信息整理引擎,效率提升300%!
关键词:LangGraph 工作流设计, 信息整理助理, 多轮对话系统, 状态管理, 条件分支控制 信息整理助理工作流设计 信息整理助理需要完成 多源数据收集 → 信息分类 → 深度分析 → 结构化输出 的完整流程。通过 LangGraph 的图结构工作流,可实现复杂逻辑的模块化编排: #mermai…...
高光谱成像相机:基于高光谱成像技术的玉米种子纯度检测研究
种子纯度是衡量种子质量的核心指标之一,直接影响农作物产量与品质。传统检测方法(如形态学观察、生化分析)存在耗时长、破坏样本、依赖人工等缺陷。近年来,高光谱成像技术因其融合光谱与图像信息的优势,成为无损检测领…...

Linux《文件系统》
在之前的系统IO当中已经了解了“内存”级别的文件操作,了解了文件描述符、重定向、缓冲区等概念,在了解了这些的知识之后还封装出了我们自己的libc库。接下来在本篇当中将会将视角从内存转向磁盘,研究文件在内存当中是如何进行存储的…...

NLP学习路线图(十六):N-gram模型
一、为何需要语言模型?概率视角下的语言本质 自然语言处理的核心挑战在于让机器“理解”人类语言。这种理解的一个关键方面是处理语言的歧义性、创造性和结构性。语言模型(Language Model, LM)为此提供了一种强大的数学框架:它赋…...