当前位置: 首页 > news >正文

【Elasticsearch】查询规则_query_rules

1.Query Rules 的定义与作用

Query Rules 是 Elasticsearch 提供的一种功能,允许用户根据预定义的规则动态调整搜索结果。它通过匹配查询的元数据(如用户输入、地理位置、用户兴趣等),对搜索结果进行定制化调整,例如固定某些文档到结果顶部或排除某些文档。

2.Query Rules 的核心组成部分

(1)规则类型(Rule Type)

• `pinned`:将指定文档固定到搜索结果的顶部。例如,在电商场景中,可以将热门商品固定到搜索结果顶部,提高其曝光率。

• `exclude`:从搜索结果中排除指定文档。例如,可以排除过时的新闻或不再销售的商品。

(2)匹配条件(Criteria)

匹配条件用于定义规则触发的条件,支持多种匹配类型,如:

• `exact`:精确匹配,要求完全一致。

• `fuzzy`:模糊匹配,允许一定程度的误差。

• `contains`:包含匹配,检查字段中是否包含指定内容。

(3)动作(Actions)

动作是指当规则匹配时要执行的操作,例如:

• 固定特定的文档`_id`。

• 排除某些文档。

3.在搜索请求中应用 Query Rules 的案例

案例 1:推广特定内容

假设我们需要在用户搜索“智能手机”时,将某些热门商品固定到搜索结果顶部。

定义规则集:

```json

PUT _query_rules/promotion-ruleset

{

  "rules": [

    {

      "rule_id": "promote-specific-products",

      "type": "pinned",

      "criteria": [

        {

          "type": "exact",

          "metadata": "query_string",

          "values": ["智能手机"]

        }

      ],

      "actions": {

        "ids": ["product-123", "product-456"]

      }

    }

  ]

}

```

• `rule_id`:规则的唯一标识。

• `type`:规则类型为`pinned`,表示将指定文档固定到顶部。

• `criteria`:当用户搜索“智能手机”时触发规则。

• `actions`:将文档`product-123`和`product-456`固定到搜索结果顶部。

应用规则的搜索请求:

```json

GET my-index/_search

{

  "retriever": {

    "rule": {

      "retriever": {

        "standard": {

          "query": {

            "query_string": {

              "query": "智能手机"

            }

          }

        }

      },

      "match_criteria": {

        "query_string": "智能手机"

      },

      "ruleset_ids": ["promotion-ruleset"]

    }

  }

}

```

• `ruleset_ids`:指定应用的规则集为`promotion-ruleset`。

这个查询请求是一个 Elasticsearch 的搜索请求,它结合了 Query Rules 功能,用于在搜索时动态应用预定义的规则集(如固定某些文档到搜索结果顶部)。以下是对这个请求的详细解释:

---

1.请求路径

`GET my-index/_search`

• `my-index`:这是目标索引的名称,表示查询将在这个索引中执行。

• `_search`:这是 Elasticsearch 的搜索接口,用于执行查询操作

---

2.请求体的结构

请求体中使用了`retriever`和嵌套的`rule`部分,这是 Query Rules 功能的核心结构。

(1)`retriever`部分

`retriever`是一个检索器,用于定义查询的基本逻辑。它在这里的作用是将标准查询(`standard`)与规则(`rule`)结合起来。

(2)`rule`部分

`rule`是 Query Rules 的核心,用于定义如何应用规则集。

---

3.具体字段解释

(1)`retriever.standard.query`

这部分定义了标准的查询逻辑,即用户实际输入的搜索条件:

```json

"retriever": {

  "standard": {

    "query": {

      "query_string": {

        "query": "智能手机"

      }

    }

  }

}

```

• `query_string`:这是一个查询类型,表示使用字符串查询。

• `query: "智能手机"`:这是用户输入的搜索关键词,表示查询包含“智能手机”的文档。

---

(2)`match_criteria`

`match_criteria`定义了规则触发的条件:

```json

"match_criteria": {

  "query_string": "智能手机"

}

```

• `query_string`:表示匹配条件基于查询字符串。

• `"智能手机"`:这是触发规则的关键词。当用户搜索“智能手机”时,规则会被触发。

注意:`match_criteria`中的关键词需要与规则集中定义的触发条件一致,否则规则不会生效。

---

(3)`ruleset_ids`

`ruleset_ids`指定了要应用的规则集:

```json

"ruleset_ids": ["promotion-ruleset"]

```

• `promotion-ruleset`:这是规则集的名称,表示应用之前定义的`promotion-ruleset`规则集。

在前面的案例中,`promotion-ruleset`规则集定义了将某些文档(如`product-123`和`product-456`)固定到搜索结果顶部的规则。

---

4.整体逻辑

这个查询请求的作用是:

1. 用户搜索关键词“智能手机”。

2. Elasticsearch 会根据标准查询逻辑检索包含“智能手机”的文档。

3. 同时,Query Rules 会检查规则集`promotion-ruleset`。

4. 如果规则集中的触发条件(`match_criteria`)匹配用户输入(“智能手机”),则执行规则集中的动作(如将某些文档固定到顶部)。

5. 最终返回的搜索结果会结合规则集的动作,例如将`product-123`和`product-456`固定到搜索结果顶部。

---

5.示例结果

假设索引中有以下文档:

```json

[

  {"_id": "product-123", "title": "热门智能手机 A"},

  {"_id": "product-456", "title": "热门智能手机 B"},

  {"_id": "product-789", "title": "普通智能手机 C"}

]

```

执行上述查询后,搜索结果可能如下:

1. 热门智能手机 A(`product-123`,被规则固定到顶部)

2. 热门智能手机 B(`product-456`,被规则固定到顶部)

3. 普通智能手机 C(`product-789`,正常检索结果)

---

总结

这个查询请求通过结合标准查询和 Query Rules 功能,实现了在用户搜索时动态调整搜索结果的顺序。它将某些文档固定到顶部,从而满足业务需求(如推广热门商品)。

案例 2:排除不相关内容

假设我们需要在用户搜索“新闻”时,排除某些过时的新闻内容。

定义规则集:

```json

PUT _query_rules/exclude-ruleset

{

  "rules": [

    {

      "rule_id": "exclude-old-news",

      "type": "exclude",

      "criteria": [

        {

          "type": "exact",

          "metadata": "query_string",

          "values": ["旧闻"]

        }

      ],

      "actions": {

        "ids": ["news-789"]

      }

    }

  ]

}

```

• `type`:规则类型为`exclude`,表示从搜索结果中排除指定文档。

• `criteria`:当用户搜索“旧闻”时触发规则。

• `actions`:排除文档`news-789`。

应用规则的搜索请求:

```json

GET my-index/_search

{

  "retriever": {

    "rule": {

      "retriever": {

        "standard": {

          "query": {

            "query_string": {

              "query": "新闻"

            }

          }

        }

      },

      "match_criteria": {

        "query_string": "新闻"

      },

      "ruleset_ids": ["exclude-ruleset"]

    }

  }

}

```

• `ruleset_ids`:指定应用的规则集为`exclude-ruleset`。

4.Query Rules 的性能优化

(1)简化规则逻辑

尽量减少规则的数量和复杂性,避免过多的模糊匹配或复杂的条件组合。过多的规则会增加查询的计算开销,降低性能。

(2)合理设置 JVM 参数

通过调整 Elasticsearch 的 JVM 参数(如堆内存大小)来优化整体性能。例如,合理设置堆内存大小可以避免频繁的垃圾回收(GC),从而提高系统性能。

(3)启用查询缓存

对于频繁使用的查询,启用查询缓存可以减少重复查询的开销,提升查询性能。

5.Query Rules 的监控与评估

(1)查询规则测试器 API

使用 Query Rules 测试器 API 验证规则是否按预期工作。

```json

POST _query_rules/my-ruleset/_test

{

  "match_criteria": {

    "match": "exclude"

  }

}

```

(2)查询执行计划分析

通过启用查询执行计划分析(`profile`参数),可以分析查询的性能瓶颈。

```json

{

  "query": {

    "match": {

      "field": "value"

    }

  },

  "profile": true

}

```

通过以上案例和参数详解,可以更好地在 Elasticsearch 中使用 Query Rules 功能来动态调整搜索结果,同时结合性能优化和监控手段,确保系统的高效运行。

相关文章:

【Elasticsearch】查询规则_query_rules

1.Query Rules 的定义与作用 Query Rules 是 Elasticsearch 提供的一种功能,允许用户根据预定义的规则动态调整搜索结果。它通过匹配查询的元数据(如用户输入、地理位置、用户兴趣等),对搜索结果进行定制化调整,例如固…...

Git备忘录(三)

设置用户信息: git config --global user.name “itcast” git config --global user.email “ helloitcast.cn” 查看配置信息 git config --global user.name git config --global user.email $ git init $ git remote add origin gitgitee.com:XXX/avas.git $ git pull or…...

用户的声音 | 文档结构化信息提取方案测评:LLM、开源模型部署与云端API,谁是合适选择?

文档预处理之文本化 近日,我们收到来自专业用户的使用心得,浅析结构化信息提取技术、技术选型及一些个人测试。 结构化信息提取的重要性 数据作为大模型时代的核心生产资料,其结构化处理能力直接影响AI系统的实用价值。尽管知识图谱、RAG等…...

vite调试node_modules下面插件

在使用vite进行开发的时候,我们可能想要修改node_modules中插件的源码.特别是集成一个SDK,需要调试去判断问题时,或者研究第三方源码时后; vite默认是走缓存的,所以当修改后不会看到你打印的日志,这个时候有几种方法可以选择; 方式…...

ES12 weakRefs的用法和使用场景

ES12 (ECMAScript 2021) 特性总结:WeakRef 1. WeakRef 概述 描述 WeakRef 是 ES12 引入的一个新特性,用于创建对对象的弱引用。弱引用不会阻止垃圾回收器回收对象,即使该对象仍然被弱引用持有。WeakRef 通常与 FinalizationRegistry 结合使…...

【Python】集合set详细讲解(语法、操作、集合运算、性能、使用场景)

文章目录 1. 语法1.1 使用 {} 定义1.2 使用 set() 定义 2. 特点3. 常用操作3.1 访问元素3.2 查找数据3.3 添加元素3.3.1 add() 方法3.3.2 update()方法 3.4 删除元素3.4.1 remove()方法3.4.2 discard()方法3.4.3 pop()方法3.4.4 clear()方法 3.5 集合运算3.5.1 并集&#xff1a…...

网络安全大数据架构 网络安全之数据安全

🍅 点击文末小卡片 ,免费获取网络安全全套资料,资料在手,涨薪更快 网络安全和数据安全 从狭义来说,网络安全指网络系统的硬件、软件及其系统中的数据受到保护,不因偶然的或恶意的原因遭到破坏、更改、泄露&…...

(前端基础)CSS(一)

了解 Cascading Style Sheet:层叠级联样式表 CSS:表现层(美化网页)如:字体、颜色、边框、高度、宽度、背景图片、网页定位、网页浮动 css优势: 内容和表现分离网页结构表现统一,可以实现复用…...

Redis数据类型全景解析:从底层编码到应用反模式

一、核心数据类型矩阵 1.1 基础类型对比表 类型底层结构最大容量时间复杂度典型场景StringSDS/Embstr/Raw512MBO(1)读写缓存/计数器ListQuickList(ziplist)2^32-1元素头尾操作O(1)消息队列Hashziplist/hashtable2^32-1键值对O(1)平均对象存储Setintset/hashtable2^32-1成员O(…...

(蓝桥杯——10. 小郑做志愿者)洛斯里克城志愿者问题详解

题目背景 小郑是一名大学生,她决定通过做志愿者来增加自己的综合分。她的任务是帮助游客解决交通困难的问题。洛斯里克城是一个六朝古都,拥有 N 个区域和古老的地铁系统。地铁线路覆盖了树形结构上的某些路径,游客会询问两个区域是否可以通过某条地铁线路直达,以及有多少条…...

TypeScript跟js,es6这些的区别

TypeScript 一、TypeScript 是什么 想象 JavaScript 是一个自由奔放的艺术家,它在创作(编写代码)时不受太多约束,非常灵活,但有时也容易犯错且难以调试。而 TypeScript 就像是给这位艺术家配备了一套精确的工具和规范…...

flink-cdc同步数据到doris中

1 创建数据库和表 1.1 数据库脚本 这样直接创建数据库是有问题,因为后面发现superset连接使用doris://root:12345610.101.12.82:9030/internal.eayc?charsetutf8mb4 -- 创建数据库eayc create database if not exists ods_eayc; -- 创建数据表2 数据同步 2.1 f…...

Kubernetes:EKS 中 Istio Ingress Gateway 负载均衡器配置及常见问题解析

引言 在云原生时代,Kubernetes 已经成为容器编排的事实标准。AWS EKS (Elastic Kubernetes Service) 作为一项完全托管的 Kubernetes 服务,简化了在 AWS 上运行 Kubernetes 的复杂性。Istio 作为服务网格领域的佼佼者,为微服务提供了流量管理…...

Golang教程

1. go 环境与命令 1.1 go 环境搭建 SDK 安装 Go 官网:golang.orgGo 中文社区:https://studygolang.com/dlGo API文档:https/golang.org 或 https://studygolang.com/pkgdoc 目录 api :api 存放bin:go命令src&#…...

AI 百炼成神:线性回归,预测房价

我们开始第一个项目——线性回归:预测房价。这是一个经典的机器学习入门项目,可以帮助你理解如何使用线性回归模型来预测连续的数值。 第一个项目:线性回归预测房价 项目目标 学习线性回归的基本概念。使用历史房价数据建立一个预测模型。理解如何评估模型的性能。项目步骤…...

企业软件合规性管理:构建高效、安全的软件资产生态

引言 在数字化转型的浪潮下,企业的软件使用方式日益多元化,涉及云端、订阅制、永久授权及浮动许可等多种模式。然而,随着软件资产的增多,企业面临着合规性管理的严峻挑战:非法软件使用、许可证管理不当、软件资产闲置…...

每日一题——编辑距离

编辑距离 参考资料题目描述示例 解题思路动态规划(DP)方法 代码实现复杂度分析示例详解示例1:"nowcoder" → "new"示例2:"intention" → "execution" 总结与心得 参考资料 建议先参考下…...

TensorFlow项目GPU运行 安装步骤

以下是在 Linux 系统 下搭建完整 GPU 加速环境的详细流程(适配 CUDA 11.2 和 Python 3.9): 1. 前置检查 1.1 验证 NVIDIA 驱动 # 检查驱动版本(需 ≥ 450.80.02) nvidia-smi 输出示例: CUDA Version: 11.2…...

c++进阶———继承

1.引言 在一些大的项目中,我们可能要重复定义一些类,但是很麻烦,应该怎么办呢?举个简单的例子,我要做一个全校师生统计表,统计学号,教师编号,姓名,年龄,电话…...

FreeSwitch的mod_translate模块详细,附带场景案例及代码示例

mod_translate 模块详细介绍 mod_translate 是 FreeSWITCH 中的一个拨号计划应用程序模块,用于对电话号码或字符串进行格式转换和翻译。它可以根据预定义的规则对输入的内容进行匹配和转换,常用于号码格式化、路由选择、号码屏蔽等场景。 主要功能 号码…...

Go语言的性能分析与优化

Go语言的性能分析与优化 性能分析的重要性 在软件开发中,性能是一个重要的考量因素。良好的性能可以提升用户体验,减少服务器成本。Go语言提供了强大的性能分析工具,本文将详细介绍Go语言的性能分析与优化。 性能分析基础 性能分析的概念 性能…...

Outfit字体终极指南:9种字重的专业几何无衬线字体实战

Outfit字体终极指南:9种字重的专业几何无衬线字体实战 【免费下载链接】Outfit-Fonts The most on-brand typeface 项目地址: https://gitcode.com/gh_mirrors/ou/Outfit-Fonts Outfit字体是一款现代化的几何无衬线字体,专为品牌自动化公司Outfit…...

终极指南:使用BSA算法实现ROS机器人全覆盖路径规划

终极指南:使用BSA算法实现ROS机器人全覆盖路径规划 【免费下载链接】full_coverage_path_planner Full coverage path planning provides a move_base_flex plugin that can plan a path that will fully cover a given area 项目地址: https://gitcode.com/gh_mi…...

2026年华为云怎么搭建Hermes Agent/OpenClaw?经验之谈

2026年华为云怎么搭建Hermes Agent/OpenClaw?经验之谈。OpenClaw和Hermes Agent是什么?OpenClaw和Hermes Agent怎么部署?如何部署OpenClaw/Hermes Agent?2026年还在为部署OpenClaw和Hermes Agent到处找教程踩坑吗?别再…...

告别激活烦恼:KMS_VL_ALL_AIO智能激活脚本全方位指南

告别激活烦恼:KMS_VL_ALL_AIO智能激活脚本全方位指南 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows和Office激活而反复折腾吗?每次重装系统后都要面对复杂…...

从sp到sf:5个技巧让你的R语言空间分析效率提升300%

从sp到sf:5个技巧让你的R语言空间分析效率提升300% 【免费下载链接】sf Simple Features for R 项目地址: https://gitcode.com/gh_mirrors/sf/sf 你是否曾经在处理R语言空间数据时感到困惑?面对复杂的SpatialPolygonsDataFrame对象,你…...

解锁高效下载:八大网盘直链解析工具完全指南

解锁高效下载:八大网盘直链解析工具完全指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘 / 迅…...

别再死记硬背LVS概念了!用5分钟搞懂它到底在比什么(附EDA工具实战流程)

芯片验证新视角:用建筑工地思维秒懂LVS核心逻辑 想象你是一位建筑监理,面前摊开两张图纸:一张是建筑师绘制的精美效果图,标注了每个房间的功能和连接关系;另一张是施工队提交的钢筋水泥结构图,密密麻麻标注…...

自动化项目引导:从环境搭建到新人上手的工程实践

1. 项目概述与核心价值最近在梳理团队新成员入职流程时,发现了一个普遍存在的痛点:无论公司规模大小,新人的“上手期”总是充满了混乱和低效。信息散落在各个角落,工具权限申请像闯关,代码库在哪、怎么跑起来、遇到问题…...

为什么你的工作效率只有50%?3分钟学会AlwaysOnTop窗口置顶工具提升200%效率

为什么你的工作效率只有50%?3分钟学会AlwaysOnTop窗口置顶工具提升200%效率 【免费下载链接】AlwaysOnTop Make a Windows application always run on top 项目地址: https://gitcode.com/gh_mirrors/al/AlwaysOnTop 你是不是经常在多个窗口间来回切换&#…...