当前位置: 首页 > news >正文

【Elasticsearch】查询规则_query_rules

1.Query Rules 的定义与作用

Query Rules 是 Elasticsearch 提供的一种功能,允许用户根据预定义的规则动态调整搜索结果。它通过匹配查询的元数据(如用户输入、地理位置、用户兴趣等),对搜索结果进行定制化调整,例如固定某些文档到结果顶部或排除某些文档。

2.Query Rules 的核心组成部分

(1)规则类型(Rule Type)

• `pinned`:将指定文档固定到搜索结果的顶部。例如,在电商场景中,可以将热门商品固定到搜索结果顶部,提高其曝光率。

• `exclude`:从搜索结果中排除指定文档。例如,可以排除过时的新闻或不再销售的商品。

(2)匹配条件(Criteria)

匹配条件用于定义规则触发的条件,支持多种匹配类型,如:

• `exact`:精确匹配,要求完全一致。

• `fuzzy`:模糊匹配,允许一定程度的误差。

• `contains`:包含匹配,检查字段中是否包含指定内容。

(3)动作(Actions)

动作是指当规则匹配时要执行的操作,例如:

• 固定特定的文档`_id`。

• 排除某些文档。

3.在搜索请求中应用 Query Rules 的案例

案例 1:推广特定内容

假设我们需要在用户搜索“智能手机”时,将某些热门商品固定到搜索结果顶部。

定义规则集:

```json

PUT _query_rules/promotion-ruleset

{

  "rules": [

    {

      "rule_id": "promote-specific-products",

      "type": "pinned",

      "criteria": [

        {

          "type": "exact",

          "metadata": "query_string",

          "values": ["智能手机"]

        }

      ],

      "actions": {

        "ids": ["product-123", "product-456"]

      }

    }

  ]

}

```

• `rule_id`:规则的唯一标识。

• `type`:规则类型为`pinned`,表示将指定文档固定到顶部。

• `criteria`:当用户搜索“智能手机”时触发规则。

• `actions`:将文档`product-123`和`product-456`固定到搜索结果顶部。

应用规则的搜索请求:

```json

GET my-index/_search

{

  "retriever": {

    "rule": {

      "retriever": {

        "standard": {

          "query": {

            "query_string": {

              "query": "智能手机"

            }

          }

        }

      },

      "match_criteria": {

        "query_string": "智能手机"

      },

      "ruleset_ids": ["promotion-ruleset"]

    }

  }

}

```

• `ruleset_ids`:指定应用的规则集为`promotion-ruleset`。

这个查询请求是一个 Elasticsearch 的搜索请求,它结合了 Query Rules 功能,用于在搜索时动态应用预定义的规则集(如固定某些文档到搜索结果顶部)。以下是对这个请求的详细解释:

---

1.请求路径

`GET my-index/_search`

• `my-index`:这是目标索引的名称,表示查询将在这个索引中执行。

• `_search`:这是 Elasticsearch 的搜索接口,用于执行查询操作

---

2.请求体的结构

请求体中使用了`retriever`和嵌套的`rule`部分,这是 Query Rules 功能的核心结构。

(1)`retriever`部分

`retriever`是一个检索器,用于定义查询的基本逻辑。它在这里的作用是将标准查询(`standard`)与规则(`rule`)结合起来。

(2)`rule`部分

`rule`是 Query Rules 的核心,用于定义如何应用规则集。

---

3.具体字段解释

(1)`retriever.standard.query`

这部分定义了标准的查询逻辑,即用户实际输入的搜索条件:

```json

"retriever": {

  "standard": {

    "query": {

      "query_string": {

        "query": "智能手机"

      }

    }

  }

}

```

• `query_string`:这是一个查询类型,表示使用字符串查询。

• `query: "智能手机"`:这是用户输入的搜索关键词,表示查询包含“智能手机”的文档。

---

(2)`match_criteria`

`match_criteria`定义了规则触发的条件:

```json

"match_criteria": {

  "query_string": "智能手机"

}

```

• `query_string`:表示匹配条件基于查询字符串。

• `"智能手机"`:这是触发规则的关键词。当用户搜索“智能手机”时,规则会被触发。

注意:`match_criteria`中的关键词需要与规则集中定义的触发条件一致,否则规则不会生效。

---

(3)`ruleset_ids`

`ruleset_ids`指定了要应用的规则集:

```json

"ruleset_ids": ["promotion-ruleset"]

```

• `promotion-ruleset`:这是规则集的名称,表示应用之前定义的`promotion-ruleset`规则集。

在前面的案例中,`promotion-ruleset`规则集定义了将某些文档(如`product-123`和`product-456`)固定到搜索结果顶部的规则。

---

4.整体逻辑

这个查询请求的作用是:

1. 用户搜索关键词“智能手机”。

2. Elasticsearch 会根据标准查询逻辑检索包含“智能手机”的文档。

3. 同时,Query Rules 会检查规则集`promotion-ruleset`。

4. 如果规则集中的触发条件(`match_criteria`)匹配用户输入(“智能手机”),则执行规则集中的动作(如将某些文档固定到顶部)。

5. 最终返回的搜索结果会结合规则集的动作,例如将`product-123`和`product-456`固定到搜索结果顶部。

---

5.示例结果

假设索引中有以下文档:

```json

[

  {"_id": "product-123", "title": "热门智能手机 A"},

  {"_id": "product-456", "title": "热门智能手机 B"},

  {"_id": "product-789", "title": "普通智能手机 C"}

]

```

执行上述查询后,搜索结果可能如下:

1. 热门智能手机 A(`product-123`,被规则固定到顶部)

2. 热门智能手机 B(`product-456`,被规则固定到顶部)

3. 普通智能手机 C(`product-789`,正常检索结果)

---

总结

这个查询请求通过结合标准查询和 Query Rules 功能,实现了在用户搜索时动态调整搜索结果的顺序。它将某些文档固定到顶部,从而满足业务需求(如推广热门商品)。

案例 2:排除不相关内容

假设我们需要在用户搜索“新闻”时,排除某些过时的新闻内容。

定义规则集:

```json

PUT _query_rules/exclude-ruleset

{

  "rules": [

    {

      "rule_id": "exclude-old-news",

      "type": "exclude",

      "criteria": [

        {

          "type": "exact",

          "metadata": "query_string",

          "values": ["旧闻"]

        }

      ],

      "actions": {

        "ids": ["news-789"]

      }

    }

  ]

}

```

• `type`:规则类型为`exclude`,表示从搜索结果中排除指定文档。

• `criteria`:当用户搜索“旧闻”时触发规则。

• `actions`:排除文档`news-789`。

应用规则的搜索请求:

```json

GET my-index/_search

{

  "retriever": {

    "rule": {

      "retriever": {

        "standard": {

          "query": {

            "query_string": {

              "query": "新闻"

            }

          }

        }

      },

      "match_criteria": {

        "query_string": "新闻"

      },

      "ruleset_ids": ["exclude-ruleset"]

    }

  }

}

```

• `ruleset_ids`:指定应用的规则集为`exclude-ruleset`。

4.Query Rules 的性能优化

(1)简化规则逻辑

尽量减少规则的数量和复杂性,避免过多的模糊匹配或复杂的条件组合。过多的规则会增加查询的计算开销,降低性能。

(2)合理设置 JVM 参数

通过调整 Elasticsearch 的 JVM 参数(如堆内存大小)来优化整体性能。例如,合理设置堆内存大小可以避免频繁的垃圾回收(GC),从而提高系统性能。

(3)启用查询缓存

对于频繁使用的查询,启用查询缓存可以减少重复查询的开销,提升查询性能。

5.Query Rules 的监控与评估

(1)查询规则测试器 API

使用 Query Rules 测试器 API 验证规则是否按预期工作。

```json

POST _query_rules/my-ruleset/_test

{

  "match_criteria": {

    "match": "exclude"

  }

}

```

(2)查询执行计划分析

通过启用查询执行计划分析(`profile`参数),可以分析查询的性能瓶颈。

```json

{

  "query": {

    "match": {

      "field": "value"

    }

  },

  "profile": true

}

```

通过以上案例和参数详解,可以更好地在 Elasticsearch 中使用 Query Rules 功能来动态调整搜索结果,同时结合性能优化和监控手段,确保系统的高效运行。

相关文章:

【Elasticsearch】查询规则_query_rules

1.Query Rules 的定义与作用 Query Rules 是 Elasticsearch 提供的一种功能,允许用户根据预定义的规则动态调整搜索结果。它通过匹配查询的元数据(如用户输入、地理位置、用户兴趣等),对搜索结果进行定制化调整,例如固…...

Git备忘录(三)

设置用户信息: git config --global user.name “itcast” git config --global user.email “ helloitcast.cn” 查看配置信息 git config --global user.name git config --global user.email $ git init $ git remote add origin gitgitee.com:XXX/avas.git $ git pull or…...

用户的声音 | 文档结构化信息提取方案测评:LLM、开源模型部署与云端API,谁是合适选择?

文档预处理之文本化 近日,我们收到来自专业用户的使用心得,浅析结构化信息提取技术、技术选型及一些个人测试。 结构化信息提取的重要性 数据作为大模型时代的核心生产资料,其结构化处理能力直接影响AI系统的实用价值。尽管知识图谱、RAG等…...

vite调试node_modules下面插件

在使用vite进行开发的时候,我们可能想要修改node_modules中插件的源码.特别是集成一个SDK,需要调试去判断问题时,或者研究第三方源码时后; vite默认是走缓存的,所以当修改后不会看到你打印的日志,这个时候有几种方法可以选择; 方式…...

ES12 weakRefs的用法和使用场景

ES12 (ECMAScript 2021) 特性总结:WeakRef 1. WeakRef 概述 描述 WeakRef 是 ES12 引入的一个新特性,用于创建对对象的弱引用。弱引用不会阻止垃圾回收器回收对象,即使该对象仍然被弱引用持有。WeakRef 通常与 FinalizationRegistry 结合使…...

【Python】集合set详细讲解(语法、操作、集合运算、性能、使用场景)

文章目录 1. 语法1.1 使用 {} 定义1.2 使用 set() 定义 2. 特点3. 常用操作3.1 访问元素3.2 查找数据3.3 添加元素3.3.1 add() 方法3.3.2 update()方法 3.4 删除元素3.4.1 remove()方法3.4.2 discard()方法3.4.3 pop()方法3.4.4 clear()方法 3.5 集合运算3.5.1 并集&#xff1a…...

网络安全大数据架构 网络安全之数据安全

🍅 点击文末小卡片 ,免费获取网络安全全套资料,资料在手,涨薪更快 网络安全和数据安全 从狭义来说,网络安全指网络系统的硬件、软件及其系统中的数据受到保护,不因偶然的或恶意的原因遭到破坏、更改、泄露&…...

(前端基础)CSS(一)

了解 Cascading Style Sheet:层叠级联样式表 CSS:表现层(美化网页)如:字体、颜色、边框、高度、宽度、背景图片、网页定位、网页浮动 css优势: 内容和表现分离网页结构表现统一,可以实现复用…...

Redis数据类型全景解析:从底层编码到应用反模式

一、核心数据类型矩阵 1.1 基础类型对比表 类型底层结构最大容量时间复杂度典型场景StringSDS/Embstr/Raw512MBO(1)读写缓存/计数器ListQuickList(ziplist)2^32-1元素头尾操作O(1)消息队列Hashziplist/hashtable2^32-1键值对O(1)平均对象存储Setintset/hashtable2^32-1成员O(…...

(蓝桥杯——10. 小郑做志愿者)洛斯里克城志愿者问题详解

题目背景 小郑是一名大学生,她决定通过做志愿者来增加自己的综合分。她的任务是帮助游客解决交通困难的问题。洛斯里克城是一个六朝古都,拥有 N 个区域和古老的地铁系统。地铁线路覆盖了树形结构上的某些路径,游客会询问两个区域是否可以通过某条地铁线路直达,以及有多少条…...

TypeScript跟js,es6这些的区别

TypeScript 一、TypeScript 是什么 想象 JavaScript 是一个自由奔放的艺术家,它在创作(编写代码)时不受太多约束,非常灵活,但有时也容易犯错且难以调试。而 TypeScript 就像是给这位艺术家配备了一套精确的工具和规范…...

flink-cdc同步数据到doris中

1 创建数据库和表 1.1 数据库脚本 这样直接创建数据库是有问题,因为后面发现superset连接使用doris://root:12345610.101.12.82:9030/internal.eayc?charsetutf8mb4 -- 创建数据库eayc create database if not exists ods_eayc; -- 创建数据表2 数据同步 2.1 f…...

Kubernetes:EKS 中 Istio Ingress Gateway 负载均衡器配置及常见问题解析

引言 在云原生时代,Kubernetes 已经成为容器编排的事实标准。AWS EKS (Elastic Kubernetes Service) 作为一项完全托管的 Kubernetes 服务,简化了在 AWS 上运行 Kubernetes 的复杂性。Istio 作为服务网格领域的佼佼者,为微服务提供了流量管理…...

Golang教程

1. go 环境与命令 1.1 go 环境搭建 SDK 安装 Go 官网:golang.orgGo 中文社区:https://studygolang.com/dlGo API文档:https/golang.org 或 https://studygolang.com/pkgdoc 目录 api :api 存放bin:go命令src&#…...

AI 百炼成神:线性回归,预测房价

我们开始第一个项目——线性回归:预测房价。这是一个经典的机器学习入门项目,可以帮助你理解如何使用线性回归模型来预测连续的数值。 第一个项目:线性回归预测房价 项目目标 学习线性回归的基本概念。使用历史房价数据建立一个预测模型。理解如何评估模型的性能。项目步骤…...

企业软件合规性管理:构建高效、安全的软件资产生态

引言 在数字化转型的浪潮下,企业的软件使用方式日益多元化,涉及云端、订阅制、永久授权及浮动许可等多种模式。然而,随着软件资产的增多,企业面临着合规性管理的严峻挑战:非法软件使用、许可证管理不当、软件资产闲置…...

每日一题——编辑距离

编辑距离 参考资料题目描述示例 解题思路动态规划(DP)方法 代码实现复杂度分析示例详解示例1:"nowcoder" → "new"示例2:"intention" → "execution" 总结与心得 参考资料 建议先参考下…...

TensorFlow项目GPU运行 安装步骤

以下是在 Linux 系统 下搭建完整 GPU 加速环境的详细流程(适配 CUDA 11.2 和 Python 3.9): 1. 前置检查 1.1 验证 NVIDIA 驱动 # 检查驱动版本(需 ≥ 450.80.02) nvidia-smi 输出示例: CUDA Version: 11.2…...

c++进阶———继承

1.引言 在一些大的项目中,我们可能要重复定义一些类,但是很麻烦,应该怎么办呢?举个简单的例子,我要做一个全校师生统计表,统计学号,教师编号,姓名,年龄,电话…...

FreeSwitch的mod_translate模块详细,附带场景案例及代码示例

mod_translate 模块详细介绍 mod_translate 是 FreeSWITCH 中的一个拨号计划应用程序模块,用于对电话号码或字符串进行格式转换和翻译。它可以根据预定义的规则对输入的内容进行匹配和转换,常用于号码格式化、路由选择、号码屏蔽等场景。 主要功能 号码…...

Java 语言特性(面试系列1)

一、面向对象编程 1. 封装(Encapsulation) 定义:将数据(属性)和操作数据的方法绑定在一起,通过访问控制符(private、protected、public)隐藏内部实现细节。示例: public …...

Android 之 kotlin 语言学习笔记三(Kotlin-Java 互操作)

参考官方文档:https://developer.android.google.cn/kotlin/interop?hlzh-cn 一、Java(供 Kotlin 使用) 1、不得使用硬关键字 不要使用 Kotlin 的任何硬关键字作为方法的名称 或字段。允许使用 Kotlin 的软关键字、修饰符关键字和特殊标识…...

Springboot社区养老保险系统小程序

一、前言 随着我国经济迅速发展,人们对手机的需求越来越大,各种手机软件也都在被广泛应用,但是对于手机进行数据信息管理,对于手机的各种软件也是备受用户的喜爱,社区养老保险系统小程序被用户普遍使用,为方…...

AGain DB和倍数增益的关系

我在设置一款索尼CMOS芯片时,Again增益0db变化为6DB,画面的变化只有2倍DN的增益,比如10变为20。 这与dB和线性增益的关系以及传感器处理流程有关。以下是具体原因分析: 1. dB与线性增益的换算关系 6dB对应的理论线性增益应为&…...

【Go语言基础【12】】指针:声明、取地址、解引用

文章目录 零、概述:指针 vs. 引用(类比其他语言)一、指针基础概念二、指针声明与初始化三、指针操作符1. &:取地址(拿到内存地址)2. *:解引用(拿到值) 四、空指针&am…...

C#中的CLR属性、依赖属性与附加属性

CLR属性的主要特征 封装性: 隐藏字段的实现细节 提供对字段的受控访问 访问控制: 可单独设置get/set访问器的可见性 可创建只读或只写属性 计算属性: 可以在getter中执行计算逻辑 不需要直接对应一个字段 验证逻辑: 可以…...

莫兰迪高级灰总结计划简约商务通用PPT模版

莫兰迪高级灰总结计划简约商务通用PPT模版,莫兰迪调色板清新简约工作汇报PPT模版,莫兰迪时尚风极简设计PPT模版,大学生毕业论文答辩PPT模版,莫兰迪配色总结计划简约商务通用PPT模版,莫兰迪商务汇报PPT模版,…...

Web中间件--tomcat学习

Web中间件–tomcat Java虚拟机详解 什么是JAVA虚拟机 Java虚拟机是一个抽象的计算机,它可以执行Java字节码。Java虚拟机是Java平台的一部分,Java平台由Java语言、Java API和Java虚拟机组成。Java虚拟机的主要作用是将Java字节码转换为机器代码&#x…...

图解JavaScript原型:原型链及其分析 | JavaScript图解

​​ 忽略该图的细节(如内存地址值没有用二进制) 以下是对该图进一步的理解和总结 1. JS 对象概念的辨析 对象是什么:保存在堆中一块区域,同时在栈中有一块区域保存其在堆中的地址(也就是我们通常说的该变量指向谁&…...

aardio 自动识别验证码输入

技术尝试 上周在发学习日志时有网友提议“在网页上识别验证码”,于是尝试整合图像识别与网页自动化技术,完成了这套模拟登录流程。核心思路是:截图验证码→OCR识别→自动填充表单→提交并验证结果。 代码在这里 import soImage; import we…...