当前位置: 首页 > news >正文

【HBZ分享】ES的评分score机制的原理

score类型

  1. 基础评分boost,默认2.2,
  2. 逆向文档频率值(IDF):表示该词再文档中(ES中)出现的次数越多,表示越不重要,评分越低
  3. 关键词在文档中出现的频率(TF):表示该词在文档中出现的频率,频率越高表示越重要,评分越高
    注意: IDF是出现次数越多,则评分越低, 而TF是出现次数越高,则评分越高,一正一反

score评分机制的计算

  1. boost × idf × tf
  2. 字段的权重 × 逆向文档频率的值 × 关键词在文档中出现的频率值

ES查询时带上评分计算

加上explain 和mysql查看索引使用情况是同一个词
GET /test_index/_search?explain=true

如何自定义评分机制

  1. 权重配置: 通过指定boost基础评分,来定制总评分, 查询请求如下,需要指定boost,来定制哪个词查询基础分更大,即相同频率下该次就会评分更高,会放在前面
GET /test_index/_search
{"query": {"bool": {"should": [{"match": {"summary": {"query": "boot", "boost": 1} // 指定查boot的基础评分boost = 1, 不指定boost则默认2.2}}, {"match": {"summary": {"query": "java", "boost": 3} // 指定查boot的基础评分boost = 3, 不指定boost则默认2.2}}, {"match": {"summary": {"query": "cloud", "boost": 1} // 指定查boot的基础评分boost = 1, 不指定boost则默认2.2}},{"match": {"summary": {"query": "spring", "boost": 1} // 指定查boot的基础评分boost = 1, 不指定boost则默认2.2}}, ]}}
}
  1. 公式定制化: ES提供了一些内置评分函数(BM25), 根据需要进行参数调整,或者使用自定义评分函数来实现
  2. 自定义评分插件

相关文章:

【HBZ分享】ES的评分score机制的原理

score类型 基础评分boost,默认2.2,逆向文档频率值(IDF):表示该词再文档中(ES中)出现的次数越多,表示越不重要,评分越低关键词在文档中出现的频率(TF):表示该词在文档中出现的频率,频率越高表示…...

函数递归专题(案例超详解一篇讲通透)

函数递归 前言1.递归案例:案例一:取球问题案例二:求斐波那契额数列案例三:函数实现n的k次方案例四:输入一个非负整数,返回组成它的数字之和案例五:元素逆置案例六:实现strlen案例七:…...

leetcode-413. 等差数列划分(java)

等差数列划分 leetcode-413. 等差数列划分题目描述双指针 上期经典算法 leetcode-413. 等差数列划分 难度 - 中等 原题链接 - 等差数列划分 题目描述 如果一个数列 至少有三个元素 ,并且任意两个相邻元素之差相同,则称该数列为等差数列。 例如&#xff0…...

从零开始学习 Java:简单易懂的入门指南之MAth、System(十二)

常见API,MAth、System 1 Math类1.1 概述1.2 常见方法1.3 算法小题(质数)1.4 算法小题(自幂数) 2 System类2.1 概述2.2 常见方法 1 Math类 1.1 概述 tips:了解内容 查看API文档,我们可以看到API文档中关于Math类的定义如下: Math类…...

人工智能原理概述 - ChatGPT 背后的故事

大家好,我是比特桃。如果说 2023 年最火的事情是什么,毫无疑问就是由 ChatGPT 所引领的AI浪潮。今年无论是平日的各种媒体、工作中接触到的项目还是生活中大家讨论的热点,都离不开AI。其实对于互联网行业来说,自从深度学习出来后就…...

【Linux】以太网协议——数据链路层

链路层解决的问题 IP拥有将数据跨网络从一台主机送到另一台主机的能力,但IP并不能保证每次都能够将数据可靠的送到对端主机,因此IP需要上层TCP为其提供可靠性保证,比如数据丢包后TCP可以让IP重新发送数据,最终在TCP提供的可靠性机…...

Neo4j之MATCH基础

1】基本匹配和返回:查找所有节点和关系,返回节点的标签和属性。 MATCH (n) RETURN n;2】条件筛选:查找所有名为 "Alice" 的人物节点。 MATCH (person:Person {name: Alice}) RETURN person;3】关系查询:查找所有和 &q…...

Python实验代码合集

NumPy实验(1) NumPy实验(2) NumPy实验(3) SciPy实验(1) 请结合最小二乘法的原理,利用以前学的Numpy和Python知识,实现最小乘法直线拟合的算法,并测试。 请结合梯度下降的原理,利用以前学的Numpy和Python知识,实现梯度下降法求函数最小值的…...

Less和Sass的原理和用法

一、原理 1.1 Less定义:是一种动态的样式语言,使CSS变成一种动态的语言特性,如变量、继承、运算、函数。Less既可以在客户端上面运行(支持IE6以上版本、Webkit、Firefox),也可以在服务端运行(Node.js) 1.2 SaSS定义:是一种动态样式语言&#…...

c# List<T>.Aggregate

List<T>.Aggregate 方法的定义&#xff1a; public TAccumulate Aggregate<TAccumulate>(TAccumulate seed, Func<TAccumulate, T, TAccumulate> func)参数解析如下&#xff1a; TAccumulate seed&#xff1a;初始累积值&#xff0c;也是累积的起始值(默认…...

软件测试常用工具总结(测试管理、单元测试、接口测试、自动化测试、性能测试、负载测试等)

前言 在软件测试的过程中&#xff0c;多多少少都是会接触到一些测试工具&#xff0c;作为辅助测试用的&#xff0c;以提高测试工作的效率&#xff0c;使用好了测试工具&#xff0c;能对测试起到一个很好的作用&#xff0c;同时&#xff0c;有些公司&#xff0c;也会要求掌握一…...

Hadoop组件

前言 Hadoop 是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。 HDFS&#xff08;hadoop分布式文件系统&#xff09; 是hadoop体系中数据存储管理的基础。他是一个高度容错的系统&#xff0c;能检测和应对硬件故障。 Mapreduce&#xff08;分…...

jeecg-boot批量导入问题注意事项

现象&#xff1a; 由于批量导入数据速度很快&#xff0c; 因为数据库中的create time字段的时间可能一样&#xff0c;并且jeecg框架自带的是根据生成时间排序&#xff0c; 因此在前端翻页查询的时候&#xff0c;数据每次排序可能会不一样&#xff0c; 会出现第一页已经出现过一…...

Django图书商城系统实战开发 - 实现会员管理

Django图书商城系统实战开发 - 实现会员管理 在Django图书商城系统中&#xff0c;会员管理是一个重要的功能模块。该模块包括会员信息的展示、编辑和删除等功能。以下是实现会员管理功能的详细步骤和代码示例。 步骤一&#xff1a;设计数据库模型 首先&#xff0c;我们需要设…...

Kafka如何解决消息丢失的问题

在 Kafka 的整个架构中可以总结出消息有三次传递的过程&#xff1a; Producer 端发送消息给 Broker 端Broker 将消息进行并持久化数据Consumer 端从 Broker 将消息拉取并进行消费 在以上这三步中每一步都可能会出现丢失数据的情况&#xff0c; 那么 Kafka 到底在什么情况下才…...

我只记得512天在CSDN的日子

机缘 不知不觉开始写博客已经512天了&#xff0c;在这期间有过因为懒惰想要放弃&#xff0c;也有过写不出优质文章没有阅读量的气馁&#xff0c;也有过学习蛮久却不知道从何开始写起的迷茫&#xff0c;但是最终好在还是坚持了下来&#xff0c;无论好坏坚持总没有错。 写博客的…...

pycharm,VSCode 几个好用的插件

pycharm Tabnine AI Code 可以在编写程序的时候为你提供一些快捷方式&#xff0c;增加编程速度 Chinese 对英文不好的程序员来说是个不错的选择&#xff0c;可以将英文状态下的pycharm变为中文版的 ChatGPT 可以跟ai聊天&#xff0c;ai可以解决你80%的问题 &#xff0c;也可以帮…...

springboot 使用zookeeper实现分布式ID

添加ZooKeeper依赖&#xff1a;在pom.xml文件中添加ZooKeeper客户端的依赖项。例如&#xff0c;可以使用Apache Curator作为ZooKeeper客户端库&#xff1a; <dependency><groupId>org.apache.curator</groupId><artifactId>curator-framework</arti…...

git cherry-pick

cherry-pick命令的基本用法 对于多分支的代码库&#xff0c;将代码从一个分支转移到另一个分支是常见需求。这时分两种情况。一种情况是&#xff0c;你需要另一个分支的所有代码变动&#xff0c;那么就采用合并&#xff08; git merge &#xff09;。另一种情况是&#xff0c;…...

转行软件测试四个月学习,第一次面试经过分享

我是去年上半年从销售行业转行到测试的&#xff0c;从销售公司辞职之后选择去培训班培训软件测试&#xff0c;经历了四个月左右的培训&#xff0c;在培训班结课前两周就开始投简历了&#xff0c;在结课的时候顺利拿到了offer。在新的公司从事软件测试工作已经将近半年有余&…...

InfluxDB Studio:专业级时间序列数据库管理工具的终极指南

InfluxDB Studio&#xff1a;专业级时间序列数据库管理工具的终极指南 【免费下载链接】InfluxDBStudio InfluxDB Studio is a UI management tool for the InfluxDB time series database. 项目地址: https://gitcode.com/gh_mirrors/in/InfluxDBStudio 在当今数据驱动…...

华住房态检查表

...

电动汽车高压系统狭窄空间高精度电流电压测量方案解析

1. 项目概述&#xff1a;当高压测量遇上“螺蛳壳里做道场”在电动汽车的研发测试领域&#xff0c;尤其是实车道路测试阶段&#xff0c;有一个场景让很多工程师头疼不已&#xff1a;如何在发动机舱、底盘或电池包附近那些错综复杂、空间逼仄的线束通道里&#xff0c;精准地测量高…...

别再死记硬背了!用这5个HBase Shell实战场景,轻松搞定日常数据操作

HBase Shell实战手册&#xff1a;5个真实场景解锁高效数据操作 在数据爆炸式增长的时代&#xff0c;HBase作为分布式NoSQL数据库的佼佼者&#xff0c;凭借其高吞吐、低延迟的特性&#xff0c;成为处理海量结构化数据的首选方案。然而&#xff0c;许多开发者虽然掌握了基础命令&…...

CANN/Ascend C数学函数floorf

floorf 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言&#xff0c;原生支持C和C标准规范&#xff0c;主要由类库和语言扩展层构成&#xff0c;提供多层级API&#xff0c;满足多维场景算子开发诉求。 项目地址: https://gitcode.com/can…...

CANN/asc-devkit原子减法操作

asc_atomic_sub 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言&#xff0c;原生支持C和C标准规范&#xff0c;主要由类库和语言扩展层构成&#xff0c;提供多层级API&#xff0c;满足多维场景算子开发诉求。 项目地址: https://gitcode…...

磁性衬底导向的宽带超材料吸波体的吸波机理及设计方案【附代码】

✨ 长期致力于磁性材料、超材料吸波体、宽频带微波吸收、吸波机理、智能算法研究工作&#xff0c;擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流&#xff0c;点击《获取方式》 &#xff08;1&#xff09;对称模型分析多层反射干涉…...

UVM寄存器模型简化实践:提升芯片验证效率的封装与自动化方案

1. 项目概述&#xff1a;为什么我们需要简化UVM寄存器模型&#xff1f;如果你在芯片验证领域摸爬滚打过几年&#xff0c;尤其是深度参与过SoC或复杂IP的验证&#xff0c;那么对UVM寄存器模型&#xff08;UVM Register Model&#xff09;一定是又爱又恨。爱的是&#xff0c;它提…...

数科OFD阅读历史清理全攻略:统信UOS/麒麟KYLINOS下图形界面与命令行两种方法实测

数科OFD阅读历史清理全攻略&#xff1a;统信UOS/麒麟KYLINOS下图形界面与命令行两种方法实测 在国产化办公环境中&#xff0c;数科OFD作为主流的版式文档阅读工具&#xff0c;其使用痕迹管理常被忽视却至关重要。无论是个人用户希望保护阅读隐私&#xff0c;还是企业IT管理员需…...

香橙派Lite全解析:从硬件到应用,玩转ARM开发板与物联网项目

1. 香橙派Lite&#xff1a;一张能装进口袋的“万能主板”如果你对树莓派&#xff08;Raspberry Pi&#xff09;这类单板电脑有所耳闻&#xff0c;但又觉得它价格偏高或者想尝试更多选择&#xff0c;那么来自中国的香橙派&#xff08;Orange Pi&#xff09;系列绝对值得你深入了…...