当前位置：首页 > news >正文

ES 操作

news 2026/5/18 7:36:51

1、删除索引的所有记录

curl -X POST "localhost:9200/<index-name>/_delete_by_query" -H 'Content-Type: application/json' -d'
{"query": {"match_all": {}}
}
'

POST /content_erp_nlp_help/_delete_by_query
{

"query": {

"match_all": {}

}

2、创建索引模板

PUT _template/content_erp_nlp_help
{
"index_patterns": [
"content_vector*"
],
"settings": {
"analysis": {
"analyzer": {
"my_ik_analyzer": {
"type": "ik_smart"
}
}
},
"number_of_shards": 1
},
"mappings": {
"properties": {
"id": {
"type": "long"
},
"content": {
"type": "text",
"analyzer": "ik_max_word",
"search_analyzer": "ik_smart"
},
"content_vector": {
"type": "dense_vector",
"similarity": "cosine",
"index": true,
"dims": 768,
"element_type": "float",
"index_options": {
"type": "hnsw",
"m": 16,
"ef_construction": 128
}
},
"content_answer": {
"type": "text",
"analyzer": "ik_max_word",
"search_analyzer": "ik_smart"
},
"title": {
"type": "text",
"analyzer": "ik_max_word",
"search_analyzer": "ik_smart"
},
"param": {
"type": "text",
"analyzer": "ik_max_word",
"search_analyzer": "ik_smart"
},
"type": {
"type": "text",
"analyzer": "ik_max_word",
"search_analyzer": "ik_smart"
}
}
}
}

使用must还是should在布尔查询中取决于你的具体需求和期望的查询行为。

使用 `must`

当你使用must时，所有包含在must列表中的子查询都必须匹配。这意味着，为了使文档成为搜索结果的一部分，文档必须同时满足所有must查询的条件。如果你的意图是找到同时与文本查询和KNN向量查询匹配的文档，那么使用must是合适的。这通常用于要求严格的匹配场景，比如需要文档同时具有特定的文本特征和与某向量相近。

使用 `should`

相比之下，should表示查询中的任意子查询匹配即可。如果至少有一个should子查询匹配，那么文档就会被视为匹配。这提供了更大的灵活性，意味着即使文档只满足文本查询或KNN查询中的一个，它也可能出现在结果中。这对于希望扩大搜索范围，或者允许部分条件匹配的情况非常有用。

效果比较

精确性 vs. 宽泛性: must查询倾向于提供更精确的结果集，因为所有条件都必须满足。而should查询可能产生更宽泛的结果，因为它允许部分条件匹配。
性能影响: 在某些情况下，使用should可能会导致更多的文档被扫描和评估，从而可能略微降低查询性能。这是因为Elasticsearch需要检查每个should子查询是否匹配。

混合使用 `must` 和 `should`

在很多情况下，混合使用must和should可以达到最佳的效果。例如，你可以定义一些硬性条件作为must，确保结果至少满足这些核心需求，同时使用should来增加结果的丰富度和多样性，如：

Java

1BoolQuery boolQuery = new BoolQuery.Builder()
2                .must(matchQuery) // 必须满足的文本匹配
3                .should(knnQuery) // 可以满足的向量相似性
4                .build();

在这个例子中，所有结果必须与文本查询匹配，但如果文档还与KNN查询匹配，则会获得更高的相关性评分，从而可能在结果中排名更高。

总结

选择使用must还是should主要取决于你的业务逻辑和你对查询结果的期望。如果你需要严格的匹配条件，使用must；如果你希望结果更加宽泛和多样化，使用should；如果你需要两者之间的平衡，考虑混合使用两者。

ES 操作

使用 `must`

使用 `should`

效果比较

混合使用 `must` 和 `should`

总结

相关文章：

ES 操作

uniapp如何实现跳转

Stable-Diffusion-WebUI 常用提示词插件

单片机 PWM输入捕获【学习记录】

3.1、前端异步编程（超详细手写实现Promise；实现all、race、allSettled、any；async/await的使用）

3.1. 马氏链-马氏链的定义和示例

红利之外的A股底仓选择：A50

wondershaper 一款限制 linux 服务器网卡级别的带宽工具

独孤思维：盲目进群，根本赚不到钱

针对indexedDB的简易封装

网络编程--网络理论基础（二）

Python MongoDB 基本操作

Node.js 入门：

java8 List的Stream流操作 (实用篇三)

机器学习python实践——数据“相关性“的一些补充性个人思考

MySQL——触发器（trigger）基本结构

数字孪生定义及应用介绍

数据赋能（122）——体系：数据清洗——技术方法、主要工具

【SCAU数据挖掘】数据挖掘期末总复习题库简答题及解析——中

2024年注册安全工程师报名常见问题汇总！

Boss直聘职位数据自动化采集：Python爬虫架构设计与工程实践

【ElevenLabs情绪模拟技术白皮书】：基于2,147小时情感语音标注数据集的11类基础情绪迁移模型验证报告

Midjourney湿版摄影风格实战手册（从胶片化学原理到Prompt工程）：含12组经大英博物馆湿版藏品验证的Reference Prompt库

树莓派扩展板EYESPI Pi Beret：简化硬件连接，加速原型开发

Oracle数据库触发器概述

016、Git版本控制与协作开发流程

开源婚礼技能库：用项目管理思维破解备婚焦虑，打造个性化高性价比婚礼

Linux磁盘挂载与开机自启配置

Cortex-A78C架构解析：AMU与ETM寄存器实战指南

基于Rust的网页正文提取工具web-reader：从原理到自动化实践

使用 must

使用 should

效果比较

混合使用 must 和 should

总结

相关文章：

使用 `must`

使用 `should`

混合使用 `must` 和 `should`