当前位置：首页 > news >正文

Elasticsearch：dense vector 数据类型及标量量化

news 2026/4/14 20:45:23

密集向量（dense_vector）字段类型存储数值的密集向量。密集向量场主要用于 k 最近邻 (kNN) 搜索。

dense_vector 类型不支持聚合或排序。

默认情况下，你可以基于 element_type 添加一个 dend_vector 字段作为 float 数值数组：

PUT my-index
{"mappings": {"properties": {"my_vector": {"type": "dense_vector","dims": 3},"my_text" : {"type" : "keyword"}}}
}PUT my-index/_doc/1
{"my_text" : "text1","my_vector" : [0.5, 10, 6]
}PUT my-index/_doc/2
{"my_text" : "text2","my_vector" : [-0.5, 10, 10]
}

注意：与大多数其他数据类型不同，密集向量始终是单值。不可能在一个密集向量字段中存储多个值。

kNN 搜索的索引向量

k 最近邻 (kNN) 搜索可找到与查询向量最接近的 k 个向量（通过相似性度量来衡量）。

密集向量字段可用于对 script_score 查询中的文档进行排名。这使你可以通过扫描所有文档并按相似度对它们进行排名来执行强力（brute-force） kNN 搜索。

在许多情况下，强力 kNN 搜索效率不够高。因此，dense_vector 类型支持将向量索引到专门的数据结构中，以支持通过 search API 中的 knn 选项进行快速 kNN 检索。

大小在 128 到 4096 之间的浮点元素的未映射数组字段动态映射为具有默认余弦相似度的密集向量。你可以通过将字段显式映射为具有所需 similarity 的 dend_vector 来覆盖默认 similarity。

默认情况下为密集向量场启用索引。启用索引后，你可以定义在 kNN 搜索中使用的向量 similarity：

PUT my-index-2
{"mappings": {"properties": {"my_vector": {"type": "dense_vector","dims": 3,"similarity": "dot_product"}}}
}

注意：用于近似 kNN 搜索的索引向量是一个昂贵的过程。提取包含启用了 index 的向量字段的文档可能需要花费大量时间。请参阅 k 最近邻 (kNN) 搜索以了解有关内存要求的更多信息。

你可以通过将 index 参数设置为 false 来禁用索引：

PUT my-index-2
{"mappings": {"properties": {"my_vector": {"type": "dense_vector","dims": 3,"index": false}}}
}

Elasticsearch 使用 HNSW 算法来支持高效的 kNN 搜索。与大多数 kNN 算法一样，HNSW 是一种近似方法，会牺牲结果精度以提高速度。

自动量化向量以进行 kNN 搜索

密集向量类型支持量化以减少搜索浮点向量时所需的内存占用。目前唯一支持的量化方法是 int8，并且提供的向量 element_type 必须是 float。要使用量化索引，你可以将索引类型设置为 int8_hnsw。

使用 int8_hnsw 索引时，每个浮点向量的维度都会量化为 1 字节整数。这可以减少多达 75% 的内存占用，但会牺牲一定的准确性。然而，由于存储量化向量和原始向量的开销，磁盘使用量可能会增加 25%。

PUT my-byte-quantized-index
{"mappings": {"properties": {"my_vector": {"type": "dense_vector","dims": 3,"index": true,"index_options": {"type": "int8_hnsw"}}}}
}

密集向量场的参数

接受以下映射参数：

element_type
（可选，字符串）用于对向量进行编码的数据类型。支持的数据类型为 float（默认）和 byte。 float 对每个维度的 4 字节浮点值进行索引。 byte 索引每个维度的 1-byte 整数值。使用 byte 可以显着减小索引大小，但代价是精度较低。使用字节的向量需要具有 -128 到 127 之间整数值的维度，包括索引和搜索。

dims
（可选，整数）向量维数。不能超过 4096。如果未指定 dims，它将设置为添加到该字段的第一个向量的长度。

index
（可选，布尔值）如果为 true，你可以使用 kNN 搜索 API 搜索此字段。默认为 true。

similarity
（可选*，字符串）kNN 搜索中使用的向量相似度度量。文档根据向量场与查询向量的相似度进行排名。每个文档的 _score 将从相似度中得出，以确保分数为正并且分数越高对应于越高的排名。默认为余弦。

* 该参数只有当 index 为 true 时才能指定。

有效的 similarity 值
值	描述
l2_norm	根据向量之间的 L2 距离（也称为欧氏距离）计算相似度。文档 _score 的计算公式为 1 / (1 + l2_norm(query, vector)^2)。
dot_product	计算两个单位向量的点积。此选项提供了执行余弦相似度的优化方法。约定和计算得分由 element_type 定义。当 element_type 为 float 时，所有向量都必须是 unit 长度，包括文档向量和查询向量。文档 _score 的计算方式为 (1 + dot_product(query, vector)) / 2。当 element_type 为 byte 时，所有向量必须具有相同的长度，包括文档向量和查询向量，否则结果将不准确。文档 _score 的计算公式为 0.5 + (dot_product(query, vector) / (32768 * dims))，其中 dims 是每个向量的维度数。
cosine	计算余弦相似度。请注意，执行余弦相似度的最有效方法是将所有向量标准化为单位长度，并改为使用 dot_product。仅当需要保留原始向量且无法提前对其进行标准化时，才应使用余弦。文档 _score 的计算方式为 (1 + cosine(query, vector)) / 2。余弦相似度不允许向量的幅值为零，因为在这种情况下未定义余弦。
max_inner_product	计算两个向量的最大内积。这与 dot_product 类似，但不需要向量标准化。这意味着每个向量的大小都会显着影响分数。调整文档 _score 以防止出现负值。对于 max_inner_product 值 < 0，_score 为 1 / (1 + -1 * max_inner_product(query, vector))。对于非负 max_inner_product 结果，_score 计算为 max_inner_product(query, vector) + 1。

注意：尽管它们在概念上相关，但相似性参数与文本字段相似性不同，并且接受一组不同的选项。

index_options

（可选*，对象）配置 kNN 索引算法的可选部分。 HNSW 算法有两个影响数据结构构建方式的内部参数。可以调整这些以提高结果的准确性，但代价是索引速度较慢。

* 该参数只有当 index 为 true 时才能指定。

index_options 的属性
属性	描述
type	（必需，字符串）要使用的 kNN 算法的类型。可以是 hnsw 或 int8_hnsw。
m	（可选，整数）HNSW 图中每个节点将连接到的邻居数量。默认为 16。
ef_construction	（可选，整数）在组装每个新节点的最近邻居列表时要跟踪的候选者数量。默认为 100。
confidence_interval	（可选，float）仅适用于 int8_hnsw 索引类型。量化向量时使用的置信区间可以是 0.90 和 1.0 之间（包括 0.90 和 1.0）之间的任何值。该值限制计算量化阈值时使用的值。例如，值 0.95 在计算量化阈值时将仅使用中间 95% 的值（例如，最高和最低 2.5% 的值将被忽略）。默认为 1/(dims + 1)。

Synthetic `_source`

重要：Synthetic _source 通常仅适用于 TSDB 索引（index.mode 设置为 time_series 的索引）。对于其他索引，synthetic _source 处于技术预览阶段。技术预览版中的功能可能会在未来版本中更改或删除。 Elastic 将努力解决任何问题，但技术预览版中的功能不受官方 GA 功能的支持 SLA 的约束。

dense_vector 字段支持 synthetic _source。

更多阅读：

Elasticsearch：标量量化 101 - scalar quantization 101
Elasticsearch：Lucene 中引入标量量化

Elasticsearch：dense vector 数据类型及标量量化

kNN 搜索的索引向量

自动量化向量以进行 kNN 搜索

密集向量场的参数

Synthetic `_source`

相关文章：

Elasticsearch：dense vector 数据类型及标量量化

Linux C/C++下使用Lex/Yacc构建实现DBMS（Minisql）

c语言指针小白基础教学

面向对象设计之里氏替换原则

MySQL·SQL优化

Dockerfile指令大全

第八个实验：(A+B)-C的结果判断奇偶特性

设计模式：观察者模式 ⑧

【重温设计模式】迭代器模式及其Java示例

（001）UV 的使用以及导出

一文理解CAS和自旋的区别(荣耀典藏版)

【吊打面试官系列】Java虚拟机JVM篇 - 关于内存溢出

思科网络中如何配置标准ACL协议

蓝桥杯刷题（二）

【Python】牛客网—软件开发-Python专项练习（day1）

P3405 [USACO16DEC] Cities and States S题解

JavaScript原型和原型链

PyTorch之完整的神经网络模型训练

基于神经网络的偏微分方程求解器再度取得突破,北大字节的研究成果入选Nature子刊

Linux的基本权限

3步解锁LOL全皮肤体验：R3nzSkin国服特供版完全指南

社区生活服务升级，Java 家政系统源码提升服务效率

2026年AI风口已来！小白程序员必备：收藏这份大模型学习路线，轻松解锁职业新可能！

FUTURE POLICE语音模型Ubuntu 20.04部署全流程详解

【完整源码+数据集+部署教程】交通锥检测检测系统源码 [一条龙教学YOLOV8标注好的数据集一键训练_70+全套改进创新点发刊_Web前端展示]

AutoRunner365自动化测试工具保姆级安装指南（附注册流程详解）

【Gin】参数处理练习题

Endnote样式深度定制：从GBT-7142005基础版到完美适配你学校论文格式的完整指南

Qwen3-VL-8B教育应用：为视障学生实时解说教材插图，打开视觉之窗

告别姿态依赖：基于DUSt3R与规范空间的高斯重建新范式