主流信创数据库对向量功能的支持对比
主流信创数据库对向量功能的支持对比
- 版本支持对比
- 向量索引支持对比
- 距离函数支持对比
- 使用限制对比
- OceanBase向量数据库
- GaussDB向量数据库
- TiDB向量数据库
- VastBase向量数据库
⭐️ 本文章引用数据截止于2025年5月31日。
版本支持对比
数据库产品 | 支持向量功能的版本 |
---|---|
OceanBase | OceanBase数据库最早开始支持向量的版本是2024年3月发布的v4.3.0 版本。最新的支持版本是v4.3.5 BP2 。 |
GaussDB | GaussDB目前仅能确认2024年4月发布的v2.0-8.102 主备版支持向量功能。 |
TiDB | TiDB从2024年11月发布的v8.4.0 开始支持向量(实验特性)。最新的支持版本是v8.5.1 。 |
VastBase | 海量数据库从2025年1月发布的v3.0 Build 8 开始支持向量特性。最新的支持版本是v3.0 Build 8 (Patch No.1) 。 |
📖 目前国内主流信创数据库基本都是从2024年开始支持向量搜索功能的。而且对很多数据库产品来说目前都还是实验室特性,官方推荐的生产环境基线版本并不支持。例如OceanBase目前的基线版本是v4.2版本,而支持向量特性的最低版本是v4.3。
向量索引支持对比
数据库产品 | 支持的向量索引类型 |
---|---|
OceanBase | OceanBase最新版本(v4.3.5)支持HNSW索引、HNSW_SQ索引、HNSW_BQ索引、IVF索引。其中IVF索引为实验室特性。 |
GaussDB | GaussDB的v2.0-8.102 主备版支持IVF-Flat索引、DiskANN索引。 |
TiDB | TiDB最新版本(v8.5)仅支持HNSW索引。 |
VastBase | VastBase最新版本(v3.0.8)支持HNSW索引、IVF-Flat索引、IVF-PQ索引、DiskANN索引。 |
📖 目前国内主流信创数据库对向量索引类型支持最全面的是VastBase,支持种类最少的数据库产品是TiDB。几乎所有向量数据库都支持HNSW索引。
距离函数支持对比
数据库产品 | 支持的向量距离函数 |
---|---|
OceanBase | L2_distance(欧几里得距离)、L1_distance(曼哈顿距离)、Cosine_distance(余弦相似度)、Inner_product(点积)、Negative_inner_product(负内积)、Vector_distance |
GaussDB | L2_distance(欧几里得距离)、Cosine_distance(余弦相似度)、vector_spherical_distance(球面距离)、Inner_product(点积)、Negative_inner_product(负内积) |
TiDB | L2_distance(欧几里得距离)、L1_distance(曼哈顿距离)、Cosine_distance(余弦相似度)、Negative_inner_product(负内积) |
VastBase | L2_distance(欧几里得距离)、Cosine_distance(余弦相似度)、vector_spherical_distance(球面距离)、Inner_product(点积)、Negative_inner_product(负内积) |
📖 目前国内主流信创数据库基本都支持计算欧几里得距离、余弦相似度、内积和负内积。个别产品还支持计算曼哈顿距离和球面距离。
使用限制对比
OceanBase向量数据库
- OceanBase向量数据库目前仅MySQL租户模式支持向量检索,Oracle租户模式暂不支持。
- OceanBase向量数据库最高支持
16000
维的Float类型的稠密向量数据存储,同时也支持稀疏向量数据存储。 - OceanBase向量数据库中对超过
4096
维的向量建索引时,需要对数据做维度压缩,压缩到4096维以内之后再建索引。 - OceanBase向量数据库支持使用SQL和Python SDK两种协议方式进行向量检索。
- OceanBase向量数据库支持与OpenAI API、通义千问API、Langchain、LlamaIndex等主流AI框架集成。
GaussDB向量数据库
- 当前版本只支持单机部署,集中式部署;不支持分布式和小型化部署。
- 创建表维度不能超过
1024
,即维度范围在[1, 1024]
。 - 不支持创建分布表全局索引(gpi)。
- 向量索引不支持创建Unique索引。
- 向量索引不支持聚簇排序。
- 向量索引不支持创建多列索引。
- floatvector和boolvector不支持作为分区键。
- floatvector和boolvector不支持创建主键。
- floatvector和boolvector不支持创建Unique键。
- floatvector和boolvector不支持为NULL值。
- dblink暂不支持vector类型,因此也不支持向量索引创建。
- 向量索引不支持备机可读。
- 向量索引不支持增量构建,不支持在线创建。
- Floatvector和boolvector类型不支持创建除向量索引以外的索引(例如btree和ubtree)。
- 当前向量索引只支持距离TopK语句(按照距离升序排序),其他距离操作不进行索引。
- 索引构建时间较长,内存规格低的场景需要预留构建时间。
- 图索引空间膨胀率较大,磁盘规格低的场景无法创建成功。
- 向量检索是资源密集型操作,如果同时进行多个业务,会影响性能。
- 不支持unlogged、temp表构建向量索引。
- 使用ustore索引,相比于astore索引空间增长10%以内,检索时延增加5%。
- 索引依赖Vacuum进行空间回收,两次Vacuum之间如果存在频繁增删,向量检索会出现效率下降、空间膨胀的问题。
- 索引类型不支持统计信息,选择率估计使用默认值,有代价估计,但是目前只支持索引和顺序扫描进行选择。
TiDB向量数据库
- 集群需要提前部署TiFlash节点。
- 向量搜索索引不能作为主键或者唯一索引。
- 向量搜索索引只能基于单一的向量列创建,不能与其他列(如整数列或字符串列)组合形成复合索引。
- 创建和使用搜索向量索引时需要指定距离函数。目前只支持余弦距离函数
VEC_COSINE_DISTANCE()
和L2距离函数VEC_L2_DISTANCE()
。 - 不支持在同一列上创建多个使用了相同距离函数的向量搜索索引。
- 不支持直接删除具有向量搜索索引的列。可以通过先删除列上的向量搜索索引,再删除列的方式完成删除。
- 不支持修改带有向量索引的列的类型。
- 不支持将向量搜索索引设置为不可见。
- 不支持在开启了静态加密的TiFlash节点上构建向量搜索索引。
VastBase向量数据库
-
不允许建立超过
16000
个维度的向量字段。DiskANN索引支持在不超过2048
维度的字段上建立。其他向量索引仅支持在不超过2000
维度的字段上建立。 -
不支持以下向量运算符:
||
(拼接两个向量)*
(两个向量逐元素相乘)<+>
(计算两个向量之间的曼哈顿距离)
- 不支持以下向量比较符:
=
(用于判断两个向量的所有对应元素是否完全相等)>
(用于判断一个向量是否大于另一个向量)<
(用于判断一个向量是否小于另一个向量)>=
(用于判断一个向量是否大于等于另一个向量)<=
(用于判断一个向量是否小于等于另一个向量)<>
(用于判断两个向量是否不同)!=
(用于判断两个向量是否不同)BETWEEN
(判断向量是否在指定范围内)
- 除
count()
之外, 向量字段不支持其他聚合函数。 - 向量字段不支持
union
和col in(...)
语法。 - 向量字段不能用在
GROUP BY/ORDER BY
子句中。 - 向量字段不能作为主键或唯一性约束。
- 建立索引删除/更新大量数据后应先vaccum再重建索引。
- 匿名块绑定变量仅支持返回
text
类型,不支持返回驱动定义的PGvector
类型。 - IVF-PQ子查询受外层LIMIT子句影响,可能导致查询召回率下降。
- 索引返回元组数可能少于走全表扫描的数据或者LIMIT子句指定的数量。
- 向量标量混合查询,走索引查询返回的结果可能少于走全表扫描的结果。
Referecnes
【1】https://doc.hcs.huawei.com/zh-cn/gaussdb/doc/download/pdf/gaussdb-vector-cent.pdf
【2】https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000002012936
【3】https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000002046118
【4】https://docs.vastdata.com.cn/zh_CN/VastbaseG100/V3.0.8/1/5e3842f9085a4fd5b491f3203651ff7d
【5】https://docs.pingcap.com/zh/tidb/stable/release-8.4.0/
【6】https://docs.pingcap.com/zh/tidb/stable/vector-search-overview/
【7】https://docs.pingcap.com/zh/tidb/stable/vector-search-index/
相关文章:
主流信创数据库对向量功能的支持对比
主流信创数据库对向量功能的支持对比 版本支持对比向量索引支持对比距离函数支持对比使用限制对比OceanBase向量数据库GaussDB向量数据库TiDB向量数据库VastBase向量数据库 ⭐️ 本文章引用数据截止于2025年5月31日。 版本支持对比 数据库产品支持向量功能的版本OceanBaseOce…...
Matlab | matlab中的画图工具详解
二维图形到高级三维可视化 **一、基础二维绘图****二、三维可视化****三、图形修饰工具****四、高级功能****五、交互式工具****六、面向对象绘图(推荐)****七、常用技巧****学习资源**在MATLAB中,画图工具(绘图功能)是其核心优势之一,涵盖从基础二维图形到高级三维可视化…...

HA: Wordy靶场
HA: Wordy 来自 <HA: Wordy ~ VulnHub> 1,将两台虚拟机网络连接都改为NAT模式 2,攻击机上做namp局域网扫描发现靶机 nmap -sn 192.168.23.0/24 那么攻击机IP为192.168.23.128,靶场IP192.168.23.130 3,对靶机进行端口服务探…...
6.7本日总结
一、英语 复习默写list10list19,07年第3篇阅读 二、数学 学习线代第一讲,写15讲课后题 三、408 学习计组第二章,写计组习题 四、总结 本周结束线代第一讲和计组第二章,之后学习计网4.4,学完计网4.4之后开操作系…...

中国移动6周年!
基站超过250万个 网络规模全球最大、质量最优 覆盖全国96%人口 在全国率先实现乡乡双千兆 服务用户超5.7亿 网络上下行均值接入速率均居行业首位 行业应用快速推广,数量超5万个 3CC、RedCap、通感一体、 无线AI改造等技术成熟商用 客户品牌持续升级&#x…...
Svelte 核心语法详解:Vue/React 开发者如何快速上手?
在很多地方早就听到过svelte的大名了,不少工具都有针对svelte的配置插件,比如vite \ unocss \ svelte. 虽然还没使用过,但是发现它的star82.9k数很高哦,学习一下它与众不同的魔法。 这名字有点别扭,好几次都写错。 sve…...
Fullstack 面试复习笔记:HTML / CSS 基础梳理
Fullstack 面试复习笔记:HTML / CSS 基础梳理 之前的笔记: Fullstack 面试复习笔记:操作系统 / 网络 / HTTP / 设计模式梳理Fullstack 面试复习笔记:Java 基础语法 / 核心特性体系化总结Fullstack 面试复习笔记:项目…...

408第一季 - 数据结构 - 树与二叉树II
二叉树的先中后序遍历 理解 那主播,请问你有没有更快的遍历方式呢 有的,兄弟有的 以中序遍历为例啊 找左边有没有东西,左边没东西那它就自由了,就按上面的图举例子 A左边有东西,是B,B左边没东西…...
打卡第47天
作业:对比不同卷积层热图可视化的结果 核心差异总结 浅层卷积层(如第 1-3 层) 关注细节:聚焦输入图像的边缘、纹理、颜色块等基础特征(例:猫脸的胡须边缘、树叶的脉络)。热图特点:区…...

从上下文学习和微调看语言模型的泛化:一项对照研究
大型语言模型表现出令人兴奋的能力,但也可以从微调中表现出令人惊讶的狭窄泛化。例如,他们可能无法概括为简单的关系反转,或者无法根据训练信息进行简单的逻辑推理。这些未能从微调中概括出来的失败可能会阻碍这些模型的实际应用。另一方面&a…...

智慧城市建设方案
第1章 总体说明 1.1 建设背景 1.2 建设目标 1.3 项目建设主要内容 1.4 设计原则 第2章 对项目的理解 2.1 现状分析 2.2 业务需求分析 2.3 功能需求分析 第3章 大数据平台建设方案 3.1 大数据平台总体设计 3.2 大数据平台功能设计 3.3 平台应用 第4章 政策标准保障…...
phosphobot开源程序是控制您的 SO-100 和 SO-101 机器人并训练 VLA AI 机器人开源模型
一、软件介绍 文末提供程序和源码下载 phosphobot开源程序是控制您的 SO-100 和 SO-101 机器人并训练 VLA AI 机器人开源模型。 二、Overview 概述 🕹️ Control your robot with the keyboard, a leader arm, a Meta Quest headset or via API 🕹️…...

pygame开发的坦克大战
使用Python和Pygame开发的精美坦克大战游戏。这个游戏包含玩家控制的坦克、敌方坦克、各种障碍物、爆炸效果和完整的游戏机制。 游戏说明 这个坦克大战游戏包含以下功能: 游戏特点 玩家控制:使用方向键移动坦克,空格键射击 敌人AI&#x…...
C++2025.6.7 C++五级考题
城市商业街主干道是一条笔直的道路,商业街里有 n 家店铺,现给定 n 个店铺的位置,请在这条道路上找到一个中心点,使得所有店铺到这个中心点的距离之和最小,并输出这个最小值。 #include <bits/stdc.h> using nam…...
【原神 × 二叉树】角色天赋树、任务分支和圣遗物强化路径的算法秘密!
【原神 二叉树】角色天赋树、任务分支和圣遗物强化路径的算法秘密! 作者:星之辰 标签:#原神 #二叉树 #天赋树 #任务分支 #圣遗物强化 #算法科普 发布时间:2025年6月 总字数:6000+ 一、引子:提瓦特大陆的“树型奥秘” 你是否曾留意过《原神》角色面板的天赋树? 升级技能…...

功能安全实战系列09-英飞凌TC3xx LBIST开发详解
本文框架 0. 前言1.What?1.1 基本原理1.1.1 检测范围1.1.2 LBIST与锁步核对比1.1.3 控制寄存器1.2 关联Alarm2. How?2.1 LBIST触发?2.1.1 SSW配置自动触发2.1.2 软件手动触发LBIST2.2 实现策略2.3 测试篇LBIST对启动时间的影响如何确定当前LBIST是否已使能?如何确定当前LBI…...

一个完整的日志收集方案:Elasticsearch + Logstash + Kibana+Filebeat (二)
📄 本地 Windows 部署 Logstash 连接本地 Elasticsearch 指南 ✅ 目标 在本地 Windows 上安装并运行 Logstash配置 Logstash 将数据发送至本地 Elasticsearch测试数据采集与 ES 存储流程 🧰 前提条件 软件版本要求安装说明Java17Oracle JDK 下载 或 O…...

RT-Thread内核组成——内核移植
内核移植就是指将 RT-Thread 内核在不同的芯片架构、不同的板卡上运行起来,能够具备线程管理和调度,内存管理,线程间同步和通信、定时器管理等功能。移植可分为 CPU 架构移植和 BSP(Board support package,板级支持包&…...
Docker_Desktop开启k8s
Docker_Desktop开启k8s 原文地址:在 Docker Desktop 中启用 K8s 服务 - 墨墨墨墨小宇 - 博客园 开启k8s服务 打开docker的设置界面,选择Docker Engine,修改如下: {"debug": false,"experimental": false,…...
MS2691 全频段、多模导航、射频低噪声放大器芯片,应用于导航仪 双频测量仪
MS2691 全频段、多模导航、射频低噪声放大器芯片,应用于导航仪 双频测量仪 产品简述 MS2691 是一款具有 1164MHz 1615MHz 全频段、低功耗的低噪声放大器芯片。该芯片通过对外围电路的简单配置,使得频带具有宽带或窄带特性。支持不同频段的各种导…...

基于Java(SpringBoot、Mybatis、SpringMvc)+MySQL实现(Web)小二结账系统
结账系统 1.引言 1.1.编写目的 此说明书在概要设计的基础上,对小二结账系统的各个模块、程序分别进行了实现层面上的要求和说明。在以下的详细设计报告中将对在本阶段中对系统所做的所有详细设计进行说明。在本阶段中,确定应该如何具体的实现所要求的…...
Java泛型中的通配符详解
无界通配符 通配符的必要性 通过WrapperUtil类的示例可以清晰展示通配符的使用场景。假设我们需要为Wrapper类创建一个工具类WrapperUtil,其中包含一个静态方法printDetails(),该方法需要处理任意类型的Wrapper对象。最初的实现尝试如下: …...
Java方法引用深度解析:从匿名内部类到函数式编程的演进
文章目录 前言问题场景第一种:传统的匿名内部类技术解析优缺点分析 第二种:Lambda表达式的革命技术解析Lambda表达式的本质性能优势 第三种:方法引用的极致简洁技术解析 方法引用的四种类型1. 静态方法引用2. 实例方法引用3. 特定类型的任意对…...

三维GIS开发cesium智慧地铁教程(4)城市白模加载与样式控制
一、添加3D瓦片 <!-- 核心依赖引入 --> <script src"../cesium1.99/Build/Cesium/Cesium.js"></script> <link rel"stylesheet" href"../cesium1.99/Build/Cesium/Widgets/widgets.css"><!-- 模型数据路径 --> u…...

越狱蒸馏-可再生安全基准测试
大家读完觉得有帮助记得关注!!! 摘要 大型语言模型(LLMs)正迅速部署在关键应用中,这引发了对稳健安全基准测试的迫切需求。我们提出了越狱提炼(JBDISTILL),这是一种新颖…...

64、js 中require和import有何区别?
在 JavaScript 中,require 和 import 都是用于模块导入的语法,但它们属于不同的模块系统,具有显著的区别: 1. 模块系统不同 require 属于 CommonJS 模块系统(Node.js 默认使用)。 语法:const…...

手机号段数据库与网络安全应用
手机号段数据库的构成与原理 手机号段数据库存储着海量手机号段及其关联信息,包括号段起始与结束号码、运营商归属、地区编码、卡类型等核心数据。这些数据主要来源于通信管理机构的官方分配信息、运营商的业务更新数据以及合法采集的使用数据。经过数据清洗、校验…...

Kafka 入门指南与一键部署
Kafka 介绍 想象一下你正在运营一个大型电商平台,每秒都有成千上万的用户浏览商品、下单、支付,同时后台系统还在记录用户行为、更新库存、处理物流信息。这些海量、持续产生的数据就像奔腾不息的河流,你需要一个强大、可靠且实时的系统来接…...
MATLAB实战:视觉伺服控制实现方案
以下是一个基于MATLAB的视觉伺服控制项目实现方案,结合实时图像处理、目标跟踪和控制系统设计。我们将使用模拟环境进行演示,但代码结构可直接应用于真实硬件。 系统架构 图像采集 → 目标检测 → 误差计算 → PID控制器 → 执行器控制 完整代码实现 …...

Oracle正则表达式学习
目录 一、正则表达简介 二、REGEXP_LIKE(x,匹配项) 三、REGEXP_INSTR 四、REGEXP_SUBSTR 五、REGEXP_REPLACE 一、正则表达简介 相关网址: https://cloud.tencent.com/developer/article/1456428 https://www.cnblogs.com/lxl57610/p/8227599.html https://…...