从底层原理上解释 ClickHouse 的索引
ClickHouse 是一款高性能的列式数据库,它通过列式存储、稀疏索引、MergeTree 引擎等技术实现了极高的查询效率和吞吐量。索引是数据库中提高查询效率的关键机制之一。为了深入了解 ClickHouse 中的索引实现机制,我们将从底层原理、关键数据结构以及 ClickHouse 的源代码来解释其索引设计。
1. ClickHouse 的索引机制概览
ClickHouse 的索引与传统数据库(如 MySQL、PostgreSQL 等)的 B-Tree 或哈希索引不同,它主要依赖于稀疏索引(sparse index)和分段索引(granularity index)来加速查询。由于 ClickHouse 的设计初衷是为大规模分析型查询场景服务,所以它的索引机制更适合扫描大批量数据,并通过减少不必要的磁盘 IO 来加速查询。
1.1 基础概念
- 列式存储:ClickHouse 使用列式存储,也就是说数据按列而不是按行存储。在列式存储中,相同列的数据集中存储,使得读取少数列时非常高效。
- 稀疏索引(Sparse Index):ClickHouse 使用的是一种稀疏索引,意味着它不会为每条记录都维护索引,而是根据数据块(block)来构建索引。每个数据块保存若干行(通常是 8192 行),索引只保存每个块的起始值。
- 数据分段(Granularity):ClickHouse 采用了分段的概念,数据被分割成多个段,每个段内数据排序,并且有自己的索引。每个段的大小决定了查询时需要扫描的数据量。
2. MergeTree 引擎中的索引机制
MergeTree
是 ClickHouse 中最重要的存储引擎之一。该引擎不仅支持高效的读写性能,还支持自动的分区和合并操作。
2.1 主键索引(Primary Key Index)
在 MergeTree
表中,主键索引并不是传统意义上的唯一约束,而是用于优化查询的排序键。主键的索引由 稀疏索引 和 段内数据排序 组成。当表使用 ORDER BY
语句时,ClickHouse 会根据排序键为每个数据段构建稀疏索引。
- 原理:
- 数据写入时按照主键排序(如果指定了
ORDER BY
),每次插入新的数据块时,ClickHouse 会在磁盘上生成新的稀疏索引。 - 每个稀疏索引条目对应一个数据块中的首行,索引条目记录该块的首个主键值以及其在数据文件中的位置。
- 查询时,ClickHouse 使用索引跳过不相关的块,减少扫描的数据量。
- 数据写入时按照主键排序(如果指定了
2.2 索引的存储结构
主键索引会被存储在 .idx
文件中,索引文件以稀疏的方式记录每个数据块的起始位置。
- 索引存储结构:
- 数据写入时,ClickHouse 为每个数据块生成主键索引。每个索引条目包含该块内数据的首个主键值以及相应的偏移量。
- 主键值可以由多个列组成,ClickHouse 会为多列组合生成复合主键索引。
示例:创建 MergeTree 表
CREATE TABLE events
(event_date Date,event_time DateTime,user_id UInt32,event_type String
)
ENGINE = MergeTree
ORDER BY (event_date, user_id);
在上面的例子中,ORDER BY (event_date, user_id)
表示 ClickHouse 会对表中的数据根据 event_date
和 user_id
进行排序,并为这些列创建主键索引。在查询时,ClickHouse 会利用这些主键索引来加速查询。
2.3 段式存储与索引
ClickHouse 将数据分为多个段(part),每个段包含一定数量的行(默认 8192 行)。每个段内的数据按照指定的排序键(即 ORDER BY
中的列)进行排序,并为每个段创建稀疏索引。
- 每个段的索引结构:
- 索引文件(.idx):稀疏索引,记录每个数据段中首行的主键值。
- 数据文件(.bin):实际存储的列数据,列式存储的文件按列分开存储。
索引文件的结构:
.index file structure:
+--------------------+------------------+----------------+
| Primary Key Value | Block Start Row | Block Position |
+--------------------+------------------+----------------+
当执行查询时,ClickHouse 通过索引文件定位数据块,然后只扫描与查询条件相关的块,从而极大地提升查询效率。
3. ClickHouse 的二级索引(Data Skipping Indexes)
除了主键索引,ClickHouse 还支持 Data Skipping Index,也就是所谓的“跳过索引”。这种索引允许 ClickHouse 在查询时跳过那些不相关的块,而不需要扫描每一行。这在列上具有高度稀疏性或数据分布不均匀的场景下非常有用。
常用的跳过索引类型:
-
minmax 索引:记录每个数据段的最小值和最大值。对于范围查询,例如
WHERE column > x AND column < y
,ClickHouse 可以跳过不在范围内的块。ALTER TABLE events ADD INDEX minmax_index (user_id) TYPE minmax GRANULARITY 8192;
-
bloom_filter 索引:用于高基数的数据列,例如字符串或 ID 字段。布隆过滤器可以快速过滤掉不可能匹配的数据块。
ALTER TABLE events ADD INDEX bloom_filter_index (event_type) TYPE bloom_filter GRANULARITY 8192;
-
tokenbf_v1 索引:一种适用于包含大量词汇的字段(如文本)的布隆过滤器索引,它能够对包含某个词的查询进行加速。
ALTER TABLE events ADD INDEX tokenbf_index (event_type) TYPE tokenbf_v1(1000) GRANULARITY 8192;
跳过索引的实现原理
当进行查询时,ClickHouse 会首先检查跳过索引,确定哪些数据块可以跳过,而不需要进行全表扫描。例如,在范围查询中,ClickHouse 可以通过 minmax
索引检查每个数据块的最小值和最大值,并直接跳过不满足条件的块。
4. ClickHouse 索引的底层代码分析
我们来看一下 ClickHouse 源代码中关于索引的部分,尤其是稀疏索引和数据跳过索引的实现。
4.1 稀疏索引实现
稀疏索引的实现位于 MergeTreeData
类中,它管理了 MergeTree 表中的数据结构和索引创建过程。稀疏索引的构建逻辑主要通过 MergeTreeIndexGranularity
类来实现。
在 MergeTreeDataWriter
类中,数据块的写入和索引创建的关键代码如下:
// MergeTreeDataWriter.cpp
void MergeTreeDataWriter::writeBlock(const Block & block, ... )
{// 写入数据块writer.write(block);// 构建稀疏索引index_builder->add(block);
}
在写入数据块时,index_builder
会为每个数据块生成一个索引条目。索引条目中包含了该数据块的起始主键值和数据文件中的位置。
4.2 minmax 索引的实现
minmax
索引是一种非常简单的跳过索引,它记录了每个数据块的最小值和最大值。在查询时,ClickHouse 可以通过检查 minmax
索引来跳过不符合条件的块。
minmax
索引的创建和检查逻辑位于 MergeTreeDataPart
类中,代码如下:
// MergeTreeDataPart.cpp
bool MergeTreeDataPart::minmax_index_check(const Field & value) const
{// 检查当前块的最小值和最大值return (value >= min_value && value <= max_value);
}
在查询执行时,ClickHouse 会检查 minmax
索引,跳过那些不在查询范围内的块。
5. 总结
ClickHouse 的索引机制主要依赖于 稀疏索引 和 跳过索引,这些索引能够大幅减少查询时的数据扫描量。不同于传统数据库的行式存储索引,ClickHouse 的索引设计更加适合批量分析场景,利用稀疏索引减少 IO,通过跳过索引加速查询。底层实现中,MergeTree
系列存储引擎通过维护稀疏索引来定位数据块,同时 minmax
和 bloom_filter
等跳过索引进一步优化查询性能。
通过这些索引机制,ClickHouse 能够在大规模数据处理场景下保持极高的查询性能,同时支持复杂的查询和分析操作。
相关文章:
从底层原理上解释 ClickHouse 的索引
ClickHouse 是一款高性能的列式数据库,它通过列式存储、稀疏索引、MergeTree 引擎等技术实现了极高的查询效率和吞吐量。索引是数据库中提高查询效率的关键机制之一。为了深入了解 ClickHouse 中的索引实现机制,我们将从底层原理、关键数据结构以及 Clic…...
9.20-使用k8s部署wordpress项目
部署wordpress项目 部署mariadb # 启动docker进程systemctl start docker# 拉取三个镜像docker pull nginx:alpinedocker pull wordpress:latestdocker pull mariadb:latest# 保存三个镜像cddocker save -o wordpress.tar wordpress:latestdocker save -o mariadb.tar…...

OSPFv3协议几类LSA介绍
OSPFv3协议介绍 与OSPFv2相比,OSPFv3在工作机制上与OSPFv2基本相同;但为了支持IPv6地址格式,OSPFv3对OSPFv2做了一些改动。OSPFv3基于OSPFv2基本原理增强,是一个独立的路由协议(v3不兼容v2)协议号仍然是89…...

煤矿智慧矿井数据集 (1.煤矿采掘工作面智能分析数据集2.煤矿井下钻场智能分析数据集 )
智慧矿井智能分析数据集 数据1:数据1包含煤矿采掘工作面工人安全帽检测,工人行为检测(行走,站立,坐,操作,弯腰,靠,摔,爬),液压支撑防护…...
举例说明协方差的数学公式计算步骤以及皮尔逊相关系数数学公式的计算步骤
例子:协方差的计算步骤 协方差是用于衡量两个随机变量之间的线性相关性的统计量。它表示两个变量如何一起变化。如果协方差为正,表示两个变量倾向于同方向变化;如果为负,表示它们倾向于反方向变化。 下面我们将通过一个具体的例…...
2024/9/16论文赏析(均为1区或顶刊
Labeled-to-Unlabeled Distribution Alignment for Partially-Supervised Multi-Organ Medical Image Segmentation 代码链接:GitHub - xjiangmed/LTUDA 论文链接:Labeled-to-Unlabeled Distribution Alignment for Partially-Supervised Multi-Organ …...

IDEA 2024.3 EAP新特征早览!
0 前言 IntelliJ IDEA 2024.3 第一个 EAP 版本已发布,提前体验 下一个重大版本的一部分改进。 持续关注 EAP 更新,未来几周内将推出更多 IntelliJ IDEA 新功能。尝试这些新功能,分享您的反馈,共同完善 IDE。 1 AI 助手 1.1 内…...
如何在安卓設備上更換IP地址?
IP地址是設備在網路中的唯一標識,通過IP地址,網路能夠識別並與設備進行通信。本文將詳細介紹在安卓設備上更換IP地址的幾種方法。 在安卓設備上更換IP地址的方法 1. 使用Wi-Fi網路更換IP地址 最簡單的方法是通過Wi-Fi網路更換IP地址。步驟如下&#x…...

LINUX网络编程:TCP(1)
目录 1.认识Tcp的报头 2.确认应答机制(ACK) 序号与确认序号 捎带应答 3.超时重传机制 4.Tcp连接管理 三次握手 为什是三次握手 四次挥手 理解TIMEWAIT 1.认识Tcp的报头 源端口和目的端口号没什么说的 32位的序号和确认序号,之后会介…...

基于PHP的新闻管理系统
作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、SSM项目源码 系统展示 【2025最新】基于phpMySQL的新闻管理系统。…...

6.C++程序中的基本数据类型
数据类型是指在C中用于声明不同类型变量或函数的一个系统或抽象或者是一个分类,它决定了变量存储占用的内存空间以及解析存储的位模式。其实数据类型可以理解为固定内存大小的别名,是创建变量的模具,具体使用哪种模具(包括自定义&…...
oracle 11g写一个判断是否是身份证的函数,函数名称为:FUN_IS_IDENNO
下面是一个用于判断是否是身份证号码的Oracle 11g函数(FUN_IS_IDENNO)。身份证号码通常为18位(或者旧的15位),前17位为数字,第18位为数字或字母X,并且需要符合一定的规则,例如出生日…...
如何使用Spring Cloud Gateway搭建网关系统
使用Spring Cloud Gateway搭建网关系统是一个涉及多个步骤的过程,主要包括创建Spring Boot项目、添加 Spring Cloud Gateway依赖、配置路由规则以及运行和测试网关。以下是详细的步骤:一、创建Spring Boot项目 选择工具: 可以使用Spring Ini…...

油烟机制造5G智能工厂物联数字孪生平台,推进制造业数字化转型
油烟机制造5G智能工厂物联数字孪生平台,是智能制造与信息技术的深度融合产物。数字孪生工业互联平台通过部署在工厂各个环节的传感器和设备,实时采集、分析和处理生产过程中的海量数据,构建出高度逼真的数字孪生模型。这一模型不仅能够真实反…...
《拿下奇怪的前端报错》序章:报错输出个数值数组Buffer(475) [Uint8Array],我来教它说人话!
作为前端开发者,你可能会遇到过一些奇奇怪怪的报错(相信我你早晚会遇到),关键是它未给出具体错误的位置,或者是一些很奇怪的信息。 我以前都是还原代码,然后找到错误的位置。或者是瞎弄一通,测试…...

Docker 里面按照ifconfig
1. 进入Docker 容器内部 docker exec -it xxx bash2. 安装 net-tools iputils-ping apt-get update && apt-get install -y net-tools apt-get update && apt-get install -y iputils-ping 3. 执行ifconfig 执行ping...

DOS(Disk Operating System,磁盘操作系统)常用指令
目录 背景: 早期探索: DOS之父: 发展历程: 常用指令: 进入命令: 操作1.进入和回退: 操作2.增、删: 操作3.其它: 总结: 背景: 早期探索: DOS(Disk Operating System,磁盘操作系统)在…...
VSCode集成Python环境搭建配置详细步骤
1. 安装VSCode 在开始我们的Python编程之旅前,首先需要准备好我们的开发工具——Visual Studio Code,简称VSCode。VSCode是一款由微软开发的轻量级但功能强大的源代码编辑器,支持多种编程语言,并且拥有丰富的扩展生态系统。接下来,我们将一步步教你如何下载、安装以及汉化…...

OpenHarmony(鸿蒙南向开发)——小型系统内核(LiteOS-A)【扩展组件】上
往期知识点记录: 鸿蒙(HarmonyOS)应用层开发(北向)知识点汇总 鸿蒙(OpenHarmony)南向开发保姆级知识点汇总~ 子系统开发内核 轻量系统内核(LiteOS-M) 轻量系统内核&#…...

Windows【环境 01】服务器系统重装后的服务恢复(ES\Redis\Jafka\Tomcat)环境变量和服务注册
服务器系统重装后的服务恢复 1.原因2.问题处理2.1 JDK2.2 Elasticsearch2.3 Redis2.4 Jafka2.5 Tomcat 3.总结 1.原因 Windows 服务器系统盘损坏,换了硬盘并重做了系统,其他磁盘未损坏但安装的服务无法正常运行了,包括: Elastic…...

Qt/C++开发监控GB28181系统/取流协议/同时支持udp/tcp被动/tcp主动
一、前言说明 在2011版本的gb28181协议中,拉取视频流只要求udp方式,从2016开始要求新增支持tcp被动和tcp主动两种方式,udp理论上会丢包的,所以实际使用过程可能会出现画面花屏的情况,而tcp肯定不丢包,起码…...

Xshell远程连接Kali(默认 | 私钥)Note版
前言:xshell远程连接,私钥连接和常规默认连接 任务一 开启ssh服务 service ssh status //查看ssh服务状态 service ssh start //开启ssh服务 update-rc.d ssh enable //开启自启动ssh服务 任务二 修改配置文件 vi /etc/ssh/ssh_config //第一…...

cf2117E
原题链接:https://codeforces.com/contest/2117/problem/E 题目背景: 给定两个数组a,b,可以执行多次以下操作:选择 i (1 < i < n - 1),并设置 或,也可以在执行上述操作前执行一次删除任意 和 。求…...

P3 QT项目----记事本(3.8)
3.8 记事本项目总结 项目源码 1.main.cpp #include "widget.h" #include <QApplication> int main(int argc, char *argv[]) {QApplication a(argc, argv);Widget w;w.show();return a.exec(); } 2.widget.cpp #include "widget.h" #include &q…...
ffmpeg(四):滤镜命令
FFmpeg 的滤镜命令是用于音视频处理中的强大工具,可以完成剪裁、缩放、加水印、调色、合成、旋转、模糊、叠加字幕等复杂的操作。其核心语法格式一般如下: ffmpeg -i input.mp4 -vf "滤镜参数" output.mp4或者带音频滤镜: ffmpeg…...

前端开发面试题总结-JavaScript篇(一)
文章目录 JavaScript高频问答一、作用域与闭包1.什么是闭包(Closure)?闭包有什么应用场景和潜在问题?2.解释 JavaScript 的作用域链(Scope Chain) 二、原型与继承3.原型链是什么?如何实现继承&a…...

NLP学习路线图(二十三):长短期记忆网络(LSTM)
在自然语言处理(NLP)领域,我们时刻面临着处理序列数据的核心挑战。无论是理解句子的结构、分析文本的情感,还是实现语言的翻译,都需要模型能够捕捉词语之间依时序产生的复杂依赖关系。传统的神经网络结构在处理这种序列依赖时显得力不从心,而循环神经网络(RNN) 曾被视为…...

华硕a豆14 Air香氛版,美学与科技的馨香融合
在快节奏的现代生活中,我们渴望一个能激发创想、愉悦感官的工作与生活伙伴,它不仅是冰冷的科技工具,更能触动我们内心深处的细腻情感。正是在这样的期许下,华硕a豆14 Air香氛版翩然而至,它以一种前所未有的方式&#x…...
JS设计模式(4):观察者模式
JS设计模式(4):观察者模式 一、引入 在开发中,我们经常会遇到这样的场景:一个对象的状态变化需要自动通知其他对象,比如: 电商平台中,商品库存变化时需要通知所有订阅该商品的用户;新闻网站中࿰…...

VM虚拟机网络配置(ubuntu24桥接模式):配置静态IP
编辑-虚拟网络编辑器-更改设置 选择桥接模式,然后找到相应的网卡(可以查看自己本机的网络连接) windows连接的网络点击查看属性 编辑虚拟机设置更改网络配置,选择刚才配置的桥接模式 静态ip设置: 我用的ubuntu24桌…...