当前位置：首页 > news >正文

clickhouse集群搭建

news 2026/2/9 16:01:18

Clickhouse集群搭建

文章目录

Clickhouse集群搭建
- 安装包下载
- clickhouse单机安装
- - 默认安装
  - - 默认数据库目录
    - 更改默认数据目录
- 2分片-1副本-3节点集群搭建
- - 1. 配置hosts
  - 2. 修改每个主机的主机名
  - 3. 配置文件上传
  - - 配置文件分布
    - chnode1配置文件
    - chnode2配置文件
    - chnode3配置文件
  - 4. 重启clickhouse-server
  - 5. 集群搭建测试
- Reference List

安装包下载

可以通过deb/rpm、tgz方式安装，但是离线安装选择tgz方式比较方便。本篇介绍
如何离线安装。

tgz下载：https://packages.clickhouse.com/tgz/lts

clickhouse单机安装

搭建集群需要在每台主机上进行单机安装，将tgz和install.sh上传到服务器，执行：

bash install.sh

install.sh

#!/bin/bashexport LATEST_VERSION=22.3.19.6
export ARCH=arm64tar -xzvf "clickhouse-common-static-$LATEST_VERSION-${ARCH}.tgz" \|| tar -xzvf "clickhouse-common-static-$LATEST_VERSION.tgz"
sudo "clickhouse-common-static-$LATEST_VERSION/install/doinst.sh"tar -xzvf "clickhouse-common-static-dbg-$LATEST_VERSION-${ARCH}.tgz" \|| tar -xzvf "clickhouse-common-static-dbg-$LATEST_VERSION.tgz"
sudo "clickhouse-common-static-dbg-$LATEST_VERSION/install/doinst.sh"tar -xzvf "clickhouse-server-$LATEST_VERSION-${ARCH}.tgz" \|| tar -xzvf "clickhouse-server-$LATEST_VERSION.tgz"
sudo "clickhouse-server-$LATEST_VERSION/install/doinst.sh" configure
sudo /etc/init.d/clickhouse-server starttar -xzvf "clickhouse-client-$LATEST_VERSION-${ARCH}.tgz" \|| tar -xzvf "clickhouse-client-$LATEST_VERSION.tgz"
sudo "clickhouse-client-$LATEST_VERSION/install/doinst.sh"

默认安装

默认数据库目录

默认数据目录路径：默认数据目录处于/var/lib/clickhouse。
数据目录初始化：删除此目录，重新启动clickhouse systemctl restart clickhouse-server可以重新将数据目录初始化。

更改默认数据目录

要更改默认数据目录更改，修改/etc/clickhouse-server/config.xml

    <!-- Path to data directory, with trailing slash. --><path>/var/lib/clickhouse/</path>

配置文件是只读的，所以要修改数据目录，

需要修改其权限

chmod 755 /etc/clickhouse-server/config.xml

将全部/var/lib/clickhouse/修改为其他数据目录
删除默认数据库目录下所有文件。
重启clickhouse-server，对数据目录进行重新初始化。

2分片-1副本-3节点集群搭建

clickhouse的集群每个分片的每个副本只能放到单独的实例上，比如2分片-2副本需要4台机器，3分片-2副本需要6台机器。

集群的拓扑：

节点	角色	描述
chnode1	Data + ClickHouse Keeper	数据节点 + 协调器
chnode2	Data + ClickHouse Keeper	数据节点 + 协调器
chnode3	ClickHouse Keeper	协调器

分片及副本分布：

节点	角色
chnode1	分片1、副本1
chnode2	分片2、副本1
chnode3	无分片、无副本

1. 配置hosts

对于每个主机，将如下内容追加到/etc/hosts：

10.55.134.82 chnode1     
10.55.134.93 chnode2
10.55.134.99 chnode3

2. 修改每个主机的主机名

hostnamectl set-hostname chnode1

3. 配置文件上传

配置文件分布

/etc/clickhouse-server/config.d/目录中的配置会覆盖默认配置，所以官网建议：

服务器配置添加到/etc/clickhouse-server/config.d/
用户配置添加到/etc/clickhouse-server/users.d/
不要更改/etc/clickhouse-server/config.xml
不要更改/etc/clickhouse-server/users.xml

我们先来看看每个主机上的配置文件：

chnode1

[root@chnode1 clickhouse]# ll /etc/clickhouse-server/config.d/
total 24
-rw-r--r-- 1 root       root       985 Feb 13 15:41 enable-keeper.xml
-rw-r--r-- 1 clickhouse clickhouse  66 Feb 13 16:19 listen.xml
-rw-r--r-- 1 root       root       104 Feb 13 15:41 macros.xml
-rw-r--r-- 1 root       root       574 Feb 13 16:52 network-and-logging.xml
-rw-r--r-- 1 root       root       599 Feb 13 15:41 remote-servers.xml
-rw-r--r-- 1 root       root       386 Feb 13 15:41 use-keeper.xml

chnode2

[root@chnode2 clickhouse]# ll /etc/clickhouse-server/config.d/
total 24
-rw-r--r-- 1 root       root       985 Feb 13 15:41 enable-keeper.xml
-rw-r--r-- 1 clickhouse clickhouse  66 Feb 13 16:19 listen.xml
-rw-r--r-- 1 root       root       104 Feb 13 15:41 macros.xml
-rw-r--r-- 1 root       root       574 Feb 13 16:52 network-and-logging.xml
-rw-r--r-- 1 root       root       599 Feb 13 15:41 remote-servers.xml
-rw-r--r-- 1 root       root       386 Feb 13 15:41 use-keeper.xml

chnode3

[root@chnode3 clickhouse]# ll /etc/clickhouse-server/config.d/
total 12
-rw-r--r-- 1 clickhouse clickhouse 985 Feb 13 15:45 enable-keeper.xml
-rw-r--r-- 1 clickhouse clickhouse  61 Feb 13 16:06 listen.xml
-rw-r--r-- 1 clickhouse clickhouse 566 Feb 13 15:45 network-and-logging.xml

chnode1配置文件

network-and-logging.xml
- 日志在1000M大小时滚动一次，保留3000M的日志。
- clickhouse监听8123和9000端口
- 服务器间通信使用端口9009

<clickhouse><logger><level>debug</level><log>/var/log/clickhouse-server/clickhouse-server.log</log><errorlog>/var/log/clickhouse-server/clickhouse-server.err.log</errorlog><size>1000M</size><count>3</count></logger><display_name>clickhouse</display_name><listen_host>0.0.0.0</listen_host><http_port>8123</http_port><tcp_port>9000</tcp_port><interserver_http_port>9009</interserver_http_port>
</clickhouse>

enable-keeper.xml
- chnode节点的server_id设置为1，其他节点id要不同。
- 其他配置和chnode2一样

<clickhouse><keeper_server><tcp_port>9181</tcp_port><server_id>1</server_id><log_storage_path>/var/lib/clickhouse/coordination/log</log_storage_path><snapshot_storage_path>/var/lib/clickhouse/coordination/snapshots</snapshot_storage_path><coordination_settings><operation_timeout_ms>10000</operation_timeout_ms><session_timeout_ms>30000</session_timeout_ms><raft_logs_level>trace</raft_logs_level></coordination_settings><raft_configuration><server><id>1</id><hostname>chnode1</hostname><port>9234</port></server><server><id>2</id><hostname>chnode2</hostname><port>9234</port></server><server><id>3</id><hostname>chnode3</hostname><port>9234</port></server></raft_configuration></keeper_server>
</clickhouse>

macros.xml
- shard值为1，指定了本节点存储分片1，副本1，chnode2里shard的值将变为2
- 这种指定方式可以减少DDL语句复杂度，不用在建表时候再去指定分片分配到哪个节点。

<clickhouse><macros><shard>1</shard><replica>replica_1</replica></macros>
</clickhouse>

remote-servers.xml
- remote-servers部分指定了所有集群，replace="true"表示覆盖默认配置里配置的集群。
- 指定了一个集群名为cluster_2S_1R
- 集群使用secret进行加密通信
- cluster_2S_1R集群有两个分片，每个分片有一个副本。
- internal_replication设置为true表示写入操作时会选择第一个发现的健康副本去写入。

chnode1和chnode2的remote-servers.xml配置相同。

<clickhouse><remote_servers replace="true"><cluster_2S_1R><secret>mysecretphrase</secret><shard><internal_replication>true</internal_replication><replica><host>chnode1</host><port>9000</port></replica></shard><shard><internal_replication>true</internal_replication><replica><host>chnode2</host><port>9000</port></replica></shard></cluster_2S_1R></remote_servers>
</clickhouse>

use-keeper.xml
- 指定3个节点的zookeeper端口为9181

<clickhouse><zookeeper><node index="1"><host>chnode1</host><port>9181</port></node><node index="2"><host>chnode2</host><port>9181</port></node><node index="3"><host>chnode3</host><port>9181</port></node></zookeeper>
</clickhouse>

chnode2配置文件

network-and-logging.xml

和chnode1配置相同

<clickhouse><logger><level>debug</level><log>/var/log/clickhouse-server/clickhouse-server.log</log><errorlog>/var/log/clickhouse-server/clickhouse-server.err.log</errorlog><size>1000M</size><count>3</count></logger><display_name>clickhouse</display_name><listen_host>0.0.0.0</listen_host><http_port>8123</http_port><tcp_port>9000</tcp_port><interserver_http_port>9009</interserver_http_port>
</clickhouse>

enable-keeper.xml
- chnode2节点的server_id设置为2，其他相同

<clickhouse><keeper_server><tcp_port>9181</tcp_port><server_id>2</server_id><log_storage_path>/var/lib/clickhouse/coordination/log</log_storage_path><snapshot_storage_path>/var/lib/clickhouse/coordination/snapshots</snapshot_storage_path><coordination_settings><operation_timeout_ms>10000</operation_timeout_ms><session_timeout_ms>30000</session_timeout_ms><raft_logs_level>trace</raft_logs_level></coordination_settings><raft_configuration><server><id>1</id><hostname>chnode1</hostname><port>9234</port></server><server><id>2</id><hostname>chnode2</hostname><port>9234</port></server><server><id>3</id><hostname>chnode3</hostname><port>9234</port></server></raft_configuration></keeper_server>
</clickhouse>

macros.xml
- shard值为2，指定了本节点存储分片2，副本1

<clickhouse><macros><shard>2</shard><replica>replica_1</replica></macros>
</clickhouse>

remote-servers.xml

chnode1和chnode2的remote-servers.xml配置相同。

<clickhouse><remote_servers replace="true"><cluster_2S_1R><secret>mysecretphrase</secret><shard><internal_replication>true</internal_replication><replica><host>chnode1</host><port>9000</port></replica></shard><shard><internal_replication>true</internal_replication><replica><host>chnode2</host><port>9000</port></replica></shard></cluster_2S_1R></remote_servers>
</clickhouse>

use-keeper.xml

和chnode1配置相同

<clickhouse><zookeeper><node index="1"><host>chnode1</host><port>9181</port></node><node index="2"><host>chnode2</host><port>9181</port></node><node index="3"><host>chnode3</host><port>9181</port></node></zookeeper>
</clickhouse>

chnode3配置文件

network-and-logging.xml

和chnode1配置相同

<clickhouse><logger><level>debug</level><log>/var/log/clickhouse-server/clickhouse-server.log</log><errorlog>/var/log/clickhouse-server/clickhouse-server.err.log</errorlog><size>1000M</size><count>3</count></logger><display_name>clickhouse</display_name><listen_host>0.0.0.0</listen_host><http_port>8123</http_port><tcp_port>9000</tcp_port><interserver_http_port>9009</interserver_http_port>
</clickhouse>

enable-keeper.xml
- chnode3节点的server_id设置为3，其他相同

<clickhouse><keeper_server><tcp_port>9181</tcp_port><server_id>3</server_id><log_storage_path>/var/lib/clickhouse/coordination/log</log_storage_path><snapshot_storage_path>/var/lib/clickhouse/coordination/snapshots</snapshot_storage_path><coordination_settings><operation_timeout_ms>10000</operation_timeout_ms><session_timeout_ms>30000</session_timeout_ms><raft_logs_level>trace</raft_logs_level></coordination_settings><raft_configuration><server><id>1</id><hostname>chnode1</hostname><port>9234</port></server><server><id>2</id><hostname>chnode2</hostname><port>9234</port></server><server><id>3</id><hostname>chnode3</hostname><port>9234</port></server></raft_configuration></keeper_server>
</clickhouse>

4. 重启clickhouse-server

三台服务器全部执行：

systemctl restart clickhouse-server

5. 集群搭建测试

下面来创建样例分布表，测试下效果：

连接chnode1,执行SHOW CLUSTERS

[root@chnode1 clickhouse]# clickhouse-client --password -h 127.0.0.1
ClickHouse client version 22.3.19.6 (official build).
Password for user (default): 
Connecting to 127.0.0.1:9000 as user default.
Connected to ClickHouse server version 22.3.19 revision 54455.clickhouse :) SHOW CLUSTERSSHOW CLUSTERSQuery id: 0ff16c63-3c1e-438d-8fad-1e8e25c42235┌─cluster───────┐
│ cluster_2S_1R │
└───────────────┘

创建数据库

CREATE DATABASE db1 ON CLUSTER cluster_2S_1R

创建一个分布表

CREATE TABLE db1.table1_dist ON CLUSTER cluster_2S_1R
(`id` UInt64,`column1` String
)
ENGINE = Distributed('cluster_2S_1R', 'db1', 'table1', rand())

分别clickhouse-client连接chnode1和chnode2.

chnode1插入：

INSERT INTO db1.table1 (id, column1) VALUES (1, 'abc');

chnode2插入：

INSERT INTO db1.table1 (id, column1) VALUES (2, 'def');

查询数据

clickhouse :) SELECT * FROM db1.table1_dist;SELECT *
FROM db1.table1_distQuery id: 8ce26016-f923-472e-894d-a7a3025a8927┌─id─┬─column1─┐
│  1 │ abc     │
└────┴─────────┘
┌─id─┬─column1─┐
│  1 │ abc     │
└────┴─────────┘

Reference List

https://clickhouse.com/docs/en/architecture/horizontal-scaling

clickhouse集群搭建

Clickhouse集群搭建文章目录 Clickhouse集群搭建安装包下载clickhouse单机安装默认安装默认数据库目录更改默认数据目录 2分片-1副本-3节点集群搭建1. 配置hosts2. 修改每个主机的主机名3. 配置文件上传配置文件分布chnode1配置文件chnode2配置文件chnode3配置文件 4. 重启cli…...

编程日记 2025/2/16 7:49:19

250214-java类集框架

单列集合是list和set，list的实现类有ArrayList和LinkedList，前者是数组实现，后者是链表实现。list和set，前者有序、可重复，后者无序不可重复。 1.单列集合 1.1. list java.util.List接口继承自Collection接口&#…...

编程日记 2025/2/16 7:48:10

二叉树（C语言版）

文章目录二叉树完全二叉树和满二叉树二叉搜索树基本操作实现代码运行结果分析红黑树2-3-4树(理论模型)红黑树(实际实现) 二叉树树是一种层次结构，它在现实生活中是广泛存在的，比如：族谱(family tree)，组织机构，目录…...

编程日记 2025/2/16 7:46:04

ASP.NET Core 面试宝典【刷题系列】

文章目录引言1、什么是 dot net core 的 startup class?2、什么是中间件?3、application builder 的 use 和 run 方法有什么区别?4、dot net core 管道里面的map拓展有什么作用?5、dot net core 里面的路径是如何处理的?6、如何在 dot net core 中激活 session 功能?7、…...

编程日记 2025/2/16 7:43:58

案例-02.部门管理-查询

一.查询部门-需求二.查询部门-思路 API接口文档三.代码实现 1.controller层：负责与前端进行交互，接收前端所发来的请求注：Slf4j用于记录日志使用，可以省略private static Logger log LoggerFactory.getLogger(DeptControlle…...

编程日记 2025/2/16 7:41:53

src和href区别

src和href区别 (1)请求资源类型不同(2)作用结果不同(3)解析方式不同 (1)请求资源类型不同 href 用来建立文档和元素之间的链接(是引用),常用的有a、linksrc 在请求src资源时候会将指向的资源下载并且应用到文档中(引入),常用的有script、iframe、image。 (2)作用结果不同 hr…...

编程日记 2025/2/16 7:40:46

Java每日精进·45天挑战·Day19

第一部分：移除数字以形成最小数的贪心算法实现在编程的世界里，我们经常遇到需要对字符串表示的数字进行操作的问题。今天，我们要深入探讨一个具体的挑战：给定一个以字符串形式表示的非负整数 num 和一个整数 k，我们的…...

编程日记 2025/2/16 7:38:43

区块链的交易管理和共识机制

区块链的交易管理和共识机制是其核心功能，以下为你详细介绍它们的实现方式： 交易管理的实现交易发起 • 用户使用钱包软件创建一笔交易，该交易包含发送方地址、接收方地址、转账金额等关键信息。同时，发送方会使用自己的私钥对…...

编程日记 2025/2/16 7:36:40

Apollo 9.0 速度动态规划决策算法 – path time heuristic optimizer

文章目录 1. 动态规划2. 采样3. 代价函数3.1 障碍物代价3.2 距离终点代价3.3 速度代价3.4 加速度代价3.5 jerk代价 4. 回溯这一章将来讲解速度决策算法，也就是SPEED_HEURISTIC_OPTIMIZER task里面的内容。Apollo 9.0使用动态规划算法进行速度决策，从类名…...

编程日记 2025/2/16 7:29:31

Apache Iceberg 与 Apache Hudi：数据湖领域的双雄对决

在数据存储和处理不断发展的领域中，数据湖仓的概念已经崭露头角，成为了一种变革性的力量。数据湖仓结合了数据仓库和数据湖的最佳元素，提供了一个统一的平台，支持数据科学、商业智能、人工智能/机器学习以及临时报告等多种关键功能…...

编程日记 2025/2/16 7:26:24

【LeetCode Hot100 普通数组】最大子数组和、合并区间、旋转数组、除自身以外数组的乘积、缺失的第一个正整数

普通数组 1. 最大子数组和（Maximum Subarray）解题思路动态规划的优化解法（Kadane 算法）核心思想代码解析 2. 合并区间（Merge Intervals）解题思路代码实现 3. 旋转数组（Rotate Array&#xff09…...

编程日记 2025/2/16 7:24:16

共享存储-一步一步部署ceph分布式文件系统

一、Ceph 简介 Ceph 是一个开源的分布式文件系统。因为它还支持块存储、对象存储，所以很自然的被用做云计算框架 openstack 或 cloudstack 整个存储后端。当然也可以单独作为存储，例如部署一套集群作为对象存储、SAN 存储、NAS 存储等。二、ceph 支…...

编程日记 2025/2/16 7:22:10

19.Python实战：实现对博客文章的点赞系统

Flask博客点赞系统一个基于Flask的简单博客系统，具有文章展示和点赞功能。系统使用MySQL存储数据，支持文章展示、点赞/取消点赞等功能。功能特点文章列表展示文章详情查看（模态框展示）点赞/取消点赞功能（每个IP只…...

编程日记 2025/2/16 7:21:06

【stm32】定时器输出PWM波形(hal库）

一. PWM基本原理 PWM是一种通过调节信号的占空比（Duty Cycle）来控制输出平均电压的技术。占空比是指高电平时间与整个周期时间的比值。例如： - 占空比为50%时，输出平均电压为电源电压的一半。 - 占空比为100%时，输出始…...

编程日记 2025/2/16 7:20:04

当Ollama遇上划词翻译：我的Windows本地AI服务搭建日记

🚀 实现Windows本地大模型翻译服务 - 基于OllamaFlask的划词翻译实践 🛠️ 步骤概要1️⃣ python 环境准备2️⃣ Ollama 安装3️⃣ 一个 Flask 服务4️⃣ Windows 服务化封装5️⃣ 测试本地接口6️⃣ 配置划词翻译自定义翻译源7️⃣ 效果展示8️⃣ debug…...

编程日记 2025/2/16 7:17:01

Linux上Elasticsearch 集群部署指南

Es 集群部署 Es 集群部署 Es 集群部署准备好三台服务器。示例使用：110.0.5.141/142/143 1、es用户和用户组创建，使用root账号 groupadd esuseradd -g es es2、将es安装包和ik分词器上传到：/home/es/目录下（任意目录都行&#…...

编程日记 2025/2/16 7:11:50

字节Trae使用感想(后端)

前言昨天分享了字节哥的Trae从0到1创作模式构建一个vue前端项目，今天又来试试她的后端项目能力。不是我舔，不得不说确实不错。可惜现在曾经没有好好学习，进不了字节。既然进不了字节，那我就用字节哥的产品吧。后面有惊喜…...

编程日记 2025/2/16 7:09:47

国产编辑器EverEdit - 二进制模式下观察Window/Linux/MacOs换行符差异

1 换行符格式 1.1 应用场景稍微了解计算机历史的人都知道， 计算机3大操作系统： Windows、Linux/Unix、MacOS，这3大系统对文本换行的定义各不相同，且互不相让，导致在文件的兼容性方面存在一些问题，比如它们…...

编程日记 2025/2/16 7:06:43

文心一言4月起全面免费，6月底开源新模型：AI竞争进入新阶段？

名人说：莫听穿林打叶声，何妨吟啸且徐行。—— 苏轼 Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder😊） 目录一、文心一言免费化的背后：AI成本与应用的双重驱动1️⃣成本下降，推动文心一言普及2…...

编程日记 2025/2/16 7:05:41

在软件开发中正确使用MySQL日期时间类型的深度解析

在日常软件开发场景中，时间信息的存储是底层且核心的需求。从金融交易的精确记账时间、用户操作的行为日志，到供应链系统的物流节点时间戳，时间数据的准确性直接决定业务逻辑的可靠性。MySQL作为主流关系型数据库，其日期时间类型的…...

编程新知 2025/10/16 13:22:06

SkyWalking 10.2.0 SWCK 配置过程

SkyWalking 10.2.0 & SWCK 配置过程 skywalking oap-server & ui 使用Docker安装在K8S集群以外，K8S集群中的微服务使用initContainer按命名空间将skywalking-java-agent注入到业务容器中。 SWCK有整套的解决方案，全安装在K8S群集中。具体可参…...

编程新知 2025/8/23 5:51:08

简易版抽奖活动的设计技术方案

1.前言本技术方案旨在设计一套完整且可靠的抽奖活动逻辑，确保抽奖活动能够公平、公正、公开地进行，同时满足高并发访问、数据安全存储与高效处理等需求，为用户提供流畅的抽奖体验，助力业务顺利开展。本方案将涵盖抽奖活动的整体架构设计、核心流程逻辑、关键功能实现以及…...

编程新知 2026/2/7 17:41:40

定义集线器接口 IOnlineUserHub public interface IOnlineUserHub {/// 在线用户列表Task OnlineUserList(OnlineUserList context);/// 强制下线Task ForceOffline(object context);/// 发布站内消息Task PublicNotice(SysNotice context);/// 接收消息Task ReceiveMessage(…...

编程新知 2025/9/10 5:36:56

3.3.1_1 检错编码（奇偶校验码）

从这节课开始，我们会探讨数据链路层的差错控制功能，差错控制功能的主要目标是要发现并且解决一个帧内部的位错误，我们需要使用特殊的编码技术去发现帧内部的位错误，当我们发现位错误之后，通常来说有两种解决方案。第一…...

编程新知 2026/1/30 3:28:14

《从零掌握MIPI CSI-2: 协议精解与FPGA摄像头开发实战》-- CSI-2 协议详细解析 (一）

CSI-2 协议详细解析 (一） 1. CSI-2层定义（CSI-2 Layer Definitions） 分层结构 ：CSI-2协议分为6层： 物理层（PHY Layer） ： 定义电气特性、时钟机制和传输介质（导线&#…...

编程新知 2026/1/23 12:18:20

STM32+rt-thread判断是否联网

一、根据NETDEV_FLAG_INTERNET_UP位判断 static bool is_conncected(void) {struct netdev *dev RT_NULL;dev netdev_get_first_by_flags(NETDEV_FLAG_INTERNET_UP);if (dev RT_NULL){printf("wait netdev internet up...");return false;}else{printf("loc…...

编程新知 2025/9/23 20:06:08