当前位置: 首页 > article >正文

ClickHouse 部署指南:列式数据库搭建和使用,分析查询快 100 倍

ClickHouse 部署指南列式数据库搭建和使用分析查询快 100 倍ClickHouse 是 Yandex 开源的列式数据库专为 OLAP在线分析处理场景设计。普通 MySQL 查询一亿条日志需要几分钟ClickHouse 同样的查询可能只需要几秒——它通过列式存储、向量化执行、极致压缩来实现这个速度。适合存储和分析大量时序数据、日志、用户行为数据、监控指标等。ClickHouse vs MySQL场景区别场景推荐数据库用户注册、订单、事务MySQL / PostgreSQL日志分析、用户行为、监控ClickHouse数据量 100 万条MySQL 够用数据量 1000 万条ClickHouse 优势明显服务器配置建议数据量CPU内存硬盘 1 亿行2 核4G100GBSSD1–100 亿行8 核32G1TBClickHouse 对内存和磁盘 IO 要求较高SSD 能显著提升查询速度。我用 雨云服务器 rainyuncom的 4 核 8G SSD 服务器存储网站访问日志每天几百万条记录分析查询响应都在 1 秒以内。新用户注册填优惠码2026off能领 5 折优惠券。安装 ClickHouse方法一官方包推荐sudoaptinstall-yapt-transport-https ca-certificatescurlgnupgcurl-fsSLhttps://packages.clickhouse.com/rpm/lts/repodata/repomd.xml.key|sudogpg--dearmor-o/usr/share/keyrings/clickhouse-keyring.gpgechodeb [signed-by/usr/share/keyrings/clickhouse-keyring.gpg] https://packages.clickhouse.com/deb stable main|sudotee/etc/apt/sources.list.d/clickhouse.listsudoaptupdatesudoaptinstall-yclickhouse-server clickhouse-clientsudosystemctlenable--nowclickhouse-serversudosystemctl status clickhouse-server方法二Dockerdockerrun-d\--nameclickhouse\-p8123:8123\-p9000:9000\-v/opt/clickhouse/data:/var/lib/clickhouse\-v/opt/clickhouse/logs:/var/log/clickhouse-server\--ulimitnofile262144:262144\clickhouse/clickhouse-server:latest基本配置sudonano/etc/clickhouse-server/users.xml设置默认用户密码生产环境必须设置usersdefault!-- 清空 password 标签改用密码哈希 --password/password!-- 或者使用 SHA256 哈希 --!-- password_sha256_hex哈希值/password_sha256_hex --networksip::1/ipip127.0.0.1/ip!-- 如需远程访问添加允许的 IP --/networksprofiledefault/profilequotadefault/quota/default/users重启服务sudosystemctl restart clickhouse-server连接 ClickHouse# 本地命令行客户端clickhouse-client# 带用户名密码clickhouse-client--userdefault--password你的密码# HTTP 接口也支持curlhttp://localhost:8123/?querySELECTversion()基本操作创建数据库和表-- 创建数据库CREATEDATABASEanalytics;USEanalytics;-- 创建日志表MergeTree 引擎是最常用的CREATETABLEaccess_logs(timestampDateTime,dateDateDEFAULTtoDate(timestamp),ip String,method LowCardinality(String),-- 低基数字段用 LowCardinalitypath String,statusUInt16,bytes UInt64,duration_ms Float32,user_agent String,referer String)ENGINEMergeTree()PARTITIONBYdate-- 按日期分区ORDERBY(timestamp,ip)-- 主键影响查询性能TTLdateINTERVAL90DAY-- 自动删除 90 天前的数据SETTINGS index_granularity8192;插入数据-- 单条插入INSERTINTOaccess_logsVALUES(now(),today(),1.2.3.4,GET,/api/users,200,1024,45.2,Mozilla/5.0,);-- 批量插入推荐ClickHouse 适合大批量写入INSERTINTOaccess_logsSELECT*FROMinput(timestamp DateTime, ip String, ...);查询示例-- 统计今天各 HTTP 状态码数量SELECTstatus,count()AScountFROMaccess_logsWHEREdatetoday()GROUPBYstatusORDERBYcountDESC;-- 最慢的 10 个接口SELECTpath,avg(duration_ms)ASavg_duration,count()ASrequest_countFROMaccess_logsWHEREdatetoday()-7GROUPBYpathORDERBYavg_durationDESCLIMIT10;-- 每小时请求量时序分析SELECTtoStartOfHour(timestamp)AShour,count()ASrequests,sum(bytes)AStotal_bytesFROMaccess_logsWHEREdatetoday()-1GROUPBYhourORDERBYhour;-- IP 排名找高频访问 IPSELECTip,count()AScountFROMaccess_logsWHEREdatetoday()ANDstatus400-- 只看错误请求GROUPBYipORDERBYcountDESCLIMIT20;物化视图预计算聚合-- 创建每分钟统计的物化视图查询速度更快CREATEMATERIALIZEDVIEWaccess_logs_per_minuteENGINESummingMergeTree()ORDERBY(minute,path)ASSELECTtoStartOfMinute(timestamp)ASminute,path,count()ASrequests,sum(bytes)ASbytes,avg(duration_ms)ASavg_durationFROMaccess_logsGROUPBYminute,path;-- 查询物化视图比原表快很多SELECTpath,sum(requests)AStotalFROMaccess_logs_per_minuteWHEREminutenow()-INTERVAL1HOURGROUPBYpathORDERBYtotalDESC;发送 Nginx 日志到 ClickHouse配合 Vector日志收集工具把 Nginx 日志实时写入 ClickHousecurl--protohttps--tlsv1.2-sSfhttps://sh.vector.dev|bashcat/etc/vector/vector.yamlEOF sources: nginx_logs: type: file include: - /var/log/nginx/access.log read_from: end transforms: parse_nginx: type: remap inputs: [nginx_logs] source: | parsed, err parse_nginx_log(.message, combined) if err null { . merge!(., parsed) .timestamp now() } sinks: clickhouse: type: clickhouse inputs: [parse_nginx] endpoint: http://localhost:8123 database: analytics table: access_logs auth: strategy: basic user: default password: 你的密码 EOFsystemctlenable--nowvector配合 Grafana 可视化在 Grafana 里安装 ClickHouse 数据源插件Grafana → Connections → Data Sources → Add → ClickHouse - URL: http://localhost:8123 - 用户名/密码然后可以创建仪表板把 SQL 查询结果可视化为折线图、柱状图等。数据备份# 备份特定表clickhouse-client--querySELECT * FROM analytics.access_logs FORMAT Native|gzip/backup/access_logs-$(date%Y%m%d).bin.gz# 恢复gunzip-c/backup/access_logs-20260427.bin.gz|clickhouse-client--queryINSERT INTO analytics.access_logs FORMAT Native# 使用 clickhouse-backup 工具功能更完整ClickHouse 的价值在于让你可以在大量数据上做实时分析——以前要么用 MySQL 慢查询要么花大钱买数据仓库现在用一台普通云服务器就能搭建一个响应时间以秒计的分析平台。对于有日志分析、用户行为追踪、监控数据存储需求的项目ClickHouse 是性价比最高的选择。

相关文章:

ClickHouse 部署指南:列式数据库搭建和使用,分析查询快 100 倍

ClickHouse 部署指南:列式数据库搭建和使用,分析查询快 100 倍 ClickHouse 是 Yandex 开源的列式数据库,专为 OLAP(在线分析处理)场景设计。普通 MySQL 查询一亿条日志需要几分钟,ClickHouse 同样的查询可…...

11类水下渔具与海洋垃圾检测数据集(2500张)|YOLO训练数据集 水下目标检测 海洋环保 无人潜航器 生态监测

11类水下渔具与海洋垃圾检测数据集(2500张)|YOLO训练数据集 水下目标检测 海洋环保 无人潜航器 生态监测 前言 随着海洋资源开发与人类活动的不断增加,海洋生态环境正面临越来越严峻的挑战。其中,废弃渔具与海洋垃圾问…...

别再只盯着mAP了!YOLOv5/v8模型部署时,这3个指标(参数量、GFLOPS、FPS)才是真·性能关键

模型部署实战:YOLOv5/v8性能优化的三大黄金指标 当你兴奋地在测试集上看到mAP达到90%的YOLO模型时,是否想过这个数字在实际部署中可能毫无意义?在工业摄像头每秒30帧的流水线上,在Jetson Xavier边缘计算盒里,在树莓派驱…...

空间智能评估框架:量化分析与动态优化

1. 空间智能评估的行业痛点与解决思路在建筑规划、室内设计、工业布局等领域,我们经常遇到一个根本性难题:如何量化评估一个空间设计的智能程度?传统评估方法往往存在三个致命缺陷:主观性强:依赖专家经验打分&#xff…...

像搭乐高一样组合AI想法:手把手教你用GoT框架解决复杂任务(附Python示例)

像搭乐高一样组合AI想法:手把手教你用GoT框架解决复杂任务(附Python示例) 当面对需要整合多份合同条款、合并技术文档或处理其他复杂文本任务时,传统AI方法往往显得力不从心。就像用乐高积木搭建复杂模型需要灵活组合不同模块一样…...

跨平台扫描技能:构建统一硬件接口的架构设计与实战

1. 项目概述:一个跨平台扫描工具的“技能”实现最近在折腾一些自动化流程,发现一个挺有意思的需求:如何让一个扫描动作,无论是文档、二维码还是简单的图像识别,都能在不同的设备和操作系统上无缝运行?这听起…...

别再死记硬背了!用Python 3分钟搞定MIDI音符、频率与音名的相互转换

别再死记硬背了!用Python 3分钟搞定MIDI音符、频率与音名的相互转换 音乐制作和音频编程中,MIDI音符编号、频率和音名之间的转换是基础但繁琐的工作。传统方法依赖查表或手动计算,既耗时又容易出错。本文将用Python构建一套高效转换工具&…...

5大核心功能彻底解决魔兽争霸3在现代电脑上的兼容性问题

5大核心功能彻底解决魔兽争霸3在现代电脑上的兼容性问题 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 你是否还在为魔兽争霸3这款经典游戏在现代电脑…...

NREL风速数据API参数详解:从wkt坐标到interval间隔,教你精准定制所需气象字段

NREL风速数据API参数详解:从wkt坐标到interval间隔,教你精准定制所需气象字段 在风能资源评估和气象模型研究中,获取高精度、定制化的风速数据至关重要。NREL(美国国家可再生能源实验室)提供的风速数据API因其权威性和…...

Merkle 树的认证路径

本文章翻译自David Ireland首次发表于Authentication Path for a Merkle Tree的原创文章, 强烈推荐有一定英文基础的小伙伴阅读原文。 本页探讨如何计算和验证 Merkle 树的认证路径(authentication path)。 二叉树中的路径 这是一棵有 8 个节点的树&a…...

计算 FORS 签名

本文章翻译自David Ireland首次发表于Computing the FORS signature的原创文章, 强烈推荐有一定英文基础的小伙伴阅读原文。 让我们回顾一下 FORS 签名的相关知识。 FORS 是一种*有限次签名 (Few Time Signature, FTS)*方案,其中我们有大量可能的私钥,…...

手把手教你玩转Codesys定时器:TON、TOF、TP、RTC功能块实战配置

手把手教你玩转Codesys定时器:TON、TOF、TP、RTC功能块实战配置 在工业自动化领域,精确的时间控制往往是实现复杂逻辑的关键。想象一下,一条自动化生产线需要精确控制每个工位的停留时间,或者一个包装设备需要准确计算产品间隔——…...

从GEE下载TFRecord分片文件到本地训练?这份TensorFlow数据管道构建指南请收好

从GEE到本地训练:TensorFlow高效处理TFRecord分片文件全指南 当你在Google Earth Engine(GEE)上完成遥感影像分析后,将数据导出为TFRecord格式是进行本地模型训练的关键第一步。但面对那些以-00000到-0000N命名的分片文件&#xf…...

如何免费解锁百度网盘SVIP高速下载:macOS用户终极指南

如何免费解锁百度网盘SVIP高速下载:macOS用户终极指南 【免费下载链接】BaiduNetdiskPlugin-macOS For macOS.百度网盘 破解SVIP、下载速度限制~ 项目地址: https://gitcode.com/gh_mirrors/ba/BaiduNetdiskPlugin-macOS 还在为百度网盘Mac版的龟速下载而烦恼…...

慧知开源虚拟电厂(VPP)核心平台PRD需求文档(大白话与专业结合版)- 慧知开源充电桩平台

虚拟电厂(VPP)核心平台PRD需求文档 1. 文档概述一句话大白话:虚拟电厂(VPP)就是“没有烟囱、没有发电机的电厂”,靠一套软件平台,把一堆分散的光伏、储能、充电桩、工厂可调节负荷“拼成一个大电…...

贵阳本地GEO首选贵阳伍子柒网络,懂贵阳市场,适配本地企业推广需求

在贵阳做GEO推广,为什么越来越多本地企业选择贵阳伍子柒网络?答案很简单:懂贵阳市场、适配本地需求,靠谱、省心、有效果!当前贵阳GEO市场鱼龙混杂,很多服务商要么是异地团队,不懂贵阳本地市场特…...

AHK2_Lib:让AutoHotkey V2从脚本工具蜕变为专业开发平台

AHK2_Lib:让AutoHotkey V2从脚本工具蜕变为专业开发平台 【免费下载链接】ahk2_lib 项目地址: https://gitcode.com/gh_mirrors/ah/ahk2_lib 在Windows自动化领域,AutoHotkey一直以其简洁高效的脚本能力著称。然而,当您需要构建复杂的…...

【C语言逻辑题】谋杀案凶手是谁?——经典矛盾推理题详解

一、题目背景日本某地发生了一件谋杀案,警察通过排查确定杀人凶手必为4个嫌疑犯的一个。以下为4个嫌疑犯的供词:A说:不是我。B说:是C。C说:是D。D说:C在胡说。已知3个人说了真话,1个人说的是假话…...

AI代码安全执行:E2B沙箱技术原理与实战指南

1. 项目概述:当AI需要“动手”时,我们如何安全地执行它生成的代码? 在AI应用开发,尤其是大语言模型(LLM)驱动的智能体(Agent)领域,一个核心且棘手的问题是:如…...

ESP32-C3硬件I2C不够用?手把手教你用SlowSoftWire库扩展软件I2C(以VL53L0X为例)

ESP32-C3硬件I2C资源扩展实战:用SlowSoftWire实现多总线并行控制 当你在ESP32-C3上同时连接多个I2C设备时,很快就会发现这个芯片的硬件限制——它仅提供一组硬件I2C接口。这就像在高峰期的单车道公路上试图同时通行多辆卡车,必然导致交通堵塞…...

助睿实验作业1-订单利润分流数据加工

一、实验背景1.1 实验目的本次实验旨在掌握零代码数据集成平台的核心操作与 ETL 基础方法,具体包括:• 熟悉数据转换任务的创建、组件添加与任务执行的完整流程;• 掌握数据读取、多表关联、字段筛选、条件分流与文件输出等常用功能的配置&am…...

Vim集成LLM智能代理:打造沉浸式AI编程助手

1. 项目概述:当Vim遇上LLM,一个开发者的效率革命 如果你和我一样,是一个常年泡在终端和Vim里的开发者,那么你一定经历过这样的时刻:面对一段复杂的正则表达式,或者一个不熟悉的API调用,你不得不…...

AVRCP 1.6的隐藏技能:手把手教你实现蓝牙音乐封面传输(基于BIP/OBEX)

AVRCP 1.6的隐藏技能:手把手教你实现蓝牙音乐封面传输(基于BIP/OBEX) 在蓝牙音频设备的使用体验中,音乐封面传输一直是个被低估的功能。想象一下,当你用高端蓝牙耳机听歌时,耳机上的小屏幕不仅能显示歌曲信…...

【LangChain】使用 LangChain 快速实现 RAG

写在前面公司内部的技术文档、产品手册、运营报告——这些资料积累多了,想让人工智能基于它们回答问题,直接丢给 ChatGPT 不现实。文档量一大,就超出了模型的上下文窗口。RAG(检索增强生成)技术解决的就是这个问题。RA…...

2026年Python+AI工具链环境搭建指南:从零到可用的完整配置

AI辅助创作 | 专栏《2026 AI编程效率革命》第02篇 前言 很多朋友问我:"你用AI写代码效率那么高,是不是有什么秘诀?"说实话,真正的秘诀不在模型本身,而在于环境配置。一个标准化的AI开发环境能让你少踩80%的…...

SAKE基准:音频语言模型听觉属性评估与编辑新方法

1. 项目背景与核心价值音频语言模型正在成为AI领域的新前沿,但如何系统评估和编辑这类模型的听觉属性知识,一直是行业痛点。SAKE基准的提出,相当于给这个领域装上了"调试器"——它首次构建了覆盖音高、音色、响度、节奏等核心听觉维…...

告别黑窗口:用MobaXterm+VSCode搞定服务器上Matplotlib/OpenCV的可视化调试

告别黑窗口:用MobaXtermVSCode搞定服务器上Matplotlib/OpenCV的可视化调试 远程服务器上的机器学习开发常常面临一个尴尬局面:代码能跑通,但图像输出却成了"黑箱操作"。想象一下,你正在调试一个复杂的计算机视觉模型&a…...

撕开AI落地的遮羞布:大模型到底跟什么在死磕?(附架构级深度剖析)

撕开AI落地的遮羞布:大模型到底跟什么在死磕?标题:撕开AI落地的遮羞布:大模型到底跟什么在死磕?(附架构级深度剖析)标签: 架构设计、大模型应用、AI工程化、组织变革、技术商业化 咱…...

基于CPU+GPU架构的雷达信号处理快速实现CUDA【附代码】

✨ 本团队擅长数据搜集与处理、建模仿真、程序设计、仿真代码、EI、SCI写作与指导,毕业论文、期刊论文经验交流。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流,查看文章底部二维码(1)基于CUDA流与共享内存的脉压并行化:雷达…...

为什么.NET 8.0.3 SDK悄悄禁用了主构造函数的隐式字段捕获?微软内部邮件首次公开解读

更多请点击: https://intelliparadigm.com 第一章:C# 13 主构造函数增强实战教程 C# 13 引入了主构造函数(Primary Constructor)的显著增强,允许在类和结构体声明中直接定义参数并自动参与成员初始化,大幅…...