当前位置: 首页 > article >正文

中间件--ClickHouse-4--向量化执行(什么是向量?为什么向量化执行的更快?)

1、向量(Vector)的概念

(1)、向量的定义

  • 向量:在计算机科学中,向量是一组同类型数据的有序集合,例如一个包含多个数值的数组。在数据库中,向量通常指批量数据(如一列数据的多个值组成的集合)。
    理解:Java中的一个int数组或String列表等都算一个向量。
    示例:
向量 A = [1, 2, 3, 4, 5]
  • 向量化(Vectorization):通过单条指令同时对多个数据元素进行操作的技术,例如用一条指令对一个向量中的所有元素执行加法运算。

(2)、向量的特点

  • 同质性:向量中的所有元素都属于同一数据类型
  • 连续性:向量中的数据在内存中是连续存储的,这使得访问和操作非常高效。
  • 批量处理:可以一次性对整个向量进行操作,而不是逐条处理单个元素。

(3)、向量在ClickHouse中的具体形式

  • 数据块(Block):
    ClickHouse将数据按列式存储,每个列的数据被划分为多个数据块(Block)。每个块包含固定数量的行(如8192行),形成一个向量。
    示例:
    列 “age” 的数据块可能包含 [25, 30, 35, 40, …](默认:8192个值)。

  • SIMD寄存器:
    CPU的SIMD(Single Instruction Multiple Data)寄存器(如SSE、AVX)可以同时存储多个数据元素,例如一个 128 位寄存器可存储4个32位整数。向量化执行时,数据块会被加载到这些寄存器中,通过一条指令并行处理多个元素

2、向量化执行的实现方式

(1)、向量化执行的核心思想

传统行式执行(Row-wise)逐行处理数据,而向量化执行以数据块(向量)为单位处理数据,减少循环次数和函数调用开销。
对比示例:
传统行式方式:循环处理每行 → 处理10000行需要10000次循环;

for i in range(len(data)):result[i] = data[i] * data[i]

向量化方式:每次处理一个块(如8192行) → 仅需2次循环。

  result = [x * x for x in data]

解释:
向量化执行通过SIMD指令(如SSE4.2、AVX)对向量中的多个数据同时执行相同操作,一次可以执行8192个数据,所以只需要2次执行即可。

(2)、ClickHouse的向量化执行流程

  1. 数据加载:
    列式数据从磁盘加载到内存,按固定大小(如8192行)划分为数据块。
  2. 批量运算:
    对每个数据块执行操作(如过滤、聚合、计算),利用SIMD指令并行处理多个元素。
  3. 结果合并:
    各数据块的中间结果合并为最终结果。

(3)、向量化与列式存储的结合

  • 列式存储:
    数据按列存储,天然适合批量读取和处理(如只读取需要的列)。
  • 缓存优化:
    连续的列数据块更易被CPU缓存命中,减少内存访问延迟。

3、向量化执行与传统执行方式的对比

(1)、传统行式执行(Row-wise)的局限

在这里插入图片描述

(2)、具体性能提升示例

  • 过滤操作:
    传统方式:遍历每行,判断 WHERE age > 30 → 循环次数多。
    向量化方式:对数据块 age 列的8192个值同时比较 → 一条指令完成。

  • 聚合操作:
    传统方式:逐行累加SUM(age) → 8192次加法。
    向量化方式:将数据块分成多个SIMD向量,每个向量并行累加 → 减少到约2048次加法。

4、向量化执行的核心优势

(1)、减少函数调用开销

  • 传统方式:每行调用函数 → 函数调用次数与行数线性相关。
  • 向量化:按块调用 → 函数调用次数减少 块大小 倍。

(2)、提升CPU缓存效率

  • 连续列式数据块加载到缓存,减少内存带宽占用和延迟。
  • 列式存储结合向量化,可减少I/O和CPU周期。

(3)、利用SIMD并行计算

  • 一条指令处理多个数据元素,例如:
    • SSE4.2:128位寄存器可同时处理4个32位整数。
    • AVX-512:512位寄存器可处理16个32位整数。

(4)、降低控制流开销

  • 传统方式:在逐行执行中,条件判断(如if语句)可能导致分支预测失败,破坏CPU流水线,进而引入性能开销。
  • 向量化:向量化执行可以通过批量处理避免频繁的分支判断,降低了分支预测失败的概率。

5、总结

向量是一组连续存储的同类型数据,可以看作是一维数组。它是批量处理实现的基础。

向量化执行是一种对整个向量(而非单个元素)进行操作的计算方式。它通过减少指令开销、利用SIMD指令集、提高缓存命中率等手段,显著提升了查询性能。

向量化执行是ClickHouse实现高性能的核心技术,其核心思想是批量处理数据并利用SIMD指令并行计算。通过将数据划分为向量(数据块),ClickHouse显著减少了函数调用次数、优化了CPU缓存使用,并充分利用了现代CPU的SIMD能力。与传统行式执行相比,向量化在分析型查询(如过滤、聚合、排序)中性能提升可达 10-100倍,尤其适用于海量数据的OLAP场景。

关键点

  • 向量 = 数据块 + SIMD并行
  • 优势 = 减少开销 + 缓存优化 + 硬件加速
  • 适用场景 = 列式存储 + 分析查询

逆风翻盘,Dare To Be!!!

相关文章:

中间件--ClickHouse-4--向量化执行(什么是向量?为什么向量化执行的更快?)

1、向量(Vector)的概念 (1)、向量的定义 向量:在计算机科学中,向量是一组同类型数据的有序集合,例如一个包含多个数值的数组。在数据库中,向量通常指批量数据(如一列数…...

TDengine 存储引擎剖析:数据文件与索引设计(一)

TDengine 存储引擎简介 在物联网、工业互联网等快速发展的今天,时间序列数据呈爆发式增长。这些数据具有产生频率高、依赖采集时间、测点多信息量大等特点,对数据存储和处理提出了极高要求。TDengine 作为一款高性能、分布式、支持 SQL 的时序数据库&am…...

【kubernetes】pod.spec.containers.ports的介绍

目录 1. 说明2. 基本结构3. 字段说明4. 使用场景5. 示例6. 注意事项 1. 说明 1.在 Kubernetes 中,pod.spec.containers.ports 是 Pod 定义中用于配置容器端口映射的字段,其作用是声明容器需要监听的端口以及如何将这些端口暴露给 Pod 的外部访问。 2. …...

【SpringBoot+Vue自学笔记】001

跟着这位老师学习的:https://www.bilibili.com/video/BV1nV4y1s7ZN?vd_sourceaf46ae3e8740f44ad87ced5536fc1a45 前后端开发技术的全栈课程: Java EE企业级框架:SpringBootMyBatisPlus Web前端核心框架:VueElement UI 公共云…...

第十节:性能优化-如何排查组件不必要的重复渲染?

工具:React DevTools Profiler 方法:memo、shouldComponentUpdate深度对比 React 组件性能优化:排查与解决重复渲染问题指南 一、定位性能问题:React DevTools 高级用法 使用 React Developer Tools Profiler 精准定位问题组件&…...

MATLAB项目实战(一)

题目: 某公司有6个建筑工地要开工,每个工地的位置(用平面坐标系a,b表示,距离单位:km)及水泥日用量d(t)由下表给出.目前有两个临时料场位于A(5,1),B(2,7),日储…...

spring boot 文件下载

1.添加文件下载工具依赖 Commons IO is a library of utilities to assist with developing IO functionality. <dependency><groupId>commons-io</groupId><artifactId>commons-io</artifactId><version>2.6</version> </depe…...

HTTP 2.0 协议特性详解

1. 使用二进制协议&#xff0c;简化传输的复杂性&#xff0c;提高了效率 2. 支持一个 TCP 链接发起多请求&#xff0c;移除 pipeline HTTP/2 移除了 HTTP/1.1中的管道化&#xff08;pipeline&#xff09;机制&#xff0c;转而采用多路复用&#xff08;Multiplexing&#xff0…...

微服务链路追踪:SleuthZipkin

文章目录 Sleuth & Zipkin一、Sleuth\&Zipkin介绍二、搭建环境三、Sleuth入门操作四、Zipkin搭建及操作五、RabbitMQ方式发送信息六、Elasticsearch持久化 SpringBootAdmin一、Actuator介绍二、Actuator快速入门三、SpringBootAdmin介绍四、SpringBootAdmin快速入门4.1…...

HTML语义化与无障碍设计

HTML 语义化与无障碍设计&#xff1a;构建包容且高效的网页体验 引言 在我的前端开发学习旅程中&#xff0c;起初将 HTML 仅视为页面布局的工具&#xff0c;大量使用无语义的 <div> 和 <span>。直到在一篇技术博客当中了解到&#xff0c;作者在一次团队项目中&am…...

java面试篇 4.9(mybatis+微服务+线程安全+线程池)

目录 mybatis&#xff1a; 1、mybatis的执行流程 2、mybatis是否支持延迟加载&#xff1f; 当我们需要去开启全局的懒加载时&#xff1a; 3、mybatis的一级和二级缓存 微服务 1、springcloud五大组件有哪些 2、服务注册和发现是什么意思&#xff1f;springcloud如何实现…...

基于电子等排体的3D分子生成模型 ShEPhERD - 评测

一、背景介绍 ShEPhERD 是一个由 MIT 开发的一个 3D 相互作用感知的 ligand-based的分子生成模型&#xff0c;以 arXiv 预印本的形式发表于 2024 年&#xff0c;被ICLR2025 会议接收。文章链接&#xff1a;https://openreview.net/pdf?idKSLkFYHlYg ShEPhERD 是一种基于去噪扩…...

极狐GitLab 功能标志详解

极狐GitLab 是 GitLab 在中国的发行版&#xff0c;关于中文参考文档和资料有&#xff1a; 极狐GitLab 中文文档极狐GitLab 中文论坛极狐GitLab 官网 功能标志 (BASIC ALL) 使用功能标志&#xff0c;您可以将应用程序的新功能小批量部署到生产环境中。您可以为部分用户打开和…...

GR00T N1:面向通用类人机器人的开放基础模型

摘要 通用型机器人需要具备多功能的身体和智能的大脑。近年来&#xff0c;类人机器人的发展在构建人类世界中的通用自主性硬件平台方面展现出巨大潜力。一个经过大量多样化数据源训练的机器人基础模型&#xff0c;对于使机器人能够推理新情况、稳健处理现实世界的多变性以及快…...

QT简单实例

QT简单实例 QT简单实例一&#xff1a;通过拖动创建1.创建工程2.拖动控件实现响应3.文件目录3.1 TestQDialog.pro3.2 main.cpp3.3 dialog.h3.4 dialog.cpp 二&#xff1a;通过动态创建1.创建工程2.文件目录2.1 TestQDialogSelf.pro2.2 main.cpp2.3 dialog.h2.4 dialog.cpp QT简单…...

Linux:初学者的简单指令

文章目录 pwd&#xff08;Print working directory&#xff09;whoamilsmkdir ~~cd ~~touch ~~rm ~~ 充当后端服务,我们用xshell工具来进行操作 其中Linux文件是/目录/目录/目录或文件/来表示的&#xff08;其中目录可以看作是windows操作系统的文件夹&#xff0c;只是Linux中…...

zynq7020 ubuntu_base 跟文件系统

整体流程 制作 ubuntu_base 镜像运行 petalinux 构建的 ramdisk 系统用 ramdisk 系统把 ubuntu_base 镜像烧录到 emmc从 emmc 跟文件系统 启动内核 制作 ubuntu_base 镜像 制作 ubuntu_base 镜像 sudo apt-get install qemu-user-static # 安装 q…...

大数据如何让供应链更丝滑?一场数据驱动的效率革命

大数据如何让供应链更丝滑&#xff1f;一场数据驱动的效率革命 在这个一切讲求“快准狠”的时代&#xff0c;供应链的管理直接决定了企业的竞争力。你能想到吗&#xff1f;一个订单的配送延迟&#xff0c;可能让客户流失&#xff1b;一个采购决策的失误&#xff0c;可能导致库…...

端侧大模型综述On-Device Language Models: A Comprehensive Review

此为机器翻译&#xff0c;仅做个人学习使用 设备端语言模型&#xff1a;全面回顾 DOI&#xff1a;10.48550/arXiv.2409.00088 1 摘要 大型语言模型 &#xff08;LLM&#xff09; 的出现彻底改变了自然语言处理应用程序&#xff0c;由于减少延迟、数据本地化和个性化用户体验…...

量子安全邮件系统 —— 量子随机数生成器集成

目录 量子安全邮件系统 —— 量子随机数生成器集成一、项目背景与简介二、量子随机数生成器的理论基础三、系统架构设计3.1 模块划分3.2 系统架构图(Mermaid示意图)四、关键算法与技术实现4.1 量子数据采集与预处理4.2 随机数生成算法4.3 安全性与随机性检验五、GUI设计与系统…...

python实现音视频下载器

一、环境准备 确保当前系统已安装了wxPython 、 yt-dlp 和FFmpeg。当前主要支持下载youtube音视频 1、安装wxPython pip install wxPython2、安装yt-dp pip install wxPython yt-dlp3、安装FFmpeg 在Windows 10上通过命令行安装FFmpeg&#xff0c;最简便的方式是使用包管理…...

三、小白如何用Pygame制作一款跑酷类游戏(按键图片和距离的计算)

三、小白如何用Pygame制作一款跑酷类游戏&#xff08;实现移动距离的计算&#xff0c;以及按键指引的添加&#xff09; 文章目录 三、小白如何用Pygame制作一款跑酷类游戏&#xff08;实现移动距离的计算&#xff0c;以及按键指引的添加&#xff09;前言一、创建字体文件夹1.可…...

H5:实现安卓和苹果点击下载App自动跳转到对应的应用市场

一、需求场景 手机扫描下载App&#xff0c;需要根据不同手机自动跳转到对应的应用市场&#xff08;商店&#xff09;里&#xff0c;苹果手机直接打开App Store里指定的app页面&#xff0c;安卓手机如果是海外用户则打开GooglePlay 商店里指定的app页面&#xff0c;国内直接下载…...

【Linux】文件传输归档与压缩

目录 配置实验环境 文件传输方法--scp&#xff0c;rsync scp rsync 归档与压缩--tar&#xff0c;gz&#xff0c;bz2&#xff0c;xz&#xff0c;zip 归档---tar 压缩 zip gzip bzip2 xz 归档并压缩 gz bz2 xz 拓展du 配置实验环境 在多个linux系统进行系统传输…...

3D人脸扫描技术如何让真人“进入“虚拟,虚拟数字人反向“激活“现实?

随着虚拟人技术的飞速发展&#xff0c;超写实数字人已经成为数字娱乐、广告营销和虚拟互动领域的核心趋势。无论是企业家、知名主持人还是明星&#xff0c;数字分身正在以高度还原的形象替代真人参与各类活动&#xff0c;甚至成为品牌代言、直播互动的新宠。 3D人脸扫描&#…...

Git标签的认识

Git标签完全指南&#xff1a;从基础到企业级发布策略 前言 在软件发布领域&#xff0c;Git标签是版本管理的基石。根据2023年GitHub年度报告显示&#xff0c;85%的开源项目使用标签进行版本控制。然而&#xff0c;许多开发者仅停留在git tag的基础使用层面&#xff0c;未能充分…...

Docker实战:从零构建高可用的MySQL主从集群与Redis集群

在分布式系统架构中&#xff0c;数据库集群是保障数据高可用和性能的关键组件。本文将通过Docker技术&#xff0c;手把手教你搭建MySQL主从集群和Redis Cluster&#xff0c;并分享独创的优化技巧与运维实战经验。 一、为什么选择Docker部署集群&#xff1f; 传统数据库集群搭…...

【Rust基础】使用Rocket构建基于SSE的流式回复

背景 我们正在使用Rust开发基于RAG的知识库系统&#xff0c;其中对于模型的回复使用了常用的SSE&#xff0c;Web框架使用Rocket&#xff0c;Rocket提供了一个简单的方式支持SSE&#xff0c;但没有会话保持、会话恢复等功能&#xff0c;因此我们自己简单实现这两个功能。 使用R…...

高级java每日一道面试题-2025年4月07日-微服务篇[Nacos篇]-如何监控Nacos的运行状态?

如果有遗漏,评论区告诉我进行补充 面试官: 如何监控Nacos的运行状态&#xff1f; 我回答: 监控Nacos运行状态的综合方案 在Java高级面试中&#xff0c;监控Nacos运行状态是一个重要的技术点&#xff0c;它直接关系到微服务架构的稳定性和性能。以下是一个综合的监控方案&am…...

【3GPP核心网】【5G】精讲5G系统的策略和计费控制框架

1. 欢迎大家订阅和关注,精讲3GPP通信协议(2G/3G/4G/5G/IMS)知识点,专栏会持续更新中.....敬请期待! 目录 1. 系统架构 1.1 非漫游架构 1.2 漫游架构 1.3 支持Rx接口 2. 服务化接口及参考点 2.1 PCF 与 AF 间接口 2.2 PCF与SMF间接口 2.3 PCF与AMF间接口 2.4 V-PC…...