【列存储学习总结】
在 OpenGauss 中,列存储是一种高效的数据存储方式,它在处理分析查询和数据仓库工作负载时具有很高的性能优势。列存储将表中的数据按列存储在磁盘上,而不是按行存储,这样可以极大地提高数据读取和分析操作的效率。当涉及大量数据的扫描、聚合和过滤操作时,列存储可以比传统的行存储方式更加高效。
列存储是一种优化技术,用于在数据库系统中存储和查询大量数据。与传统的行存储方式不同,列存储将每个列的数据分别存储在独立的存储单元中,而不是按照行的方式存储。这种存储方式在分析性查询、聚合操作和大规模数据处理等场景下具有很大的优势。
行、列存储模型各有优劣,建议根据实际情况选择。通常openGauss用于OLTP(联机事务处理)场景的数据库,默认使用行存储,仅对执行复杂查询且数据量大的OLAP(联机分析处理)场景时,才使用列存储。默认情况下,创建的表为行存储。行存储和列存储的差异如下图所示:

列存储的特点和优势:
- 压缩效率高:由于相同类型的数据在列中是连续存储的,可以采用更加高效的压缩算法,从而减少存储空间的使用。
- 数据读取效率高:在查询中只加载需要的列,减少了不必要的数据传输,提高了查询效率。
- 聚合操作效率高:在列存储中,同一列的数据相邻存储,这样在进行聚合操作时只需要对该列中的数据进行计算,减少了不必要的读取和计算。
- 列存储适合分析性查询:分析性查询通常涉及多个列的聚合和筛选操作,列存储的存储方式更适合这种场景,可以提高查询效率。
- 适用于大规模数据处理:列存储在大规模数据处理、数据仓库等场景中具有明显的性能优势,能够更好地支持复杂的分析任务。
在先前的学习中,我通过很多文章来对列存储的一些模块进行了学习,以下为总结了先前所有列存储的文章学习连接:
| 文章 | 连接 |
| 列存储(Copy)相关 | 【 OpenGauss源码学习 —— 列存储(CopyTo)】-CSDN博客 【OpenGauss源码学习(CopyOneRowTo)】-CSDN博客 |
| 列存储介绍相关 | 【OpenGauss源码学习 —— 列存储(创建表)】-CSDN博客 |
| 列存储(Insert)相关 | 【 OpenGauss源码学习 —— 列存储(Insert)】_J.Kuchiki的博客-CSDN博客 |
| 列存储(analyze)相关 | 【 OpenGauss源码学习 —— 列存储(analyze)(一)】_J.Kuchiki的博客-CSDN博客 【 OpenGauss源码学习 —— 列存储(analyze)(二)】-CSDN博客 【 OpenGauss源码学习 —— 列存储(analyze)(三)】-CSDN博客 【 OpenGauss源码学习 —— 列存储(analyze)(四)】-CSDN博客 |
| 列存储(autoanalyze)相关 | 【 OpenGauss源码学习 —— 列存储(autoanalyze)(一)】-CSDN博客 【 OpenGauss源码学习 —— 列存储(autoanalyze)(二)】-CSDN博客 【 OpenGauss源码学习 —— 列存储(update_pages_and_tuples_pgclass)】-CSDN博客 |
| 列存储(CU)相关 | 【 OpenGauss源码学习 —— 列存储(CU)(一)】-CSDN博客 【 OpenGauss源码学习 —— 列存储(CU)(二)】-CSDN博客 |
以上便为目前我所学习的内容,在后续的学习中,我也会持续不断地完善和更新更多有关列存的模块知识。
相关文章:
【列存储学习总结】
在 OpenGauss 中,列存储是一种高效的数据存储方式,它在处理分析查询和数据仓库工作负载时具有很高的性能优势。列存储将表中的数据按列存储在磁盘上,而不是按行存储,这样可以极大地提高数据读取和分析操作的效率。当涉及大量数据的…...
小记java正则表达式中matcher.find() 和 matcher.matches() 的区别
matcher.find() 顾名思义,find为查找,其功能为查找字符串中是否有符合条件的字串(包含本身),当查找到时即返回true,更多地与matcher.group(int i) 配合使用,用于从字符串中取出特定字串。 mat…...
当中国走进全球化的“深水区”,亚马逊云科技解码云时代的中国式跃升
中国跨境贸易中支付金融与服务领域的综合创新型企业连连国际的联席CEO沈恩光发现,眼下,很多跨境电商的出海方式已发生了变化。几年前,它们还主要借助第三方电商平台,而现在,更多公司开始选择通过自主渠道进入海外市场&…...
零基础Linux_21(多线程)页表详解+轻量级进程+pthread_create
目录 1. 页表详解 1.1 权限条目页框 1.2 页目录页表项 2. 线程的概念 2.1 轻量级进程 2.2 Linux的线程 2.3 pthread_create 2.4 原生线程库LWP和PID 3. 线程的公有资源和私有资源 3.1 线程的公有资源 3.2 线程的私有资源 4. 线程的优缺点 4.1 线程的优点 4.2 线程…...
nodejs+wasm+rust debug及性能分析
文章目录 背景v8引擎自带的profilelinux的perf采集wasm三方库性能分析编译debug版本wasmrust程序debug调试异常模型正常模型结论优化 参考 Node使用火焰图优化CPU爆涨 - 掘金 【Node.js丨主题周】理解perf 与火焰图-腾讯云开发者社区-腾讯云 Easy profiling for Node.js Applic…...
IP证书针对公网IP签发
很多项目应用需要采用IP地址数据桥接访问,这种情况下需要确保数据安全性及信任不被劫持的情况下,需要使用给IP地址增加数字证书进行保护。针对这种情况下我们对公网IP地址申请SSL证书做了详细的介绍,让我们可以更快地了解如何用IP地址去申请S…...
SpringBoot-集成Minio
官方文档:Kubernetes 的 MinIO 对象存储 — MinIO Object Storage for Kubernetes 一、简介 Minio 是一个基于Apache License v2.0开源协议的对象存储服务。它兼容亚马逊S3云存储服务接口,非常适合于存储大容量非结构化的数据,例如图片、视频…...
【ML】cheatsheet
LR 原理与面试题目DT, Adaboost, GBDT, xgboost 原理 细节 与 例子 https://www.cnblogs.com/createMoMo/p/12635709.html xgboost挺详细的算法原理与例子 https://zhuanlan.zhihu.com/p/660468945 着重lightgbm就xgboost的改善方向 https://zhuanlan.zhihu.com/p/366952043机器…...
【字符串】【将字符数组转为字符串】Leetcode 122 路径加密
【将字符数组转为字符串】Leetcode 122 路径加密 解法1 在Java中,char数组没有直接的toString()方法来将其转换为字符串。如果你想将char数组转换为字符串,可以使用String类的构造函数来实现: ⭐️⭐️⭐️⭐️⭐️⭐️⭐️⭐️⭐️⭐️⭐️⭐…...
网络基础知识100问
1.什么是链接? 链接是指两个设备之间的连接。它包括用于一个设备能够与另一个设备通信的电缆类型和协议。 2.OSI 参考模型的层次是什么? 有 7 个 OSI 层:物理层,数据链路层,网络层,传输层,会话层,表示…...
女孩子就是要打扮漂亮,让童年不留遗憾
好的衣服当然要分享给好看的人啦! 百搭圆领卫衣,经典版型不挑人穿 复合奥利绒面料,罗纹收口设计 时尚百搭怎么穿都好看 单穿内搭都可以 卡通鹅真的好可爱 宝贝穿上去真的元气满满哦...
实现目录数据的上移(up)、下移(down)、置顶(top)、置底(bottom)的操作
ApiOperation("8-15 交接班-标签设置排序")ApiImplicitParams({ApiImplicitParam(name "id", value "id", dataType "string", required true),ApiImplicitParam(name "orgnCode", value "机构代码", dataT…...
Ubuntu 常用命令
文章目录 Linux 目录结构常用命令ls:查看目录内容pwd:查看当前目录绝对路径cd:切换目录mkdir:创建目录rm:删除文件/目录touch:创建空文件mv:移动和重命名文件/目录cp:复制粘贴cat&am…...
如何空手套白狼?一口气省7K再抓住一个7K起步的工作?
今日话题,教你如何省七千再得到一个七千起步的技能!现在网络行业已经是全世界重点发展的目标,开发行业更是各个企业重点培养,但是在学校教的网络知识太基础太老掉牙?报班随便就是小一万该如何是好呢?解决方…...
电脑主机如何选择内存条
选择计算机主机的内存模块(内存条)通常需要考虑以下因素: 类型和代数(DDR3、DDR4、DDR5等):您的主板和处理器支持的内存类型非常重要。确保内存条的类型与您的主板和处理器兼容。 容量:内存容量…...
计算机考研自命题(5)
1、C语言–求和 1、展开式求和。输入一个实数x,计算并输出下式的和,直到最后一项的绝对值小于0.00001.计算结果保留2位小数,试编程。 S x x/2! x/3! … /* 算法思想:定义一个求阶乘的函数fact(), 头文件调…...
【原创】c语言4种字符串函数的代码测试
c语言4种字符串函数的代码测试 1.字符串拼接strcat [contact] 2.字符串复制strcpy 3.带参数的字符串复制strncpy 4.字符串比较strcmp:比第一个不同字母的ascii码,如acb>abc #include<stdio.h> #include<string.h>int main() {char s1[]&…...
扩散模型学习——代码学习
文章目录 引言正文UNet网络结构训练方法DDPM采样方法讲解Context上下文信息添加DDIM的方法详解 总结参考 引言 这是第一次接触扩散模型,为了学习,这里好好分析一下他的代码 正文 UNet网络结构 这部分主要是定义一下网络结构,以及相关的网…...
redis 数据结构
一、为什么要扒一下底层技术 首先我是一个解决方案工程师,为什么要看redis底层的设计呢?总结下来分几点: 1. 让系统跑起来更放心 2. 面试中可以对跟对面的牛马侃大山、吹🐮 3. 虚一点,举一反三,学习一下…...
node.js中express框架cookie-parser包设置cookie的问题
后端使用node.js express cookie-parser技术栈设置cookie的时候出现了无法成功设置的问题 前端发送axios请求部分代码: axios({method: "post",data: {content: remark,relatedArticles: relatedArticleId,userId: userId,userEmail: userEmail,topRema…...
微信小程序物流查询插件接入全攻略:从资质申请到waybill_token获取(附完整代码)
微信小程序物流查询插件深度接入指南:全流程解析与实战代码 最近在帮一个电商客户优化小程序时,发现物流查询功能直接影响了30%的用户留存率。微信官方提供的物流查询插件确实能解决这个问题,但接入过程中遇到的坑比想象中多得多。今天就把完…...
GLM-OCR硬件优化指南:为GPU部署调整显存与算力配置
GLM-OCR硬件优化指南:为GPU部署调整显存与算力配置 如果你正在尝试部署GLM-OCR模型,是不是也遇到过这样的困惑:明明选了看起来不错的GPU,但推理时要么爆显存,要么速度慢得让人着急,钱花了效果却没达到预期…...
告别熬夜!揭秘CSDNer私藏的PPT生成神器
一、PPT 制作之痛:传统与现状在日常的工作与学习中,PPT(PowerPoint)演示文稿已然成为信息展示和沟通的重要工具。无论是商务汇报、学术演讲,还是课堂教学,一份制作精良的 PPT 都能极大地提升信息传递的效果…...
程序员十年职场经验:技术成长与生存法则
1. 程序员十年成长的血泪经验谈作为一个在代码堆里摸爬滚打十多年的老程序员,今天想和各位同行特别是刚入行的年轻开发者们聊聊那些只有时间才能教会你的事。这十年来我换过5家公司,辗转3个城市,从月薪3000到年薪百万,从单身汉到两…...
python jira
# 聊聊 Python JIRA 这个库 平时做项目管理和开发流程对接的时候,经常需要和 JIRA 这类工具打交道。如果每次都手动在网页上点来点去,效率实在太低。这时候 Python JIRA 库就派上用场了。 它到底是什么 简单来说,Python JIRA 是一个用来和 JI…...
别死记硬背了!用Python代码可视化理解离散数学中的集合与关系
用Python代码可视化理解离散数学中的集合与关系 离散数学是计算机科学的基石之一,而集合论作为其核心组成部分,常常让初学者感到抽象难懂。传统的数学教材往往侧重于理论推导和符号表达,这对于习惯了动手实践的编程学习者来说,可能…...
如何建立机制,制度和流程,机制,先有的机制还是先有的制度?
一、机制 vs 制度:先有谁? 结论:通常先有制度(规则),后有机制(运行方式);但实践中常交替形成。 制度(静态规则)是明文规定、硬约束:能…...
人类退化警报:依赖AI导致海马体萎缩3%
来自技术前沿的认知警报作为一名软件测试从业者,我们每日与算法、代码和自动化工具为伍。测试用例自动生成、缺陷智能预测、UI自动化脚本一键录制——人工智能正以前所未有的效率重塑我们的工作流。然而,当技术大会的演讲者激情描绘着“AI赋能测试”的未…...
别再让大模型瞎猜了!用这个提示词模板,轻松搞定多跳问题检索(附Qwen2.5-7B实测效果)
解锁小模型潜力:多跳问题检索的提示词工程实战指南 在构建基于大语言模型的检索增强生成(RAG)系统时,开发者常面临一个棘手问题:当用户提出需要多步推理的复杂查询时,直接使用原始问题检索往往效果不佳。这…...
Speechless:微博内容永久保存的终极解决方案
Speechless:微博内容永久保存的终极解决方案 【免费下载链接】Speechless 把新浪微博的内容,导出成 PDF 文件进行备份的 Chrome Extension。 项目地址: https://gitcode.com/gh_mirrors/sp/Speechless 当你多年积累的微博内容因平台政策调整突然消…...
