OceanBase:列存储
目录
1、列存储的定义
1、默认创建列存表
3、指定创建列存表
4、指定创建列存行存冗余表
5、行、列存储查询测试
1、列存储的定义
- 行存储(Row-based Storage):行存储是以行为单位进行组织和存储数据。在这一模式下,数据库将一条记录的所有字段作为一个整体存储在一起,即每一行数据的所有信息连续存放。这种结构类似于我们在表格中看到的数据布局,每一行代表一个实体的完整信息。行式存储常见于传统的关系型数据库管理系统(RDBMS),如MySQL、Oracle、SQL Server等,它适合需要经常进行整行读写操作的场景,如事务处理系统(OLTP)。
- 列存储(Column-based Storage): 列存储则是以列为单位进行组织和存储数据。在这种模式下,数据库将表中同一列的所有数据放在一起存储,不同列的数据分开存放。这意味着,每一列的数据在物理上是连续的,而属于同一行的不同列数据则可能分布在不同的位置。列式存储非常适合于数据分析和数据仓库应用,因为它允许对单个或部分列进行高效的查询和压缩,仅需读取查询所涉及的列,从而大幅减少I/O操作和提升分析查询的性能。列式存储的代表有Druid、Kudu、ClickHouse等系统,它们在大数据分析和在线分析处理(OLAP)场景中表现优异。

注:图片来源于网络
OceanBase 4.3 版本基于LSM-Tree 架构基础进行扩展,正式推出列存引擎,在一个架构、一个数据库上,实现了列存和行存数据存储一体化,兼顾 TP 和 AP 查询性能。
1、默认创建列存表
1) 修改表默认存储类型
# 查看表默认存储类型
show parameters like 'default_table_store_format'\G;
# 修改表默认存储类型
alter system set default_table_store_format = "column";

2)创建列存表
CREATE TABLE `dim_area` (
`id` bigint NOT NULL AUTO_INCREMENT,
`level` int NOT NULL,
`parent_code` varchar(20) NOT NULL,
`area_code` varchar(20) NOT NULL,
`name` varchar(50) NOT NULL,
`short_name` varchar(50) NOT NULL,
`merger_name` varchar(50) NOT NULL,
`pinyin` varchar(30) NOT NULL,
`lng` decimal(10,6) NOT NULL,
`lat` decimal(10,6) NOT NULL,
`pcode` varchar(2) DEFAULT NULL,
`ccode` varchar(2) DEFAULT NULL,
`acode` varchar(2) DEFAULT NULL,
`tcode` varchar(3) DEFAULT NULL,
`vcode` varchar(3) DEFAULT NULL,
PRIMARY KEY (`id`)
);

3、指定创建列存表
通过with column group 指定创建列存表:
CREATE TABLE `dim_area_c` (
`id` bigint NOT NULL AUTO_INCREMENT,
`level` int NOT NULL,
`parent_code` varchar(20) NOT NULL,
`area_code` varchar(20) NOT NULL,
`name` varchar(50) NOT NULL,
`short_name` varchar(50) NOT NULL,
`merger_name` varchar(50) NOT NULL,
`pinyin` varchar(30) NOT NULL,
`lng` decimal(10,6) NOT NULL,
`lat` decimal(10,6) NOT NULL,
`pcode` varchar(2) DEFAULT NULL,
`ccode` varchar(2) DEFAULT NULL,
`acode` varchar(2) DEFAULT NULL,
`tcode` varchar(3) DEFAULT NULL,
`vcode` varchar(3) DEFAULT NULL,
PRIMARY KEY (`id`)
) with column group (each column);

4、指定创建列存行存冗余表
在某些场景下,用户可以容忍一定程度的数据冗余,以满足 AP/TP 业务场景的双重需求。此时,可以增加行存数据的冗余,通过 `with column group` 语法增加指定 `all columns` 即可实现。
CREATE TABLE `dim_area_a` (
`id` bigint NOT NULL AUTO_INCREMENT,
`level` int NOT NULL,
`parent_code` varchar(20) NOT NULL,
`area_code` varchar(20) NOT NULL,
`name` varchar(50) NOT NULL,
`short_name` varchar(50) NOT NULL,
`merger_name` varchar(50) NOT NULL,
`pinyin` varchar(30) NOT NULL,
`lng` decimal(10,6) NOT NULL,
`lat` decimal(10,6) NOT NULL,
`pcode` varchar(2) DEFAULT NULL,
`ccode` varchar(2) DEFAULT NULL,
`acode` varchar(2) DEFAULT NULL,
`tcode` varchar(3) DEFAULT NULL,
`vcode` varchar(3) DEFAULT NULL,
PRIMARY KEY (`id`)
) with column group (all columns, each column);

5、行、列存储查询测试
测试环境采用单机部署,同一个数据库中建两个相同结构的表,一个是行存储,一个是列存储,两个表的数据也是一样的,所有资源配置都是一样的,测试查询结果如下:
1)统计总记录数
#行存储
select count(id) from dim_user;
#列存储
select count(id) from dim_user_c;

2)分组统计记录数
#行存储
select pcode,count(id) from dim_user group by pcode;
#列存储
select pcode,count(id) from dim_user_c group by pcode;

相关文章:
OceanBase:列存储
目录 1、列存储的定义 1、默认创建列存表 3、指定创建列存表 4、指定创建列存行存冗余表 5、行、列存储查询测试 1、列存储的定义 行存储(Row-based Storage):行存储是以行为单位进行组织和存储数据。在这一模式下,数据库将…...
Rust:WIndows 环境下交叉编译 Linux 平台程序
在Windows下交叉编译Rust程序以在x86_64位的CentOS操作系统上运行,你需要遵循几个步骤来设置交叉编译环境并编译你的程序。以下是一个大致的指南: 1. 安装Rust和Cargo 首先,确保你已经在Windows上安装了Rust和Cargo。你可以从Rust官方网站下…...
从零学爬虫:使用比如说说解析网页结构
新书上架~👇全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我👆,收藏下次不迷路┗|`O′|┛ 嗷~~ 目录 一、引言 二、网页结构概述 示例:查看网页结构 三、使用比如说说解析网页 1.…...
C#数据类型变量、常量
一个变量只不过是一个供程序操作的存储区的名字。 在 C# 中,变量是用于存储和表示数据的标识符,在声明变量时,您需要指定变量的类型,并且可以选择性地为其分配一个初始值。 在 C# 中,每个变量都有一个特定的类型&…...
Java高级面试问题及答案
Java高级面试问题及答案 问题1: 请描述Java内存模型(JMM)及其在并发编程中的重要性。 探讨过程: 在并发编程中,多个线程之间如何协调对共享变量的访问是一个核心问题。Java内存模型定义了一组规则,来确保在多线程环境中对共享变量的修改能够…...
出现 Transaction rolled back because it has been marked as rollback-only 解决方法
目录 1. 问题所示2. 原理分析3. 解决方法1. 问题所示 用户反馈的Bug如下所示: Transaction rolled back because it has been marked as rollback-only截图如下: 浏览器终端同样显示: 2. 原理分析 错误表明,在事务的生命周期内,遇到了某个异常或条件,导致该事务被标记…...
数据结构算法题day03
数据结构算法题day03 题目 题目 2.设计一个高效算法,将顺序表L的所有元素逆置,要求算法的空间复杂度为O(1)算法思想: 1、常规的解法: Void reverse (sqlist &L){Elemtype temp; //辅助变量for(i 0,i < L.length; i){temp…...
深入分析C#中的“编写器”概念——代码修改、注解与重构
文章目录 1. 编写器(Writer)的概念2. 编写器的作用和工作原理3. 编写器的重要性4. 写入器常用方法5. 写入器示例6. 编写器示例——使用Fody进行代码注解和重构7. 总结 在软件开发过程中,代码的维护和更新是至关重要的。C#作为一种流行的编程语…...
uview1.0 u-form表单回显校验不通过
提交到后端的数据,回显后不做任何修改无法通过表单校验 原因,u-form表单校验的类型默认为string,但是后端返回的是integer类型,导致无法通过校验 解决,既然后端返回的是整数形,那么我们就将校验规则的type…...
监控员工电脑的软件有哪些,不得不说这几款电脑监控软件太好用了
监控员工电脑的软件在市场上种类繁多,以下是几款备受好评的电脑监控软件,它们各自具有独特的功能和优势,选择前必须了解一下才能做成正确决定。 1.安企神: 这款软件支持7天试用测试,获取测试版请移驾 ↓↓↓ 安企神…...
【MySQL精通之路】索引优化(2)
目录 1 MySQL如何使用索引 2 主键优化 3 空间索引优化 4 外键优化 5 列索引 6 多列索引 7 验证索引使用情况 8 InnoDB和MyISAM索引统计集合 9 B树索引与哈希索引的比较 9.1 B-树索引特征 9.2 哈希索引特征 10 索引扩展的使用 11 优化器使用生成的列索引 12 不可见…...
VUE3 学习笔记(5):数组处理、计算属性与函数、class与Style绑定
数组监测处理方法 VUE 提供了关于数组处理的直接方法,但并非全部都是可以处理的 如下可以直接处理: .push --向数组中增加 .pop --从数组中最后减去一个元素 .shift --从数组中第一个减去一个元素 .unshift --在数组中的头部添加一个元素 .splice --自定…...
基于springboot实现大学生一体化服务平台系统项目【项目源码+论文说明】
基于springboot实现大学生一体化服务平台系统演示 摘要 如今社会上各行各业,都喜欢用自己行业的专属软件工作,互联网发展到这个时候,人们已经发现离不开了互联网。新技术的产生,往往能解决一些老技术的弊端问题。因为传统大学生综…...
惠海 H6902B 升压恒流芯片 太阳能 风扇灯 应急灯 支持3.7V 5V 7.4V
惠海H6902B升压恒流驱动芯片是一款专为LED照明应用设计的驱动方案。该芯片具有多项产品特征,能够满足多种LED照明需求。 适用于多种电压输入范围(2.7V-80V)并具备效率(达95%以上)和工作频率(1MHzÿ…...
体验SmartEDA的高效与便捷,电子设计从未如此简单
SmartEDA:革新电子设计,让高效与便捷触手可及 在快节奏的现代生活中,科技日新月异,各行各业都在寻求更高效、更便捷的解决方案。对于电子设计行业而言,SmartEDA的出现,无疑是一场革命性的变革。它以其高效…...
LangChain笔记
很好的LLM知识博客: https://lilianweng.github.io/posts/2023-06-23-agent/ LangChain的prompt hub: https://smith.langchain.com/hub 一. Q&A 1. Q&A os.environ["OPENAI_API_KEY"] “OpenAI的KEY” # 把openai-key放到环境变量里&…...
金融序列的布朗运动
https://zhuanlan.zhihu.com/p/659164160 python金融衍生品定价系列之一 —— 布朗运动与伊藤公式 导语:网络上和书本上关于期权定价相关的内容已经较为丰富,但将理论和python代码结合起来讲的却很少,这也是python金融衍生品定价系列的写作初衷,在用python实现相关模型的同…...
利用ChatGPT辅助数学建模竞赛:理清思路、解题技巧与实战经验
导言 数学建模竞赛是许多学生在学术领域追求卓越的重要途径之一。然而,竞赛题目的复杂性常常让人望而生畏。在这样的情况下,利用人工智能工具,如ChatGPT,可以极大地辅助我们快速理清思路、解题技巧与实战经验。本文将探讨如何利用ChatGPT在数学建模竞赛中取得更好的成绩,…...
Java基础——Optional
Optional 类主要解决的问题是臭名昭著的空指针异常NPE(NullPointerException) 在 Java 8 之前,任何访问对象方法或属性的调用都可能导致 NullPointerException: String isocode user.getAddress().getCountry().getIsocode().to…...
Mask R-CNN实战
一、源码和数据集的准备 获取git开源项目代码 https://github.com/matterport/Mask_RCNN 一下载2.1的前三个文件,和2.0的第一个h5文件,coco.h5是预训练权重,也放入源码 项目文件结构如下: samples/logs:训练模型保存的位置 配置…...
别再死记硬背二进制转换了!用Python写个自动转换工具,顺便搞懂CPU是怎么算的
用Python打造二进制转换工具:从代码实践理解CPU运算本质 当我们在编程中遇到需要处理二进制数据时,是否曾对背后的计算机原理产生好奇?本文将通过构建一个Python数制转换工具,带你穿透代码表层,深入理解CPU如何处理二…...
从零到英雄:用AI瞄准技术彻底改变你的FPS游戏体验
从零到英雄:用AI瞄准技术彻底改变你的FPS游戏体验 【免费下载链接】yolov8_aimbot Aim-bot based on AI for all FPS games 项目地址: https://gitcode.com/gh_mirrors/yo/yolov8_aimbot 你是否曾经在激烈的枪战中因为瞄准不准而错失良机?是否羡慕…...
5分钟快速搭建Windows RTMP流媒体服务器:新手完整指南
5分钟快速搭建Windows RTMP流媒体服务器:新手完整指南 【免费下载链接】nginx-rtmp-win32 Nginx-rtmp-module Windows builds. 项目地址: https://gitcode.com/gh_mirrors/ng/nginx-rtmp-win32 想要在Windows系统上搭建自己的直播服务器吗?nginx…...
智能设计时代的企业VI物料采购:小批量定制降本增效实践
核心摘要 在智能设计与柔性供应链深度融合的背景下,企业可通过一体化在线平台实现“品牌周边”小批量定制,将传统跨环节采购转为单线闭环,显著降低沟通与试错成本。小批量定制的核心价值:打破传统印厂起订量限制,按需…...
免费暗黑2存档编辑器终极指南:3分钟成为游戏存档修改大师
免费暗黑2存档编辑器终极指南:3分钟成为游戏存档修改大师 【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 还在为暗黑破坏神2的存档问题烦恼吗?角色属性不够强、装备不理想、任务进度丢失……现在…...
别再外挂EEPROM了!手把手教你用STM32G0内部Flash存数据(寄存器操作,附完整工程)
解锁STM32G0内部Flash潜能:寄存器级数据存储实战指南 在嵌入式系统设计中,外置EEPROM芯片曾是存储配置参数的标配方案。但当我们使用STM32G0这类现代微控制器时,其内部丰富的Flash资源其实可以完美替代外部存储芯片。本文将带您深入探索如何…...
不止于配置:用Qt给周立功CAN卡写个简易数据收发测试工具(附源码)
从零构建Qt版CAN数据收发测试工具:周立功硬件实战指南 在嵌入式开发领域,CAN总线调试是工程师日常工作中的高频需求。当我们需要验证硬件连接是否正常、测试通信质量或快速检查数据流时,一个轻量级的图形化测试工具能极大提升工作效率。本文将…...
集装箱箱号与ISO代码区域检测数据集VOC+YOLO格式887张2类别
数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数):887标注数量(xml文件个数):887标注数量(txt文件个数):887标注类别数&…...
5个关键步骤:让你的Windows视频播放体验达到专业级水准
5个关键步骤:让你的Windows视频播放体验达到专业级水准 【免费下载链接】VideoRenderer Внешний видео-рендерер 项目地址: https://gitcode.com/gh_mirrors/vi/VideoRenderer 你是否曾经在Windows上观看高质量视频时,感觉画…...
在树莓派等arm设备上观测大模型API调用的延迟与稳定性表现
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在树莓派等ARM设备上观测大模型API调用的延迟与稳定性表现 在边缘计算或资源受限的环境中,例如使用树莓派等基于ARM架构…...
