当前位置: 首页 > news >正文

clickhouse入门

clickhouse

1 课程介绍

和hadoop无关,俄罗斯,速度快

3 介绍&特点

1 列式存储

在线分析处理。
使用sql进行查询。列式存储更适合查询分析的场景。新增时候有一个寻址的过程。更容易进行压缩行式存储。增删改查都需要的时候。

2 DBMS功能

包括ddl,dml和各种函数,用户权限管理,数据备份恢复。

3 多样化引擎

innodb 提供了事务。
合并树,日志,接口等二十多种引擎。

4 高吞吐写入能力

LSM tree
数据写入后定期在后台合并。
更新,老的数据新的数据都在,新增字段作为标记,版本号(大代表新的数据)在数据写入时是顺序写。
merge sort
合并期间不能对外提供服务。

5 数据分区与线程级并行

partition->index->多个cpu核心分别处理其中一部分实现并行数据处理。
单条查询能利用整机的所有cpu。
极强的并行处理能力,对于高qps并不强(query per second 每秒查询次数)
cpu是一个瓶颈。不适合做初始的存储
适合处理过的数据,大量宽表。(指的是都已经关联好了的表)
尽量避免做join,和底层实现原理有关。
多表对性能影响很大的。
右边那种表加载到内存。
分布式,一张表存在多个节点,影响更大。

4 准备工作

关闭防火墙
ulimit -a  系统的一些限制
open files
max user processes用户最大进程数
文件数(同时打开)
安装要细致。centos取消 selinux
来源美国国家安全局。内核级别的更改,需要分发,重启才能生效。

5 单机安装

cannel 同步数据
默认没有密码,演示环境,直接回车,

6 数据类型

1、整型

byte  8bit  Int8
short
int 
long

2、浮点型

尽可能用整数形式存储
存钱 decimal

3、布尔型


4、decimal

有符号的浮点数

5、字符串

String
FixedString(N) 固定长度N的字符串。

6、枚举类型

create table t_enum
(x Enum8('hello'=1,'world'=2)
)
ENGINE=TinyLog;insert into t_enum values ('hello'),('world');

7、时间类型

Date 年月日
Datetime
Datetime64

8、数组

array

7 表引擎介绍

1、介绍

决定了如何存储表的数据
数据存储位置和方式,从哪里读,从哪里写?  磁盘
并发数据访问,可以多线程执行一条查询。
索引使用,如果存在?
引擎名称大小写敏感。
大驼峰。

2、TinyLog

列形式保存在磁盘,不支持索引,没有并发控制。
测试环境用的。

3、memory

基于内存,重启数据丢失。
简单查询性能表现好。

4、MergeTree

最强大的表引擎。
支持索引和分区。
相当于innodb至于mysql
clickhouse直接映射到mysql表,
并不真正拥有数据,但是可以查询。
可以对远程在mysqld 的数据进行select查询。

8 MergeTree简单使用

primary key(id) 不唯一。建表语句
create table t_order_mt(id UInt32,sku_id String,create_time Datetime
)engine=MergeTree
partition by to下载dbever
驱动,自己去下载。添加文件。

9 分区详解

10 主键

16 开发中引擎的选择

幂等性,
重复写入,
replaciongMergeTree 
存储完全继承了mergetree,多了一个去重的功能。

17 update和delete

虽然可以实现修改和删除,但是是一种很重的操作,不支持事务。
更新:插入一条新的数据,version+1,查询时候加上一个过滤条件,where version最大。只是提供一个思路。

18 查询和函数介绍

支持子查询

19 多维分析函数


相关文章:

clickhouse入门

clickhouse 1 课程介绍 和hadoop无关,俄罗斯,速度快3 介绍&特点 1 列式存储 在线分析处理。 使用sql进行查询。列式存储更适合查询分析的场景。新增时候有一个寻址的过程。更容易进行压缩行式存储。增删改查都需要的时候。2 DBMS功能 包括ddl,d…...

中间件: ElasticSearch的安装与部署

文档地址: https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html 单机部署 创建用户: useradd es chown -R es /opt/soft/ mkdir -p /var/log/elastic chown -R es /var/log/elastic mkdir -p /tmp/elastic chown -R es /tmp…...

LabVIEW模拟化学反应器的工作

LabVIEW模拟化学反应器的工作 近年来,化学反应器在化学和工业过程领域有许多应用。高价值产品是通过混合产品,化学反应,蒸馏和结晶等多种工业过程转换原材料制成的。化学反应器通常用于大型加工行业,例如酿酒厂公司饮料产品的发酵…...

Python基础语法入门(第二十三天)——正则表达式

正则表达式是一种文本模式,用于匹配字符串,它是由字符和特殊字符组成的模式。正则表达式可以用于验证、搜索、替换和提取字符串。其能够应用于各种编程语言和文本处理工具中,如Python、Java、JavaScript等。 正则表达式在线测试工具&#xf…...

山西电力市场日前价格预测【2023-08-20】

日前价格预测 预测明日(2023-08-20)山西电力市场全天平均日前电价为341.71元/MWh。其中,最高日前电价为367.66元/MWh,预计出现在20: 30。最低日前电价为318.47元/MWh,预计出现在04: 15。 价差方向预测 1: 实…...

C++中function,bind,lambda

c11之前&#xff0c;STL中提供了bind1st以及bind2nd绑定器 首先来看一下他们如何使用&#xff1a; 如果我们要对vector中的元素排序&#xff0c;首先会想到sort&#xff0c;比如&#xff1a; void output(const vector<int> &vec) {for (auto v : vec) {cout <&l…...

跟着美团学设计模式(感处)

读了着篇文章之后发现真的是&#xff0c;你的思想&#xff0c;你的思维是真的比比你拥有什么技术要强的。 注 开闭原则 开闭原则&#xff08;Open-Closed Principle&#xff09;是面向对象设计中的基本原则之一&#xff0c;它的定义是&#xff1a;一个软件实体应该对扩展开放…...

2023/8/19 小红书 Java 后台开发面经

项目都做了些什么&#xff0c;怎么实现的用Redis实现了什么&#xff0c;Redis是单线程的吗&#xff0c;Redis是单线程的为什么快&#xff0c;IO多路复用模型具体实现&#xff0c;持久化怎么实现的为什么用Kafka&#xff0c;架构是什么样的&#xff0c;Broker、Topic、Partition…...

基于traccar快捷搭建gps轨迹应用

0. 环境 - win10 虚拟机ubuntu18 - i5 ubuntu22笔记本 - USB-GPS模块一台&#xff0c;比如华大北斗TAU1312-232板 - 双笔记本组网设备&#xff1a;路由器&#xff0c;使得win10笔记本ip&#xff1a;192.168.123.x&#xff0c;而i5笔记本IP是192.168.123.215。 - 安卓 手机 1.…...

【深度学习-图像识别】使用fastai对Caltech101数据集进行图像多分类(50行以内的代码就可达到很高准确率)

文章目录 前言fastai介绍数据集介绍 一、环境准备二、数据集处理1.数据目录结构2.导入依赖项2.读入数据3.模型构建3.1 寻找合适的学习率3.2 模型调优 4.模型保存与应用 总结人工智能-图像识别 系列文章目录 前言 fastai介绍 fastai 是一个深度学习库&#xff0c;它为从业人员…...

Debian10: 安装nut服务器(UPS)

UPS说明&#xff1a; UPS的作用就不必讲了&#xff0c;我选择是SANTAKTGBOX-850&#xff0c;规格为 850VA/510W&#xff0c;可以满足所需&#xff0c;关键是Debian10自带了驱动可以支持&#xff0c;免去安装驱动&#xff0c;将UPS通过USB线连接服务器即可&#xff0c;如下图所示…...

神经网络基础-神经网络补充概念-47-动量梯度下降法

概念 动量梯度下降法&#xff08;Momentum Gradient Descent&#xff09;是一种优化算法&#xff0c;用于加速梯度下降的收敛速度&#xff0c;特别是在存在高曲率、平原或局部最小值的情况下。动量法引入了一个称为“动量”&#xff08;momentum&#xff09;的概念&#xff0c…...

C++11并发与多线程笔记(13) 补充知识、线程池浅谈、数量谈、总结

C11并发与多线程笔记&#xff08;13&#xff09; 补充知识、线程池浅谈、数量谈、总结 1、补充一些知识点1.1 虚假唤醒&#xff1a;1.2 atomic 2、浅谈线程池&#xff1a;3、线程创建数量谈&#xff1a; 1、补充一些知识点 1.1 虚假唤醒&#xff1a; notify_one或者notify_al…...

python高级基础

文章目录 python高级基础闭包修饰器单例模式跟工厂模式工厂模式单例模式 多线程多进程创建websocket服务端手写客户端 python高级基础 闭包 简单解释一下闭包就是可以在内部访问外部函数的变量&#xff0c;因为如果声明全局变量&#xff0c;那在后面就有可能会修改 在闭包中的…...

使用线性回归模型优化权重:探索数据拟合的基础

文章目录 前言一、示例代码二、示例代码解读1.线性回归模型2.MSE损失函数3.优化过程4.结果解读 总结 前言 在机器学习和数据科学中&#xff0c;线性回归是一种常见而重要的方法。本文将以一个简单的代码示例为基础&#xff0c;介绍线性回归的基本原理和应用。将使用Python和Nu…...

亿级短视频,如何架构?

说在前面 在尼恩的&#xff08;50&#xff09;读者社群中&#xff0c;经常指导大家面试架构&#xff0c;拿高端offer。 前几天&#xff0c;指导一个年薪100W小伙伴&#xff0c;拿到字节面试邀请。 遇到一个 非常、非常高频的一个面试题&#xff0c;但是很不好回答&#xff0…...

jenkins pipeline方式一键部署github项目

上篇&#xff1a;jenkins一键部署github项目 该篇使用jenkins pipeline-script一键部署&#xff0c;且介绍pipeline-scm jenkins环境配置 前言&#xff1a;按照上篇创建pipeline任务&#xff0c;结果报mvn&#xff0c;jdk环境不存在&#xff0c;就很疑惑&#xff0c;然后配置全…...

Vue 项目搭建

环境配置 1. 安装node.js 官网&#xff1a;nodejs&#xff08;推荐 v10 以上&#xff09; 官网&#xff1a;npm 是什么&#xff1f; 由于vue的安装与创建依赖node.js&#xff08;JavaScript的运行环境&#xff09;里的npm&#xff08;包管理和分发工具&#xff09;&#xff…...

【NetCore】09-中间件

文章目录 中间件&#xff1a;掌控请求处理过程的关键1. 中间件1.1 中间件工作原理1.2 中间件核心对象 2.异常处理中间件:区分真异常和逻辑异常2.1 处理异常的方式2.1.1 日常错误处理--定义错误页的方法2.1.2 使用代理方法处理异常2.1.3 异常过滤器 IExceptionFilter2.1.4 特性过…...

机器学习深度学习——BERT(来自transformer的双向编码器表示)

&#x1f468;‍&#x1f393;作者简介&#xff1a;一位即将上大四&#xff0c;正专攻机器学习的保研er &#x1f30c;上期文章&#xff1a;机器学习&&深度学习——transformer&#xff08;机器翻译的再实现&#xff09; &#x1f4da;订阅专栏&#xff1a;机器学习&am…...

FUnIE-GAN水下图像增强技术:解决水下视觉挑战的深度学习方案

FUnIE-GAN水下图像增强技术&#xff1a;解决水下视觉挑战的深度学习方案 【免费下载链接】FUnIE-GAN Fast underwater image enhancement for Improved Visual Perception. #TensorFlow #PyTorch #RAL2020 项目地址: https://gitcode.com/gh_mirrors/fu/FUnIE-GAN 水下图…...

魔百和CM311-1A刷机后体验:S905L3A芯片+安卓9,到底能装哪些好玩的应用?

魔百和CM311-1A刷机后应用生态全攻略&#xff1a;释放S905L3A芯片的隐藏潜力 当你的魔百和CM311-1A成功刷入纯净安卓9系统后&#xff0c;这台搭载S905L3A芯片的设备便从一台普通电视盒子蜕变为开放式的娱乐中心。ADB功能默认开启的状态下&#xff0c;它的可能性只受限于你的想…...

Python小红书数据采集终极指南:xhs工具完整使用教程

Python小红书数据采集终极指南&#xff1a;xhs工具完整使用教程 【免费下载链接】xhs 基于小红书 Web 端进行的请求封装。https://reajason.github.io/xhs/ 项目地址: https://gitcode.com/gh_mirrors/xh/xhs 小红书作为中国领先的生活方式分享平台&#xff0c;蕴含着丰…...

别再死记硬背!一张图+三个口诀,快速理解自反、对称、传递闭包怎么求

离散数学闭包运算&#xff1a;图解口诀实战&#xff0c;3分钟掌握核心技巧 第一次接触离散数学中的闭包运算时&#xff0c;很多同学都会被各种定义和符号绕晕。其实只要掌握几个简单的视觉化技巧&#xff0c;就能像搭积木一样轻松构建自反、对称和传递闭包。本文将用最直观的关…...

若依框架下SpringBoot Excel图片导出的实战与优化

1. 若依框架与Excel图片导出需求解析 第一次接触若依框架的Excel导出功能时&#xff0c;我发现它默认只支持文本和数字类型的数据导出。但在实际业务中&#xff0c;像商品详情导出、员工档案管理这类场景&#xff0c;经常需要将图片嵌入Excel表格。比如电商平台需要导出商品主图…...

Habitat-Lab具身AI仿真平台:从核心概念到实战部署全解析

1. 项目概述&#xff1a;从零开始理解Habitat-Lab 如果你正在研究具身智能&#xff0c;或者对如何让AI在三维物理世界里“学会做事”感到好奇&#xff0c;那你大概率已经听说过Habitat-Lab这个名字。它不是一个游戏引擎&#xff0c;也不是一个单纯的机器人仿真器&#xff0c;而…...

从8088 CPU硬件引脚深入理解中断机制:信号、时序与响应流程

1. 项目概述&#xff1a;从硬件视角重新理解中断中断&#xff0c;这个词对于任何一个写过代码、调过驱动的开发者来说&#xff0c;都太熟悉了。我们张口闭口就是“中断处理函数”、“中断向量表”、“中断上下文”&#xff0c;仿佛它天生就是操作系统或者驱动开发领域的一个抽象…...

低成本组合导航系统:让精准导航不再昂贵

在无人系统、精准农业和自动驾驶快速发展的今天&#xff0c;高精度导航早已成为刚需。然而&#xff0c;传统高端导航系统动辄数万甚至数十万元的成本&#xff0c;让许多中小型企业和创新团队望而却步。如今&#xff0c;这一局面被彻底打破——ER-GNSS/MINS-05低成本组合导航系统…...

自托管项目管理与知识库系统:基于文件存储的轻量级解决方案

1. 项目概述与核心价值最近在折腾个人知识库和项目管理工具&#xff0c;发现很多现成的方案要么太重&#xff0c;要么太轻&#xff0c;要么就是配置起来让人头大。直到我遇到了一个叫bicodeurubu/pm-wiki-v2的项目&#xff0c;它给我的第一印象是“清爽”。这其实是一个基于现代…...

Overleaf从入门到精通:在线LaTeX编辑器的核心功能与实战指南

1. Overleaf入门&#xff1a;为什么选择在线LaTeX编辑器 第一次接触LaTeX时&#xff0c;我被它复杂的本地环境配置劝退了。直到发现了Overleaf这个在线编辑器&#xff0c;才真正体会到科研写作的流畅感。作为一款零配置的云端LaTeX平台&#xff0c;它解决了传统LaTeX最让人头疼…...