当前位置: 首页 > article >正文

MySQL原理(一)

目录

一、理解MySQL的服务器与客户端关系

1:MySQL服务器与客户端

2:服务器处理客户端请求

3:常见的存储引擎

二、字符集和比较规则

1:字符集和比较规则简介

2:字符集和比较规则应用

3:乱码原因(通用)

4:MySQL处理乱码

5:比较规则


一、理解MySQL的服务器与客户端关系

1:MySQL服务器与客户端

​ 运行着的服务器程序客户端程序本质上都是计算机上的一个进程,所以客户端进程向服务区进程发送请求并得到回复的过程本质上是一个进程间通信的过程

MySQL支持的三种客户端进程和服务器进程的通信方式:

  • TCP/IP协议(通常配合SSL安全套接字连接)
  • 命名通道(Windows用户)或共享内存(需要同一台Windows)
  • Unix域套接字

2:服务器处理客户端请求

效果:客户端进程向服务器进程发送一段文字(MySQL语句),服务器进程处理后再向客户端进程发送一段文本(处理结果)

过程(可参考下图):客户端 -> 处理连接 -> 查询缓存 -> 语法解析 -> 查询优化 -> 存储引擎 -> 文件系统

大致三部分:连接管理、解析与优化、存储引擎

连接管理(三种客户端进程与服务器进程通信方式):通常使用TCP/IP方式,客户端和服务器不再同一台主机上时,采用SSL(安全套接字)连接,期间MySQL服务器会缓存连接线程(不会立即销毁线程)

解析与优化

  • 查询缓存:MySQL服务器在处理完客户端A的查询语句后,客户端B发来相同的查询语句(一定要相同,任何字符上的不同都会导致缓存不被命中,包括空格、注释、大小写,还有内部系统函数调用也不会命中缓存),MySQL8.0被删除,原因是性能提升和维护缓存成本占比太低;性能提升太少,而维护成本太高,一个查询每次都要检索缓存(没有命中),而且查询处理完之后,还要更新缓存,维护这块缓存

  • 语法解析:缓存未被命中,那么下一步就是把客户端发送过来的文本进行解析,先检验语法是否正确,然后从文本中抽取出要查询的表、字段以及条件等放入MySQL服务器内部使用的一些数据结构上(词法解析、语法分析、语义分析等阶段)

  • 查询优化:光有一些表和条件是不够的,运行效率可能不是很高,MySQL的优化程序可以帮我们做一些优化,比如外连接转为内连接,表达式优化,子查询转为连接等,最后生产一个执行计划,执行计划表面会使用到哪些索引进行查询,表之间的连接顺序是怎么样的等待,关键字EXPLAIN

存储引擎:上述所有过程其实都没有真正的访问真实的数据表,MySQL服务器会把数据的存储和提取操作都封装到一个叫做 “存储引擎” 的模块中(存储引擎负责如何读取数据,如何写入数据到本地中),不同的存储引擎具体表的存储结构不一定相同,采用的算法也不一定相同。

在这里插入图片描述

简单理解:(连接管理、查询缓存、语法解析、查询优化)这些不涉及真实数据存储的功能划分为MySQL Server,而真正存取数据的功能划分为 存储引擎 。存储引擎提供统一调用的接口(存储引擎API)包含几十个底层函数,像“读取索引第一条内容”、“插入记录”等,MySQL Server完成查询优化后,只需要按照生成的执行计划调用底层存储引擎提供的API即可获取数据并返回客户端。

3:常见的存储引擎

重点的为红色,次要的为绿色,其它随意

在这里插入图片描述

查看当前服务器支持的存储引擎:

show ENGINES;# Engine 	-> 存储引擎
# Support 	-> 是否支持(DEFAULT 默认使用)
# Comment 	-> 描述
# XA 		-> 是否支持分布式事务
# Transactions 	-> 是否支持事务
# Savepoints 	—> 是否支持部分事务回滚

不同的表,可以设置不同的存储引擎

# 格式:
create table 表名(建表字段
) engine = 存储引擎名称;# 实例:
create table tb1 (name varchar(255)
) engine = MyISAM;
# 修改表的存储引擎格式:
alter table 表名 engine = 存储引擎名称;# 实例:
alter table tb1 engine = InnoDB;

MySQL启动配置的选项:长形式和短形式(长形式需要使用双-- 和完整名称 & 短形式需要使用单- 和首字符)

下面列举常见的选项

在这里插入图片描述

二、字符集和比较规则

1:字符集和比较规则简介

编码、解码、字符集概念

编码(字符->二进制):将一个字符映射成一个二进制数据的过程

如:‘a’ -> 00000001 (十六进制:0x01)

解码(二进制->字符):将一个二进制数据映射到一个字符的过程

如:00000010 (十六进制:0x02) -> ‘b’

字符集:描述某个字符范围的编码规则。

如:‘baB’ -> 000000100000000100000100 (十六进制:0x020104)

MySQL中的 utf8 和 utf8mb4

MySQL中字符集表示一个字符所用最大字节长度在某些方面会影响系统的存储和性能,所以MySQL中存在阉割版utf8和正宗的utf8

  • utf8mb3:阉割版utf8字符集,只是用1~3个字节表示字符
  • utf8mb4:正宗utf8字符集,使用1~4个字符标识字符

MySQL中utf8是utf8mb3的别名,所以MySQL中的utf8意味着使用1~3个字节来表示一个字符

如果需要使用4个字节编码一个字符时,如存储一些emoji表情,那就使用utf8mb4

MySQL中常用的一些字符集,以及对应的最大字节表示一个字符(Maxlen)

# 查看MySQL支持的所有字符集及其Maxlen(下图为常用的字符集)
show character set;

在这里插入图片描述

比较规则:每种字符对应若干比较规则,每种字符集都有一种默认的比较规则

后缀英文释义描述
_aiaccent insensitive不区分重音
_asaccent sensitive区分重
_cicase insensitive不区分大小写
_cscase sensitive区分大小写
_binbinary以二进制

utf8字符集默认的比较规则是 utf8_general_ci ,比较规则的结尾是 ci ,查表可知是不区分大小写比较

2:字符集和比较规则应用

# 查看MySQL支持的utf8所有比较规则
SHOW COLLATION LIKE 'utf8\_%';
# 查看当前字符集
SHOW VARIABLES LIKE 'character_set_server';
# 查看当前字符集的比较规则
SHOW VARIABLES LIKE 'collation_server';

MySQL有4个级别的字符集和比较规则

服务器级别、数据库级别、表级别、列级别

服务器级别的字符集: character_set_server
服务器级别的比较规则: collation_server当前数据库的字符集: character_set_database
当前数据库的比较规则: collation_database表级别的字符集,在创建表末尾指定: character set 字符集名称
表级别的比较规则,在创建表末尾指定: collate 比较规则名称列级别的字符集和比较规则,在列名末尾指定: character set 字符集名称 collate 比较规则名称

如果下层未指定字符集或比较规则名称,则依次向上取,比如,列级别的没有设置字符集,那会从表级别去找字符集,如果表级别字符集没有设置,则再去找当前数据的字符集,直至找到

补充:由于字符集和比较规则是相互联系的,所以如果我们修改一项,对应的一项会随之改变(取默认的)

3:乱码原因(通用)

字符串实际在计算机中就是一个字节串。通常我们看到的乱码,都是不同解码导致的。

比如:”我“ 字在utf8中编码为 0xE68891,现在你在你的电脑上用utf8进行编码,你发给你的同事,然而你的同事不知道你用的是utf8编码,于是他用gbk进行解码,发现在gbk编码表中 0xE68891 对应的字符是 ”鎴 “

解释 ”鎴“ 字来源:

  • 首先第一个字节 0xE6,它的值大于 0x7F(对应十进制127),说明此时是两个字节编码,然后读取下一个字节 0xE688 ,从gbk编码表中查找发现是 ”鎴“
  • 然后还有剩下的 0x91 ,它的值也大于 0x7F,但是再往后读字节发现没有了,于是 0x91 是半个字符
  • 于是 你同事的电脑中解码得到的字符是 ”鎴“和半个字符(下图为原本utf8编码,但是gb2312解码图片)

在这里插入图片描述

由此可知:如果对于同一个字符串编码和解码使用的字符集不一样,那么结果会让你摇头

4:MySQL处理乱码

客户端字符串 -> 服务器处理 -> 返回客户端

  • 使用操作系统(比如windows)的字符集(假设为gbk)编码请求字符串
  • 从character_set_client(和你操作系统要一致)转化为character_set_connection(中间编码)
  • 从character_set_connection转化为具体列(假设为utf8)使用的字符集
  • 将查询结果从具体的列使用的字符集转化为character_set_results(gbk)
  • 使用操作系统的字符集解码响应字节串

也就是说,客户端的字符集要和 character_set_client & character_set_connection 一致,不然会解码错误;当然,还有一个中间编码character_set_connection,它也是有要求的,字符集所包含的字符必须大于客户端的字符集,不然你客户端一个中文,但是中间编码是ascii,肯定搞不了,对吧

于是:通常我们把 character_set_client & character_set_connection & character_set_results 设置成与客户端字符集一致的情况。

# 一个语句设置三个参数
set names 字符集名;# 当然也可以一个一个设置,但是不建议
SET character_set_client = 字符集名;
SET character_set_connection = 字符集名;
SET character_set_results = 字符集名;

5:比较规则

比较规则通常是用于比较字符串大小的表达式以及对某个字符列进行排序,有时也被叫做排序规则

tb1表中包含name列,现在对name进行全局排序(order by),列包含 ”我 A a b B“

  • 如果比较规则是 gbk_chinese_ci 那么比较的时候,就不会考虑大小写,那么答案是:A a b B 我
  • 如果比较规则是 gbk_bin 那么比较的时候,就比较对应字符的二进制,答案变成:A B a b 我

相关文章:

MySQL原理(一)

目录 一、理解MySQL的服务器与客户端关系 1:MySQL服务器与客户端 2:服务器处理客户端请求 3:常见的存储引擎 二、字符集和比较规则 1:字符集和比较规则简介 2:字符集和比较规则应用 3:乱码原因&…...

Docker+Jenkins+Gitee自动化项目部署

前置条件 docker安装成功 按照下面配置加速 sudo mkdir -p /etc/docker sudo tee /etc/docker/daemon.json <<-EOF {"registry-mirrors": ["https://register.librax.org"] } EOF sudo systemctl daemon-reload sudo systemctl restart docker一、…...

Nginx 499 错误的原因及解决方法

Nginx 499 错误的原因及解决方法 原因 客户端超时&#xff1a; 客户端在等待服务器响应时超时&#xff0c;导致连接被关闭。 解决方法&#xff1a;优化服务端响应时间&#xff0c;或调大客户端的连接超时时间。 服务端响应过慢&#xff1a; 后端服务处理请求时间过长。 解决方法…...

Linux网络多进程并发服务器和多线程并发服务器

多进程 还是以大小写转换为例子 #include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #include <pthread.h> #include <sys/socket.h> #include <arpa/inet.h> #include "wrap.h" #include…...

VScode 画时序图(FPGA)

1、先安装插件&#xff1a; 2、然后就可以编写一个.js文件&#xff0c;如下&#xff1a; {signal: [{name: clk, wave: p.......|..},{name: rstn, wave: 01......|..},{name: din_vld, wave: 0.1.0...|..},{name: din, wave: "x.x...|..", data: ["D0", …...

Kubernetes 集群搭建(二):搭建k8s集群 (1.28版本)

&#xff08;一&#xff09;虚拟环境准备 名称ip备注m1192.168.101.131mastern1192.168.101.132workern2192.168.101.133worker &#xff08;二&#xff09;所有主机统一配置 2.1 关闭防火墙和selinux systemctl stop firewalld systemctl disable firewalld sed -i s/enfo…...

一文详解OpenCV环境搭建:Windows使用CLion配置OpenCV开发环境

在计算机视觉和图像处理领域&#xff0c;OpenCV 是一个不可或缺的工具。其为开发者提供了一系列广泛的算法和实用工具&#xff0c;支持多种编程语言&#xff0c;并且可以在多个平台上运行。对于希望在其项目中集成先进视觉功能的开发者来说&#xff0c;掌握如何配置和使用OpenC…...

Python爬取数据(二)

一.example2包下的 1.re模块的compile函数使用 import repatternre.compile(r\d) print(pattern) 2.match的方法使用 import re patternre.compile(r\d) # m1pattern.match(one123twothree345four) #参数2&#xff1a;指定起始位置(包含),参数3&#xff1a;终止位置(包含),…...

前端用用jsonp的方式解决跨域问题

前端用用jsonp的方式解决跨域问题 前端用用jsonp的方式解决跨域问题 前端用用jsonp的方式解决跨域问题限制与缺点&#xff1a;前端后端测试使用示例 限制与缺点&#xff1a; 不安全、只能使用get方式、后台需要相应jsonp方式的传参 前端 function jsonp(obj) {// 动态生成唯…...

计算机网络 3-2 数据链路层(流量控制与可靠传输机制)

3.4 流量控制与可靠传输机制 流量控制&#xff1a;指由接收方控制发送方的发送速率&#xff0c;使接收方有足够的缓冲空间来接收每个帧 滑动窗口流量控制:一种更高效的流量控制方法。 在任意时刻&#xff0c;发送方都维持一组连续的允许发送帧的序号&#xff0c;称为发送窗口…...

科普:原始数据是特征向量么?

一、输入向量 x \mathbf{x} x是特征向量 机器学习算法公式中的输入向量 x \mathbf{x} x通常要求是特征向量。原因如下&#xff1a; 从算法原理角度&#xff1a;机器学习算法旨在通过对输入数据的学习来建立模型&#xff0c;以实现对未知数据的预测或分类等任务。特征向量是对…...

Jenkins配置的JDK,Maven和Git

1. 前置 在配置前&#xff0c;我们需要先把JDK&#xff0c;Maven和Git安装到Jenkins的服务器上。 &#xff08;1&#xff09;需要进入容器内部&#xff0c;执行命令&#xff1a;docker exec -u root -it 容器号/容器名称&#xff08;2选1&#xff09; bash -- 容器名称 dock…...

有效压缩 Hyper-v linux Centos 的虚拟磁盘 VHDX

参考&#xff1a; http://www.360doc.com/content/22/0505/16/67252277_1029878535.shtml VHDX 有个不好的问题就是&#xff0c;如果在里面存放过文件再删除&#xff0c;那么已经使用过的空间不会压缩&#xff0c;导致空间一直被占用。那么就需要想办法压缩空间。 还有一点&a…...

网络空间安全(53)XSS

一、定义与原理 XSS&#xff08;Cross Site Scripting&#xff09;&#xff0c;全称为跨站脚本攻击&#xff0c;是一种网站应用中的安全漏洞攻击。其原理是攻击者利用网站对用户输入内容校验不严格等漏洞&#xff0c;将恶意脚本&#xff08;通常是JavaScript&#xff0c;也可以…...

【LeetCode 热题100】45:跳跃游戏 II(详细解析)(Go语言版)

&#x1f680; 力扣 45&#xff1a;跳跃游戏 II&#xff08;全解法详解&#xff09; &#x1f4cc; 题目描述 给你一个非负整数数组 nums&#xff0c;表示你最初位于数组的第一个位置。 数组中的每个元素表示你在该位置可以跳跃的最大长度。 你的目标是使用 最少的跳跃次数 到…...

Spring MVC 框架 的核心概念、组件关系及流程的详细说明,并附表格总结

以下是 Spring MVC 框架 的核心概念、组件关系及流程的详细说明&#xff0c;并附表格总结&#xff1a; 1. 核心理念 Spring MVC 是基于 MVC&#xff08;Model-View-Controller&#xff09;设计模式 的 Web 框架&#xff0c;其核心思想是 解耦&#xff1a; Model&#xff1a;数…...

使用 redis 实现消息队列

方案1: 使用list做消息队列问题1: 如何保证消息不丢失问题 2: 重复消费/幂等 方案 2: zset实现消息队列方案 3: 发布/订阅(pub/sub)问题1: 如何保证消息不丢失问题 2: 重复消费/幂等 方案 4: Stream 实现消息队列问题1: 如何保证消息不丢失问题 2: 重复消费/幂等 方案1: 使用li…...

金融数据分析(Python)个人学习笔记(6):安装相关软件

python环境的安装请查看Python个人学习笔记&#xff08;1&#xff09;&#xff1a;Python软件的介绍与安装 一、pip 在windows系统中检查是否安装了pip 打开命令提示符的快捷键&#xff1a;winR&#xff0c;然后输入cmd 在命令提示符中执行如下命令 python -m pip --version…...

Android Material Design 3 主题配色终极指南:XML 与 Compose 全解析

最小必要颜色配置 <!-- res/values/themes.xml --> <style name"Theme.MyApp" parent"Theme.Material3.DayNight"><!-- 基础三原色 --><item name"colorPrimary">color/purple_500</item><item name"col…...

PyTorch参数管理详解:从访问到初始化与共享

本文通过实例代码讲解如何在PyTorch中管理神经网络参数&#xff0c;包括参数访问、多种初始化方法、自定义初始化以及参数绑定技术。所有代码可直接运行&#xff0c;适合深度学习初学者进阶学习。 1. 定义网络与参数访问 1.1 定义单隐藏层多层感知机 import torch from torch…...

页面简单传参

#简单的情景&#xff1a;你需要在帖子主页传递参数给帖子详情页面&#xff0c;携带在主页获得的帖子ID。你有以下几种传递方法# #使用Vue3 TS# 1. 通过 URL 参数传递&#xff08;Query 参数&#xff09; 这是最简单、最常用的方法&#xff0c;ID 会显示在 URL 中的 ? 后面…...

nginx路径匹配的优先级

在 Nginx 配置中&#xff0c;当请求 /portal/agent/sse 时&#xff0c;会匹配 location ~* /sse$ 规则&#xff0c;而不是 location /portal。原因如下&#xff1a; 匹配规则解析 location ~* /sse$ ~* 表示 不区分大小写的正则匹配/sse$ 表示以 /sse 结尾的路径匹配结果&#…...

一周学会Pandas2 Python数据处理与分析-Pandas2一维数据结构-Series

锋哥原创的Pandas2 Python数据处理与分析 视频教程&#xff1a; 2025版 Pandas2 Python数据处理与分析 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili Pandas提供Series和DataFrame作为数组数据的存储框架。 Series&#xff08;系列、数列、序列&#xff09;是一个带有…...

DApp实战篇:前端技术栈一览

前言 在前面一系列内容中&#xff0c;我们由浅入深地了解了DApp的组成&#xff0c;从本小节开始我将带领大家如何完成一个完整的DApp。 本小节则先从前端开始。 前端技术栈 在前端开发者速入&#xff1a;DApp中的前端要干些什么&#xff1f;文中我说过&#xff0c;即便是在…...

leetcode6.Z字形变换

题目说是z字形变化&#xff0c;但其实模拟更像n字形变化&#xff0c;找到字符下标规律就逐个拼接就能得到答案 class Solution {public String convert(String s, int numRows) {if(numRows1)return s;StringBuilder stringBuilder new StringBuilder();for (int i 0; i <…...

HarmonyOS应用开发者高级-编程题-001

题目一:跨设备分布式数据同步 需求描述 开发一个分布式待办事项应用,要求: 手机与平板登录同一华为账号时,自动同步任务列表任一设备修改任务状态(完成/删除),另一设备实时更新任务数据在设备离线时能本地存储,联网后自动同步实现方案 // 1. 定义分布式数据模型 imp…...

鸿蒙开发者高级认证编程题库

题目一:跨设备分布式数据同步 需求描述 开发一个分布式待办事项应用,要求: 手机与平板登录同一华为账号时,自动同步任务列表任一设备修改任务状态(完成/删除),另一设备实时更新任务数据在设备离线时能本地存储,联网后自动同步实现方案 // 1. 定义分布式数据模型 imp…...

Ubuntu(CentOS、Rockylinux等)快速进入深度学习pytorch环境

这里写自定义目录标题 安装进入系统&#xff08;如Ubuntu22.04&#xff09;安装anacondapip、conda换源pip换源conda换源 安装nvidia安装pytorch环境针对于wsl的优化 安装进入系统&#xff08;如Ubuntu22.04&#xff09; docker 、 wsl 、 双系统 、服务器系统 推荐 Ubuntu 20…...

[实战] 天线阵列波束成形原理详解与仿真实战(完整代码)

天线阵列波束成形原理详解与仿真实战 1. 引言 在无线通信、雷达和声学系统中&#xff0c;波束成形&#xff08;Beamforming&#xff09;是一种通过调整天线阵列中各个阵元的信号相位和幅度&#xff0c;将电磁波能量集中在特定方向的技术。其核心目标是通过空间滤波增强目标方…...

Android开发okhttp添加头部参数

Android开发okhttp添加头部参数或者是头文件 private static class RequestHeaderInterceptor implements Interceptor {Overridepublic Response intercept(Chain chain) throws IOException {Request original chain.request();//添加头部信息Request request original.new…...