分布式笔记(一)
分布式系统问题
并发性
没有全局时钟
故障独立性
分布式系统概念
分布式优势
资源共享、开放性、并发性、可扩展性、容错性
问题挑战
分布式系统总部特性很难了解
分布式系统响应不可预知
不能自顶向下
设计原则
透明性
开放性:按照普遍标准
可扩展性(规模、分布、可管理性)
增强扩展(垂直扩展):如电脑内存16G->64G
增加扩展(纵向扩展):如一台电脑不够加了很多台
信息安全性:分布式系统更容易被攻击
攻击类型:拦截、中断、更改、捏造
加密+认证+访问权限控制
服务质量(QoS)
分布式系统模型
结构模型
元素
- 通信实体:进程、对象、组件、web服务
- 通信泛型(交互):
-
- 进程间通信
- 远程调用:请求-应带、RPC、RMI
- 间接通信
- 角色和责任:
-
- 客户/服务端
- 对等
- 放置:将服务映射到多个服务器、缓存、移动代码、移动代理
体系结构模式
- 分层(垂直):应用、中间件、操作系统、计算机和网络硬件
- 层次化体系结构:两层、三层、瘦客户
- 中间件:
基础模型
进程分类
服务器进程、客户进程、对等进程
角色与职责
Client-server:服务器客户
peer process:P2P系统、BT系统
放置
代理服务器与缓存
移动代码
如Applets
移动代理
Web爬行者(爬虫)
分层
操作系统->中间件->分布式应用
层次化体系结构
两层客户机-服务器结构
客户机和服务器进行联系交互
瘦客户机模型
浏览器直接拿来用、没有安装过程
胖客户机模型
玩游戏下软件、安装程序才能使用、部分能力或所有能力分布到客户机、再比如银行的ATM
多层客户机-服务器结构
分出不同的服务器做不同的事。
比如网上银行系统的三层系统结构。
比如Nginx负载均衡。
中间件
分布式中的进程和线程
进程和线程的概念、模型、上下文切换
进程的概念
进程的状态
中断处理与调度
进程和线程的区别
线程的状态
上下文切换
进程切换与线程切换的区别:最主要区别在于进程切换涉及到虚拟地址空间的切换而线程切换不会。这也是进程切换比线程切换慢的原因。
八股知识点(操作系统):
进程是处理机调度的基本单位,同一个进程中的所有线程共享该进程分配到的所有资源。
一个进程可以包含多个进程,但至少包含一个线程。
一个线程只能属于一个进程。
并行与并发
并行:同一时间同时执行。强调同一时刻,你打游戏和你女朋友打你同时进行。当你按下时间静止,看到很多进程或线程活着,
并发:同一时间段多个任务轮流执行。强调一段时间很多事情同时发生,但同一时刻只能干一件事。你打完游戏后去哄你女朋友,然后可能接着打游戏或者做别的事。当你按下时间静止,只能看到一个进程或线程活着,其他都在排队。
线程的三种实现方式
分布式通信
分层通信协议
OSI七层、五层、TCP/IP四层
中间层协议
中间件层
- 独立于应用的协议,支持中间件服务
- 通信协议(RPC等)
中间件层位于传输层和应用层之间。
远程过程调用(RPC)
- 将单机环境下的过程调用延伸到分布式系统环境。
- ISO将RPC作为计算机网络,分布式计算机系统的国际标准化草案。
- 一种信息交换的标准规程。
透明性:你看不见RPC的存在,所以从用户来看,是透明的。
指用户可以像调用本地过程一样调用不同地域的不同计算机上的过程。
call remote procedure(RPC)
数据复制
扩展:集群的水平扩展和垂直扩展有什么区别? - Zhai_David - 博客园
1.主从节点(写少读多)(主读写+从读)
支持主从复制系统有:
- 关系型数据库:MySQL、SQL Server、PostgreSQL等
- 非关系型数据库:MongoDB、RethinkDB、Espresso等
- 消息队列:kafka、RabbitMQ
同步复制与异步复制
同步能保证数据的一致性
异步不能保证数据的一致性(但响应很快)
添加新的follower?
可能会出现数据不一致的问题,可以通过加锁解决。
也可以不用数据库加锁:建立leader数据的镜像,然后把镜像拷贝给follower,然后通过log(日志)记录对主节点的所有操作,比如对某数据的增删改查,然后通过看log记录的操作,从节点就可以完成和后来主节点一样的操作。
follower故障:(追赶式恢复)
leader故障:一个从节点会升级为新的主节点(这个过程叫故障恢复)、选举流程,投票机制。即使最后原先的主节点活过来,也只能变成新主的仆从。
复制日志的实现?
Statement-based replication(基于语句的复制,把”修改“记录下来)(但是也有问题:比如表达式中的时间函数NOW()等等)
Write-ahead log (WAL) shipping(预写日志)(将字节变化写在日志里,但是有问题,如果引擎不同的话)
Logical(基于行)log replication ()(把每一行的变化记下来,比如MySQL的binlog)
Trigger…(基于触发器的复制)
一文让你彻底明白分布式系统中的数据复制是怎么一回事? - 古明地盆 - 博客园
复制滞后问题
1.读己之写
用户在主节点改,在主节点读。这样就可以避免读不到数据的问题。
2.单调读
因为有时候会产生时光倒流。解决方法:让某个用户只在一个节点读,别老是跳来跳去(单调读取)。
3.一致前缀读
2.多主节点复制
多个主节点:允许多个节点写数据。
数据中心:
冲突解决机制:防止2个主同时读写,造成冲突。(双主写冲突解决方法:最后写入获胜(时间戳)、副本分配唯一id、…)
应用场景:
手机和笔记本上的微信同时登录
协同编辑
3.无主复制
没有主从概念,所有节点都是主节点,都可以读和写。
当节点故障时写入数据库
无主,共3个副本,1个坏了。写入,2个成功就视为写成功(少数服从多数)–>读取(少数服从多数)–>不能不管那个旧的,把读的新数据写给那个旧的。(旧的版本号比新的版本号低,所以version低的那个是旧的)
读写的法定人数quorum:
w+r>n(所以读写的副本必然有w+r-n个重叠)(只有有重叠才能一定保证读的副本里有新写进去的副本)
w、r大于n/2(少数服从多数)
7个副本最多能容忍3个副本错误
5个副本最多能容忍2个副本错误
3个副本最多能容忍1个副本错误
少数服从多数
分布式事务
事务不是一个天然存在的东西,是人为创造出来的。
什么是事务?
简化异常的处理,将读写请求合并到一组,构成一个逻辑单元,交给数据库。数据库将逻辑单元的所有操作视为一个操作,要么成功(提交),要么失败(回滚)。应用程序可以在事务执行失败时,安全地进行重试,应用程序可以不必担心事务操作部分成功,部分失败。
ACID含义
原子性:把多个操作放在一个事务里,要么全成功,要么全失败
一致性:约束。比如外键限制、唯一性限制。
隔离性:并发执行的事务各自隔离,并不影响互相执行的结果。隔离性也叫串行化,每个事务提交给人感觉像串行提交一样。串行的隔离性很少用(一个一个做),对性能影响较大,一般我们会用弱一点的隔离性。
持久性:事务写入的任何数据不会丢。(write-ahead log)WAL预写日志。
多对象事务操作
ACID中的原子性和隔离性主要针对客户端在同一事务中包含多个写操作时,数据库所提供的保证。
隔离性
脏读
一个事务读到了另一个事务还未commit的写操作
原子性
保证前一些操作可以撤销,避免不一致(有的做了有的没做)。
单对象事务操作
仍存在原子性和隔离性问题。
弱隔离级别
读提交
两个保护:没有脏读(读时,只能读已经提交后的数据)、没有脏写(写时,只能覆盖已经提交后的数据)。
脏读:读了未提交的数据。回滚麻烦。
脏写:写(或者说覆盖)了未提交的数据。
如何实现读提交
(写数据时加锁)使用行锁,来防止脏写。(和串行的区别,串行的读和写都加锁)
?来防止脏读
快照隔离和可重复读
解决读提交可能遇到的问题。
**快照隔离:**记录每个事务的修改记录,保留数据的多个版本,因此也称为多版本并发控制(MVCC:multiple verson concurrency control)
表中的每一行都有一个created_by字段和deleted_by字段。
写偏和幻读
写偏(移)解决方法:加锁
串行化
可序列化隔离通常被认为是最强的隔离级别。
3种
真正的串行执行
一个线程处理所有事务,避免使用锁,单一CPU工作。
在存储过程中封装事务。
存储过程的概念:SQL – 存储过程(详细)_sql存储过程-CSDN博客
两阶段锁定(2PL)
两阶段锁(2PL)是数据库控制并发操作的简单规则,用一句话概括:
“加锁阶段只加锁不解锁,解锁阶段只解锁不加锁”
就像去图书馆借书:
- 借书阶段:你可以不断借新书(加锁),但不能还书(解锁)
- 还书阶段:你只能还书(解锁),不能再借新书(加锁)
🔑 关键点:
- 保证事务不会中途释放锁后又去抢新锁
- 避免出现A事务读的数据被B事务修改后又读到的混乱情况
- 所有锁会在事务结束时(提交或回滚)统一释放
💡 实际效果:
- 就像排队办业务,一个人办完所有手续才会离开窗口(不会办到一半让给别人)
- 虽然可能排队时间变长,但保证不会出现数据错乱
这是数据库维持数据一致性的基础方法,现代数据库会优化这个机制(如配合MVCC)来提高并发性能。
序列化快照隔离(SSI)
相关文章:
分布式笔记(一)
分布式系统问题 并发性 没有全局时钟 故障独立性 分布式系统概念 分布式优势 资源共享、开放性、并发性、可扩展性、容错性 问题挑战 分布式系统总部特性很难了解 分布式系统响应不可预知 不能自顶向下 设计原则 透明性 开放性:按照普遍标准 可扩展性…...
linux常用基础命令_最新版
echo off setlocal enabledelayedexpansion :: Copyright © 2025 xianwen.deng :: All rights reserved. :: 591278546qq.com :: Version: 1.0 for /f “tokens2 delims:” %%a in (‘chcp’) do set “codepage%%a” set codepage!codepage: ! echo Codepage: !codepag…...
2021-11-09 C++三位数平方含有该数
缘由求解,运算函数,哪位大神教一下-编程语言-CSDN问答 void 三位数平方含有该数() {//缘由https://ask.csdn.net/questions/7560152?spm1005.2025.3001.5141int a 100, aa 1000, f 0;while (a < aa){f a*a;while (f > a)if ((f - a) % aa)f …...
MATLAB 程序实现了一个层次化光网络的数据传输模拟系统
% 主程序 num_pods = 4; % Pod 数量 num_racks_per_pod = 4; % 每个 Pod 的 Rack 数量 num_nodes_per_rack = 4; % 每个 Rack 的 Node 数量 max_wavelength = 50; % 可用波长数(根据冲突图动态调整) num_packets = 1000; % 模拟的…...
解锁 MCP 协议:AI 与数据交互的新桥梁
在人工智能(AI)蓬勃发展的当下,大型语言模型(LLM)展现出了令人惊叹的生成与推理能力。然而,它们在数据访问方面却面临着严峻的 “数据孤岛” 挑战。传统模式下,每个数据源都需要专门的连接器&am…...
StarRocks Community Monthly Newsletter (Mar)
版本动态 3.4.1 版本更新 核心功能升级 数据安全与权限管控 支持「安全视图」功能,严格管控视图查询权限 MySQL协议连接支持SSL认证,保障数据传输安全 存算分离架构增强 支持自动创建Snapshot(集群恢复更便捷) Storage Volu…...
Github 2FA(Two-Factor Authentication/两因素认证)
Github 2FA认证 多因素用户认证(Multi-Factor Authentication),基本上各个大互联网平台,尤其是云平台厂商(如:阿里云的MFA、华为云、腾讯云/QQ安全中心等)都有启用了,Github算是搞得比较晚些了。 双因素身…...
动态规划 -- 简单多状态dp,打家劫舍问题
1 按摩师 面试题 17.16. 按摩师 - 力扣(LeetCode) 本题的意思简单理解就是,如果我们接受了第 i 个预约,那么第 i -1 个预约和第 i1 个预约我们都是无法接受的,只能至少间隔一个选择。 按照以前的经验,我们…...
list的模拟实现和反向迭代器的底层
1:list的模拟实现 1:链表的节点 对于list的模拟实现,我们需要先定义一个节点的类可以使用(class也可以使用struct) // List的节点类 template<class T> struct ListNode {ListNode(const T& val T()){_p…...
C++学习之游戏服务器开发⑤AOI业务逻辑
目录 1.项目进度回顾 2.完善整体架构 3.AOI网格思路 4.网络AOI数据结构 5.游戏世界类添加,删除和构造 6.AOI查找实现 7.GAMEROLE类结合AOI 8.登陆时发送ID和姓名 9.登陆时发送周围玩家位置 10.玩家上线完成 11.玩家下线处理 1.项目进度回顾 时间轮调度处理…...
C/C++语言常见问题-智能指针、多态原理
文章目录 智能指针实现原理智能指针,里面的计数器何时会改变std::shared_ptr的引用计数器:std::weak_ptr的弱引用计数器:std::unique_ptr的控制块:总结: 智能指针和管理的对象分别在哪个区面向对象的特性:多…...
Python 实现日志备份守护进程
实训背景 假设你是一名运维工程师,需要为公司的监控系统开发一个简单的日志备份守护进程。该进程需满足以下需求: 后台运行:脱离终端,长期监控指定目录(如 /var/log/app/)中的日志文件。自动备份…...
Electricity Market Optimization 探索系列(VII)- 直流潮流方程的推导及例题
本文参考书籍:电力经济与电力市场,甘德强,杨莉,冯冬涵 著 link \hspace{1.6em} 文章的结构如下:围绕电力传输系统中短线路的等值等效模型,从节点注入功率的角度和线路功率的角度分析电网中的潮流࿰…...
DataOutputStream 终极解析与记忆指南
DataOutputStream 终极解析与记忆指南 一、核心本质 DataOutputStream 是 Java 提供的数据字节输出流,继承自 FilterOutputStream,用于写入基本数据类型和字符串的二进制数据。 作用:1.将java程序中的数据直接写入到文件,写到文…...
Spring AI与通义千问的完美结合:构建智能对话应用
Spring AI是Spring生态系统中的新成员,它为开发人员提供了一套简单而强大的工具,用于集成各种AI大模型。本文将介绍如何使用Spring AI与阿里云通义千问大模型进行集成,构建智能对话应用,帮助你快速掌握AI应用开发的核心技能。 引言 随着人工智能技术的快速发展,越来越多的…...
路由过滤实验
实验拓扑以及要求 此实验总结 1.ip-prefix 拒绝192.168.4.1 32,这样写的话并不会匹配192.168.4.1 32,需要加上范围less-eq 32,也就是说,192.168.4.1 32只是规则的范围,匹配还是得写范围 2.router-policy适合用在边界路由器引入 filter-policy都可以用 配置IP 配置ospf,rip …...
Idea连接远程云服务器上的MySQL,开放云服务器端口
1.开放云服务器的3306端口 (1)进入到云服务器的控制台 (2)点击使用的云服务器 (3)点击 配置安全组规则 (4)添加规则 (5)开放端口 2.创建可以远程访问…...
Oracle查询大表的全部数据
2000w的大表 表结构如下,其中id是索引 查询处理慢的写法 List<String> queryLoidForPage(Integer startNum,Integer endNum){try {Connection oracleConnection initBean.oracleConnection;Statement stmt oracleConnection.createStatement();// 4.执行查…...
Java锁的分类与解析
在多线程编程中,锁是确保共享资源不会同时被多个线程访问的关键工具。Java 提供了多种锁的实现方式,可以根据不同的需求选择适合的锁。本文将从多个维度对 Java 的锁进行分类,并对每种锁的特性进行详细解析。 锁的分类 锁的分类并没有唯一标…...
PyTorch生成式人工智能实战(1)——神经网络与模型训练过程详解
PyTorch生成式人工智能实战(1)——神经网络与模型训练过程详解 0. 前言1. 传统机器学习与人工智能2. 人工神经网络基础2.1 人工神经网络组成2.2 神经网络的训练 3. 前向传播3.1 计算隐藏层值3.2 执行非线性激活3.3 计算输出层值3.4 计算损失值3.5 实现前…...
基于X86/Nvidia+FPGA大模型具身智能机器人控制器解决方案,同时拥有算力与实时的便利
2025年成为人形机器人产业化元年,行业已突破早期实验室研发阶段,进入"场景验证量产爬坡"新周期,预计2031年具身智能市场规模有望突破万亿元。这一进程的背后,是硬件算力、实时控制、环境适应等底层技术的系统性突破——…...
使用 OpenRewrite 简化 Java 和 SpringBoot 迁移
大家好,这里是架构资源栈!点击上方关注,添加“星标”,一起学习大厂前沿架构! 移民的挑战 随着 Spring Boot 2.x 等旧版本即将到期且不再获得支持,迁移到较新版本对于安全性、兼容性和性能改进至关重要。但…...
2025中国移动云智算大会回顾:云智变革,AI+跃迁
4月10日,2025中国移动云智算大会在苏州举办。会上,中国移动开启“由云向智”新范式,以“智”为核心开辟算网新生态,彰显其在AI新时代的战略远见与技术引领力。 “云智算”将如何通过算网基础设施与人工智能核心技术的深度融合&am…...
ubuntu 2204 安装 vcs 2023
系统 : Ubuntu 22.04.1 LTS vcs 软件 : 有已经安装好的软件(位于redhat8.10),没找到安装包 . 安装好的目录文件 占用 94 G注意 : 该虚拟机(包括安装好的软件)有114G,其中安装好的目录文件占用94GB // 即 我要把 这里 已经安装好的软件(包括scl/vcs/verdi 和其他软件) 在 …...
C#实例化类型详解:从概念到实战
在C#编程中,实例化类型是构建程序的核心操作。本文将通过通俗易懂的案例,深入解析类型实例化的原理与实践技巧,帮助开发者快速掌握这一基础但至关重要的概念。 实例化类型是什么? 定义 通过类型模板创建具体对象的过程称为实例…...
Redis的Key的过期策略
我们都知道Redis的键值对是可以设置过期时间的,那么就会涉及到一个问题,Redis到底是如何做到响应快的同时有能快速地释放掉过期的键值对的呢?不卖关子了,直接说答案,那就是Redis两个策略:定期删除和惰性删除…...
python爬虫降低IP封禁,python爬虫除了使用代理IP和降低请求频率,还有哪些方法可以应对IP封禁?
文章目录 前言1. 利用 CDN 节点2. 模拟真实用户行为3. 使用 IP 池轮换策略4. 处理 Cookie 和会话信息5. 分布式爬虫 前言 除了使用代理 IP 和降低请求频率,以下这些方法也能应对 IP 封禁: Python 3.13.2安装教程(附安装包)Python…...
Unity URP Moblie AR示例工程,真机打包出来,没阴影
效果: unity ar示例演示 现象: 真机打包测试私活没有阴影 Unity版本:2022.3.4f1c1 分析原因: Prefab :ARFeatheredPlane中也有材质,一个用于环境遮挡,一个用于阴影接受。 按理说有啊。 urp …...
单片机 | 基于51单片机的自动循迹小车设计
以下是一个基于51单片机的自动循迹小车设计详解,包含原理、公式和完整代码: 一、系统原理 核心模块: 传感器:红外对管(TCRT5000)x4主控芯片:STC89C52RC(51单片机)电机驱动:L298N驱动模块电源:7.4V锂电池(电机) + 5V稳压(单片机)工作原理: 红外对管发射红外线,…...
【AI】——结合Ollama、Open WebUI和Docker本地部署可视化AI大语言模型
🎼个人主页:【Y小夜】 😎作者简介:一位双非学校的大三学生,编程爱好者, 专注于基础和实战分享,欢迎私信咨询! 🎆入门专栏:🎇【MySQL࿰…...
