当前位置: 首页 > article >正文

技术架构演进之路:从单体应用到Docker容器编排

文章目录概念与指标阶段一单机架构与应用数据分离阶段二流量爆发引入应用集群与负载均衡阶段三打破数据瓶颈的读写分离与缓存机制阶段四垂直分库与微服务拆分阶段五Docker 容器化与 K8S 编排对于很多开发者而言如果没有经历过中大型系统的实际开发往往很难从全局视角理解技术架构的演变过程。本文将以一个“电子商务”应用包含商品浏览、购物车、订单支付等核心业务为例带大家推演系统从百级并发到千万级并发情况下的服务端架构演进之路。在此过程中我们会探讨每个阶段面临的瓶颈以及引入的相关技术并最终揭示 Docker 和 KubernetesK8s等云原生技术如何成为现代复杂架构的高效解药。概念与指标在深入架构演进之前我们需要对一些核心术语建立共识系统System与组件Component系统通常由多个相互配合的程序组成为了分离职责我们会将其拆分为不同的模块或组件如支付组件、库存组件。分布式与集群Cluster当这些模块被部署在不同的物理服务器上并通过网络通信时就形成了分布式系统而为了实现特定目标将多台相同职责的服务器集中起来协同工作则称为集群。主Master与从Slave在集群中承担核心写入或控制职责的节点称为“主”负责附属职责如读取同步、备份的称为“从”。中间件Middleware连接不同应用程序、工具或数据库的桥梁如消息队列、缓存中间件。衡量一个系统架构好坏有几个关键的评价指标可用性Availability系统正常提供服务的期望概率常说的“4个9”即 99.99% 的可用性意味着每年宕机时间不超过 52.6 分钟。响应时长RT - Response Time从用户完成输入到系统给出反馈的时长。吞吐量Throughput与 并发Concurrent吞吐量是单位时间内的成功处理量如 TPS/QPS并发是同一时刻系统支持的最高请求量。阶段一单机架构与应用数据分离项目初期为了利用精干团队快速将业务推向市场并验证想法单机架构是最合适的选择。此时所有的鸡蛋都放在一个篮子里Web 服务如 Nginx/Tomcat、应用程序代码、甚至是数据库如 MySQL全都挤在同一台物理机或云服务器上。然而随着第一批用户的到来系统迎来了第一次大考。电商应用中的图片加载、动态页面渲染消耗 CPU 和内存与数据库的查询写入消耗磁盘 I/O开始互相抢占单台服务器的物理资源。一旦数据库执行一个复杂的查询整个 Web 服务可能就会卡顿。为了以最小代价提升承载力系统演进为应用数据分离架构。此时我们将数据库服务独立部署到数据中心的另一台高配置服务器上应用服务通过局域网访问数据。这为系统争取了成倍的性能空间。读取过程用户在浏览器输入域名DNS 解析为应用服务器的 IP。请求到达应用服务器Tomcat应用代码发起 SQL 查询。请求通过网络打到独立的数据库服务器数据库从磁盘或内存中检索商品信息并返回给应用。应用服务器拼接 HTML 或 JSON返回给用户。写入过程用户提交注册表单请求到达应用服务器。应用服务器进行参数校验后生成INSERTSQL 语句通过网络发送至数据库服务器。数据库将新用户数据落盘返回成功信号应用服务器提示用户注册成功。阶段二流量爆发引入应用集群与负载均衡当应用出现爆款例如平台推出了秒杀活动单台应用服务器的 CPU 和内存再次告急。此时面临两种扩展策略纵向扩展Scale Up购买更昂贵的超级服务器和横向扩展Scale Out增加普通服务器数量分担流量。由于单台硬件的性能增长存在物理上限且成本呈指数级激增横向扩展成为了必然选择这就诞生了应用服务集群架构。为了解决“海量用户流量究竟该分配给哪台应用服务器”的问题系统引入了负载均衡组件如 Nginx、HAProxy、LVS 等。负载均衡器就像一个尽职的交通警察根据特定的算法调度流量。读取与写入的共性链路用户的请求首先会打到负载均衡服务器如 Nginx。Nginx 根据配置的算法如轮询 Round-Robin、加权轮询、或者基于客户端 IP 的哈希算法 Hash计算出目标应用服务器假设有 Server A, Server B, Server C。Nginx 将请求转发给 Server B假设被选中。Server B 执行业务逻辑并通过网络去读取或写入唯一的那个后台数据库。Server B 将结果返回给 NginxNginx 再转交给用户。应用层虽然可以无限横向增加机器但所有成千上万的并发请求最终都汇聚到了同一个单点数据库上。数据库的 I/O 瓶颈即将爆发。阶段三打破数据瓶颈的读写分离与缓存机制在电商场景中经典的法则是“读多写少”浏览商品的人数远远大于最终下单付款的人数比例可能高达 10:1 甚至更高。既然所有的应用服务器都在挤压单一数据库我们架构演进的下一步就是读写分离主从分离。设定一个主库Master负责所有写入操作并配置多个从库Slave。主库的数据变更会通过 Binlog二进制日志实时或半实时地同步到从库从库专门用来分担庞大的读取压力。同时为了避免每次代码里都要写死“读哪个库、写哪个库”我们会引入MyCat、ShardingSphere 等数据库中间件让应用层像操作单机数据库一样无感操作主从集群。进一步分析发现系统中存在大量被频繁读取且极少变动的“热点数据”如商品类目、首页推荐商品。每次都去数据库查太慢了于是我们引入了分布式缓存如 Redis Cluster把高频数据放在内存里。读取过程用户请求到达应用服务器。应用首先查询Redis 缓存中是否有该商品数据。缓存命中Cache Hit直接从 Redis 内存中拿到数据返回耗时极短毫秒级不经过数据库。缓存未命中Cache Miss应用层通过数据库中间件将查询请求路由到某个数据库从库Slave。从库返回数据给应用应用将数据写入 Redis 缓存以便下次使用并返回给用户。写入过程用户请求到达应用层。应用通过中间件将UPDATE语句路由到数据库主库Master执行。主库完成写入并将变更日志Binlog异步同步给所有从库存在几十毫秒的延迟。为了保证数据一致性应用在写入主库成功后会删除或更新 Redis 中对应的旧缓存。阶段四垂直分库与微服务拆分随着公司业务版图的扩张加入金融、物流、直播等数据量爆炸式增长。单个数据库即使做了主从分离其磁盘容量和单表查询效率也达到了极限例如单表数据上亿。我们开始实施垂直分库根据业务领域将原来的大一统数据库拆分为“用户库”、“订单库”、“商品库”。与此同时技术团队规模可能已经达到了几百人。所有人都在同一个代码工程单体架构里提交代码极其容易引发冲突每次发布都需要停机几十分钟。微服务架构Microservices应运而生。我们将庞大的系统拆分为一个个独立的、职责单一的微服务用户服务、订单服务、支付服务交由不同团队独立开发、独立部署。为了让微服务之间能够顺畅沟通并对外提供统一入口我们引入了API Gateway网关并通过Spring Cloud 或 Dubbo等服务治理框架进行服务注册、发现和 RPC 调用。对于耗时较长、无需即时返回的业务如支付成功后发短信我们引入了Kafka / RabbitMQ 等消息队列进行异步解耦。读写数据过程以跨服务业务为例用户下单入口分发用户的下单请求首先到达API 网关网关进行鉴权后将请求路由给“订单微服务”。跨服务调用读订单服务自身没有商品和库存信息它通过 RPC如 Dubbo/Feign同步调用“商品微服务”查询商品是否存在调用“库存微服务”检查库存是否充足这些微服务会各自去查自己的 Redis 或专属从库。核心落盘写检查通过后订单微服务将订单数据写入自己专属的“订单主库”。异步解耦写订单服务向消息队列MQ发送一条“订单已创建”的消息然后立刻向用户返回“下单成功请支付”。后续消费“库存微服务”和“积分微服务”在后台默默监听 MQ 里的消息收到消息后分别去扣减库存库的记录和增加用户库的积分。最终一致性阶段五Docker 容器化与 K8S 编排微服务架构完美解决了组织协同和复杂业务解耦的问题但却将巨大的压力转移给了运维团队。过去只需要部署一个 Tomcat 工程现在需要部署几十上百个微服务。每个微服务对操作系统版本、JDK 版本、环境变量的要求都不一样经典的“在我的电脑上明明能跑”问题。同时面对“双十一”这种脉冲式流量靠人工去临时购买服务器、配环境、部署代码根本来不及。这就是Docker 容器化技术大显身手的时刻。Docker 将应用及其所有依赖环境操作系统内核之上的所有东西打包成一个轻量级的、标准化的镜像Image。无论在开发环境、测试环境还是生产环境只要启动这个镜像服务就能瞬间完美运行彻底抹平了环境差异的痛点。面对成千上万个 Docker 容器我们需要一个极其高效的“大管家”这就是KubernetesK8S容器编排引擎。K8S 将底层物理服务器池化它可以自动调度决定哪个容器运行在哪个物理节点上最合适。自愈能力一旦某个支付服务的容器崩溃K8S 会在几秒钟内在另一台机器上重新拉起一个新容器。弹性伸缩HPA当监控到 CPU 使用率飙升时K8S 可以全自动地将订单服务的容器数量从 10 个扩容到 100 个流量低谷时再自动缩容。读写数据在系统层面业务的读写逻辑与阶段四类似但底层网络与部署形态发生了根本改变Ingress 接入外部流量首先打入 K8S 集群的 Ingress 控制器充当集群总入口。Service 发现与负载请求被转发到具体的 K8S Service如order-service。Service 就像一个内部的负载均衡器它知道当前有多少个健康的PodDocker 容器的载体在运行。Pod 处理请求流量打入某个具体的 Docker 容器中。如果此时大促流量涌入导致该 Pod 的 CPU 飙升K8S 的 HPA水平 Pod 自动扩缩容会迅速克隆出多个相同的 Pod 来分担流量。持久化数据容器虽然是随时生灭的无状态但它们会通过网络连接到外部稳定的高可用数据库集群或云原生数据库中进行读写保证业务数据永不丢失。

相关文章:

技术架构演进之路:从单体应用到Docker容器编排

文章目录 概念与指标阶段一:单机架构与应用数据分离阶段二:流量爆发引入应用集群与负载均衡阶段三:打破数据瓶颈的读写分离与缓存机制阶段四:垂直分库与微服务拆分阶段五:Docker 容器化与 K8S 编排 对于很多开发者而言…...

基于 Spring AI Alibaba 构建混合 RAG Agent

基于 Spring AI Alibaba 构建混合 RAG Agent SpringAIAlibaba官方文档:https://java2ai.com/docs/overview 如果你正在用大模型(LLM)做企业知识库、客服系统或者内部助手,你一定遇到过这样的尴尬: 用户问得稍微模糊点&…...

EagleEye快速上手:DAMO-YOLO TinyNAS目标检测零配置体验

EagleEye快速上手:DAMO-YOLO TinyNAS目标检测零配置体验 想体验毫秒级的目标检测,但又不想折腾复杂的环境配置和模型训练?今天介绍的EagleEye,或许就是你一直在找的“开箱即用”的解决方案。它基于阿里巴巴达摩院开源的DAMO-YOLO…...

第 22 篇 系列收官:进阶路线与就业面试指南

目录 一、第一优先级:深入 Linux 内核核心原理 二、第二优先级:行业垂直领域深入 三、第三优先级:安卓系统深度定制与开发 四、第四优先级:硬件与原理图设计 五、第五优先级:RTOS 实时操作系统 大家好,我是黒漂技术佬。从第一篇的安卓驱动核心架构,到今天的收官篇,…...

写作压力小了!9个AI论文平台深度测评,本科生毕业论文+科研写作必备工具推荐

随着学术研究的不断深入,本科生在撰写毕业论文和科研写作过程中面临的压力日益增大。从选题构思到文献综述,从框架搭建到内容润色,每一个环节都可能成为阻碍进度的“拦路虎”。为了帮助更多学生高效完成写作任务,笔者基于2026年的…...

基于Phi-3-mini-128k-instruct的Java面试题智能解析与生成实战

基于Phi-3-mini-128k-instruct的Java面试题智能解析与生成实战 最近跟几个做Java开发的朋友聊天,发现大家都有个共同的烦恼:准备面试太痛苦了。网上的面试题五花八门,答案质量参差不齐,有些解析看得人云里雾里。自己整理吧&#…...

AI 时代,前端开发要坚持 3 个原则

昨天我参加了一场 AI 技术大会,满脑子想着学点新东西。结果最让我震撼的,不是什么新技术,而是大屏幕上的这句话:“人们经常问我:未来 10 年什么会变?这确实是个好问题。但几乎没人问:未来 10 年…...

直播回放下载的技术突破与完整指南:解决三大核心难题的实战方案

直播回放下载的技术突破与完整指南:解决三大核心难题的实战方案 【免费下载链接】douyin-downloader 项目地址: https://gitcode.com/GitHub_Trending/do/douyin-downloader 在数字内容快速迭代的时代,直播回放作为知识传递与内容沉淀的重要载体…...

篡改考勤算法:把团建计入加班时长的技术实践与测试陷阱

一、问题背景:模糊的团建加班认定规则当前企业考勤系统普遍缺失团建活动定性模块。司法实践表明,团建是否构成加班需综合三大要素:强制性(如活动通知中的“必须参加”措辞)、工作相关性(如含业务培训的混合…...

抖音直播回放高效管理完整解决方案:3大技术突破+5个实战技巧

抖音直播回放高效管理完整解决方案:3大技术突破5个实战技巧 【免费下载链接】douyin-downloader 项目地址: https://gitcode.com/GitHub_Trending/do/douyin-downloader 需求洞察:为什么传统工具无法满足直播内容管理需求? 在信息爆…...

一文读懂Python:从计算机底层原理到人工智能的编程语言

前言如果你对编程感兴趣,或者想进入IT行业,那么你一定听说过Python这个名字。它被誉为“胶水语言”,也是人工智能领域的“头号玩家”。但你真的了解Python吗?它为什么能如此流行?它和计算机硬件有什么关系?…...

Android手机秒变黑客神器:Termux+Kali Linux完整安装指南(附VNC远程桌面配置)

Android手机上的Kali Linux实战指南:从Termux到完整渗透测试环境 在移动设备上运行完整的渗透测试环境,早已不再是极客圈子的幻想。随着ARM架构性能的不断提升和Termux这类终端模拟器的成熟,你的Android手机完全可以变身为便携式安全审计工具…...

Vue.js如何通过WebUploader控件解决汽车制造局域网CAD图纸的超大附件分片断点?

前端老炮的20G文件夹上传大冒险(附部分代码) 各位前端同仁们,我是老张,一个在辽宁苦哈哈写代码的"前端民工"。最近接了个活,客户要求用原生JS实现20G文件夹上传下载,还要支持IE9!这简…...

fanqienovel-downloader全链路解决方案:从技术架构到场景落地的完整指南

fanqienovel-downloader全链路解决方案:从技术架构到场景落地的完整指南 【免费下载链接】fanqienovel-downloader 下载番茄小说 项目地址: https://gitcode.com/gh_mirrors/fa/fanqienovel-downloader 价值定位:重新定义数字阅读的管理范式 当你…...

MCP与Agent Skills:不是非此即彼,而是各司其职

最近在各种技术社区里,看到些有意思的讨论:“现在 Agent Skills这么灵活,MCP是不是该被淘汰了?”、“做智能体架构,直接基于MCP做能力扩展不就行了,搞Skills纯属多此一举。”说实话,这种二选一的…...

UniApp+AI智能客服实战:从零构建高效对话系统的避坑指南

最近在做一个跨平台的智能客服项目,用UniApp来打主力。过程中踩了不少坑,也总结了一些实用的经验,今天就来聊聊怎么从零开始,在UniApp里构建一个既高效又稳定的AI对话系统。我们的目标是:响应快、不掉线、多端体验一致…...

通义千问2.5-7B-Instruct新手必看:3步完成vLLM+WebUI部署,免费开箱即用

通义千问2.5-7B-Instruct新手必看:3步完成vLLMWebUI部署,免费开箱即用 想在自己的电脑上免费体验一个功能强大、响应迅速的大语言模型吗?通义千问2.5-7B-Instruct就是一个绝佳的选择。它拥有128K的超长上下文,代码和数学能力堪比…...

救命神器!万众偏爱的AI论文软件 —— 千笔写作工具

你是否曾为论文选题而发愁?是否在深夜面对空白文档毫无头绪?是否反复修改却仍不满意表达效果?论文写作的种种难题,让无数学生陷入焦虑。而如今,一款真正改变学术写作方式的AI工具——千笔AI,正在被越来越多…...

好消息!44.7TB北美洲倾斜摄影已全部入库

最近,我们已完成北美洲倾斜摄影数据的全部入库,该数据可用于在内网进行私有化离线部署。 01 44.7TB倾斜摄影数据已全部入库 北美洲倾斜摄影数据全部入库后,一共有44.7TB大小。 北美洲倾斜摄影覆盖范围 数据文件一共有13201个数据分块&…...

从理论到实践:深入解析有源滤波器的设计与应用

1. 有源滤波器的核心原理与分类 有源滤波器是现代电子系统中的关键组件,它通过运算放大器与无源元件(电阻、电容)的协同工作,实现对特定频率信号的选择性处理。与无源滤波器相比,有源滤波器最显著的优势在于能够提供信…...

VCSA 8.0.3 企业级部署与AD域深度集成实战

1. VCSA 8.0.3 企业级部署核心要点 对于企业IT架构师来说,VCSA 8.0.3的部署不仅仅是安装一个管理平台,而是构建整个虚拟化基础设施的基石。我在多个企业级项目中实施VCSA部署时发现,前期规划的质量直接决定了后期运维的难易程度。下面我就从实…...

1990-2025年我国省市县三级的逐年土地覆盖数据(9类用地/Excel/Shp格式)

土地覆盖数据是我们在各项研究中经常使用的数据。土地覆盖数据可以帮助我们确定哪儿是建设用地,哪儿是水域,哪儿是农田等!我们之前分享了武汉大学杨杰和黄昕教授发布的1985-2025年中国30米年度土地覆盖栅格数据! 为了更直观地反映…...

SAP BOM多层展开与物料类型筛选的实战应用

1. SAP BOM多层展开的核心价值 在制造业的日常运营中,BOM(物料清单)就像产品的基因图谱,记录着从原材料到成品的完整血缘关系。我处理过最复杂的BOM有17层嵌套,涉及3000多个零部件,手工整理这样的结构简直…...

【量化工具推荐】期货量化交易账户与资金查询平台对比:8款平台深度分析

一、前言 账户资金、可用资金、冻结资金等是风控与下单决策的基础。不同期货量化平台在账户与资金查询的 API、更新频率、与实盘一致性上差异明显。本文对比8款期货量化平台的账户与资金查询能力,均为期货量化专用产品。 注意:本文仅对比期货量化账户与…...

# 存算一体架构下的高效编程实践:用 Rust实现内存感知型计算任务调度

存算一体架构下的高效编程实践:用 Rust 实现内存感知型计算任务调度 在当前 AI 与边缘计算飞速发展的背景下,传统冯诺依曼架构的瓶颈日益凸显——数据搬运成本高、延迟大、能效低。而“存算一体”(Computing-in-Memory, CIM)技术正…...

shacct.dll文件丢失找不到 免费下载修复方法分享

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…...

Deep3D:让普通视频焕发立体生机的深度学习工具

Deep3D:让普通视频焕发立体生机的深度学习工具 【免费下载链接】Deep3D Real-Time end-to-end 2D-to-3D Video Conversion, based on deep learning. 项目地址: https://gitcode.com/gh_mirrors/dee/Deep3D 在数字内容创作的浪潮中,3D视频以其沉浸…...

Frida 16.0.10与雷电模拟器完美搭配:手把手教你搭建移动安全测试环境

Frida 16.0.10与雷电模拟器深度整合:打造专业级移动安全测试平台 移动应用安全测试已成为开发周期中不可或缺的环节。对于安全研究人员和开发者而言,一个稳定高效的测试环境能够显著提升漏洞挖掘和逆向分析的效率。本文将详细介绍如何将Frida 16.0.10这一…...

Windows 10下用Anaconda配置pybind11环境:Python调用C++实战指南

Windows 10下用Anaconda配置pybind11环境:Python调用C实战指南 在当今数据密集型计算领域,Python因其简洁易用而广受欢迎,但性能瓶颈时常成为开发者的痛点。而C以其卓越的执行效率著称,却面临着开发周期长的挑战。pybind11这座桥梁…...

从零搭一个 AI Agent 框架,到底需要理解什么?

从零搭一个 AI Agent 框架,到底需要理解什么?Agent Reasoning Acting。一篇从 ReAct 理论到 279 行代码实现的完整拆解——三种思维模式、六大框架选型、上下文工程的核心地位,以及一个能跑 Shell、读写文件、执行 Python 的极简智能体。&a…...