负载均衡相关基本概念
负载均衡在系统架构设计中至关重要,其核心目标是合理分配负载,提升系统整体性能和可靠性。本文简要介绍了负载均衡的基本概念,包括四层和七层负载均衡、负载均衡的使用场景和实现方式、负载均衡的常用算法以及一些配置相关知识。
1、负载均衡基本概念
负载均衡(Load Balancing)是一种将网络流量、计算任务或数据请求动态分配到多个服务器或资源的机制,旨在优化资源使用、最大化吞吐量、减少响应时间,并避免单点故障。其核心目标是通过合理分配负载,提升系统整体性能和可靠性。负载均衡可以提升性能,避免单台服务器过载,充分利用集群资源;通过健康检查机制自动剔除故障节点并将流量转发到健康的节点,保障服务的连续性,提升系统的可用性;支持横向扩容和弹性扩展,以应对业务增长的需求和流量的变化;部分负载均衡还集成了防火墙和DDOS、黑名单等安全防护功能,提升了系统了安全防御能力。
1.1 L4和L7层负载均衡
1.1.1 OSI七层网络模型和TCPIP四层网络模型
OSI七层网络模型是一种理论框架,核心是分层解耦,将网络自底向上分为物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。
TCPIP模型是实际互联网协议栈的基础,强调的是实用性和可扩展性,分为网络接口层、网络层、传输层和应用层。
1.1.2 L4和L7层负载均衡
负载均衡包括2层、3层、4层和7层负载均衡,其中L4和L7层负载均衡使用最多。
1)L7层负载均衡
七层负载均衡器位于OSI模型的最高层,即应用层,通过对网络流量进行分析和处理,将请求分发到不同的服务器上,以实现负载均衡。在实现上七层负载均衡器能够解析应用层的内容,如HTTP头、URL路径、Cookie等,根据具体的请求信息进行更加精细的负载均衡。这种负载均衡方式不仅考虑网络数据包的源IP地址、目标IP地址和端口号,还深入到数据包的负载内容,从而做出更智能化的请求分发决策。
七层负载均衡能够实现智能路由,支持按照业务逻辑来分发流量,比如灰度发布、A/B测试等;另外还可以实现实现深度健康检查,可以检测到HTTP状态码、响应内容等;同时在安全方面也有增强,支持Web应用防火墙WAF、防DDOS攻击等。不过由于七层负载均衡需要解析和分析HTTP的数据,会带来一定的CPU开销;另外在协议支持上受限,仅支持特定的协议,比如HTTP或HTTPS。
2)L4层负载均衡
四层负载均衡工作在OSI模型的传输层,在接收到客户端请求后,通过修改数据包的地址信息(IP+端口号)将流量转发到应用服务器。在实现上负载均衡设备接收到客户端请求后根据特定的算法转发请求,同时会将客户端的源地址转换为负载均衡设备的地址(NAT地址转换),服务器接收到请求后会处理请求并返回给负载均衡,负载均衡设备将请求返回给客户端,并将服务器的源地址改为负载均衡设备的地址。
四层负载均衡仅处理IP和端口,转发效率高;同时不解析应用层内容,处理速度快;并且支持所有基于TCP/UDP的协议。缺点是无法根据HTTP URL、Cookie等信息做智能路由;另外只能检测端口是否存活,无法判断服务实际状态。
3)四层和七层负载均衡对比如下所示
在技术实现上,像F5复制均衡设备、Nginx等均可以实现七层和四层的负载均衡。
1.2 负载均衡使用场景分类
负载均衡的应用场景很多,比如高并发的流量请求、分布式架构下的系统扩展和弹性收缩、容灾和高可用下消除单点故障等。
1)高并发流量请求
在高并发的业务流量访问时候,通过负载均衡将用户请求均匀分布到多台服务器,避免单台服务器过载。比如电商平台在双十一促销期间,通过负载均衡动态扩展后端服务器集群,处理海量订单和页面访问请求。
2)系统扩展与弹性伸缩场景
在分布式架构以及微服务使用下,随着业务的增长需要动态的调整服务器数量以应对负载的变化,实现灵活的路由负载请求。通过负载均衡设备按需添加或移除设备,无缝集成弹性扩缩容策略。比如Web服务器集群通过负载均衡实现动态扩容,应对突发流量。
3)容灾和高可用场景
基于负载均衡的故障检测机制自动屏蔽故障节点,将流量重定向至健康服务器,从而避免关键业务需避免因单台服务器故障导致服务中断。另外结合智能DNS(如云解析DNSPod),将域名解析至不同地域的负载均衡实例,实现全局流量调度。某地域故障时,暂停该地域解析即可保障业务连续性。
负载均衡技术通过流量调度、资源扩展、故障容错等机制,已成为信息系统架构的关键组件。其应用场景也从传统Web服务、数据库集群到云原生、分布式数据库、微服务等领域:
- Web应用负载均衡:将用户请求分发到多个Web服务器,确保每个服务器获得相对均衡的负载,提高整体性能和响应速度;同时增加了系统的冗余度,即使某一台服务器出现故障,其他服务器也能继续提供服务。
- 数据库负载均衡:利用负载均衡技术将读请求分发到多个数据库副本或只读实例上,减轻主数据库的压力,提高查询性能。
- 应用服务负载均衡:将客户端请求分散到多台应用程序服务器上,确保系统处理能力随业务需求弹性扩展。另外随着用户数量的增长,可以轻松地增加新的服务器来应对增长的需求,实现灵活扩展。
- 云平台负载均衡:使用负载均衡实现云资源(如虚拟机、容器)间网络流量的自动分配,实现云服务的高可用性和水平扩展。通常云提供商通常会提供内置的负载均衡解决方案,如Kubernetes Service。
1.3 负载均衡的实现
负载均衡技术根据实现方式可分为软件层面和硬件层面,两者在性能、成本、灵活性和适用场景上各有特点。
1.3.1 软件负载均衡实现
软件负载均衡通常由操作系统、应用程序或云平台实现,灵活性高且成本低,有开源的软件实现,也有商用的软件。主要有以下几种:
- LVS(Linux Virtual Server):基于Linux内核的四层负载均衡,支持NAT、DR、TUN三种模式,具备高并发(单机可支持上万连接)和低资源消耗特性。适用于大规模TCP/UDP应用(如Web服务、数据库集群)。
- Nginx:支持四层(TCP/UDP)和七层(HTTP/HTTPS)负载均衡,提供反向代理、SSL卸载、动态路由(基于URL、Header等)功能。适用于Web服务、API网关及内容分发场景。
- HAProxy:专注于七层负载均衡,支持ACL规则、会话保持、健康检查,性能接近硬件设备(如F5)。适用于微服务架构、高并发HTTP/HTTPS服务。
- 云厂商的SLB服务:比如阿里云SLB,支持四层(TCP/UDP)和七层(HTTP/HTTPS)负载均衡,支持跨可用区容灾。
- 数据库层负载均衡:部分数据库厂商在驱动层实现负载均衡,通过在JDBC中配置连接数据库的URL串,实现数据库层负载均衡
以Nginx为例,Nginx支持三种不同的负载均衡策略:
- 轮询:每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器down掉能够被自动剔除。轮询算法适合服务器配置相当,无状态且短平快的服务使用。
- weight权重:指定轮询的几率,weight和后端的访问比例成比例,weight权重越高比例越大。通常用于后端服务器配置不均的情况。
- ip_hash:上面两种算法存在一个问题是就是无法做到会话保持,当用户登录到服务器上后,第二次请求的时候会被定位到服务器集群中的某一个,那么已经登录到某个服务器上的用户会重新定位到另一台,之前的登录信息会丢失。ip_hash算法可以解决这个问题,当用户再次访问请求时,会通过hash算法自动定位到已经登录的服务器上,这样每个客户端可以固定在某个web服务器上,解决客户端session的问题。
配置如下:
upstream myServer { server 192.168.112.101:8080 down; server 192.168.112.101:8090 weight=2; server 192.168.112.101:6060; server 192.168.112.101:7070 backup;
}
#指定负载均衡策略为ip_hash
upstream myServer {ip_hashserver 192.168.112.101:8080;
server 192.168.112.101:6060;
}
- down:表示当前的server暂时不参与负载
- Weight:默认为1,weight越大,负载的权重就越大。
- max_fails:允许请求失败的次数默认为1,当超过最大次数时,返回proxy_next_upstream 模块定义的错误
- fail_timeout:max_fails 次失败后,暂停的时间。
- Backup:其它所有的非backup机器down或者忙的时候,请求backup机器。所以这台机器压力会最轻。
1.3.2 硬件负载均衡实现
硬件负载均衡基于专用设备,性能卓越但成本高昂,比如传统的硬件负载均衡器F5 BIG-IP,支持四层(TCP/UDP)和七层(HTTP/HTTPS)负载均衡,提供流量管理、安全防护(如DDoS防御)、SSL加速等功能,同时提供智能化流量调度策略(如轮询、最少连接、源地址哈希等),并支持高并发场景。
随着国产化技术栈信创替换的迭代,在金融、运营商等重点行业传统的负载均衡设备也逐步由国产设备来改造替换。但是国产负载均衡设备商无论在性能还是功能稳定性上和F5等差距明显,在核心系统的替换以及国产CPU和操作系统的生态适配上任重道远。
1.4 负载均衡算法
负载均衡是将业务流量负载到不同的服务器,而负载均衡算法就是实现在不同服务器之间分配网络流量的逻辑。负载均衡算法的选择会影响负载的分配机制,从而影响到性能和业务连续性,下面将介绍几种常用的负载均衡算法。
1.4.1 Round Robin(轮询算法)
轮询算法很简单,将前端请求按照顺序轮流分配到后台服务器上,不用关心后台服务器的负载和实际连接情况。轮询算法适用于后端服务器性能大致相当的情况,如果某台机器性能异常承载不了这么多的流量,会造成业务访问异常。当然在实际的运维工作中,会采用标准化的配置相同的服务器,以减少维护成本。如下图所示流量请求安装顺序分发到后台三个节点中,保证了流量均衡。
1.4.2 Weighted Round Robin(加权轮询算法)
加权轮询算法是对轮询算法的优化,因为后台服务器在配置和性能上有差异,在负载配置上将配置高、负载低的机器分配更高的权重,使其能处理更多的请求,而配置低、负载高的机器,则给其分配较低的权重,降低其系统负载。加权轮询算法适用于后端具备不同负载容量的服务器,但是配置上更为复杂,也不利于标准化的配置。
1.4.3 Fastest Response Time(最快响应算法)
最快响应算法根据负载均衡器到每一个后端服务器节点的网络响应时间(RTT时延),并将下一个到达的连接请求动态分配给响应时间最短的节点。该算法能够实现应用请求的快速响应,提高业务请求的响应时间,但是会出现请求集中在几个响应最快的节点上。如下图所示,节点1和节点3的响应时间为20ms、节点2为30ms,根据最快响应算法,连接请求负载分发到节点1和节点3中。
1.4.4 Least Connections(最小连接算法)
像前面的轮询算法按照前端的请求次数均衡分配,实现后端服务器的负载均衡,但是实际上连接请求并不能真实反应服务器的负载情况。因此引入了最小连接算法,根据后端服务器当前的连接情况,动态的选取其中当前积压连接数最少的一台服务器来处理当前请求,尽可能的提高后台服务器利用率。最小连接算法在本质上是从后端服务器的角度来观察系统的负载,能够最大限度的利用后端服务器的资源,不足之处是负载均衡需要更多的资源来判断后端服务的连接情况。如下图所示最小连接算法的实现:
除了上面4种,负载均衡算法还有随机法、加权随机法、源地址哈希法等不多介绍,实际应用中轮询算法和最小连接算法应用的较多。
1.4.5 轮询算法和最小连接算法对比
1)轮询算法
轮询算法是静态的负载均衡算法,按照顺序依次分配请求、实现成本低。当服务器性能相近时,能够公平的分配请求。轮询算法中无需记录服务器实时状态,资源消耗较少。不过如果服务器性能差异较大,性能差的服务器可能因接收相同请求量而成为瓶颈。另外对于一些请求处理时间差异较大时(比如短连接和长连接混合的场景),分配可能不合理。
2)最小连接算法
最小连接算法根据服务器当前连接数分配请求,实时响应负载变化,适合处理时间差异大的场景(如长连接、FTP服务等)、兼容不同性能的服务器。最小连接算法会优先选择负载较轻的服务器,降低单点压力。缺点是需实时统计连接数,增加系统复杂度与资源消耗;另外会依赖连接数的准确性,如果连接数统计出现延迟,可能导致误判,并且未考虑到服务器实际处理能力,比如高配的服务器可以处理更多的连接。同时可能存在的一个潜在问题是冷启动问题,新增服务器初始连接数为0,可能被瞬间大量请求压垮。
以下是两种算法的对比:
维度 | 轮询算法 | 最小连接算法 |
---|---|---|
定义 | 按照顺序依次分配请求 | 分配给连接数最少的服务器 |
优点 | 简单易实现 | 根据实际负载分配 |
缺点 | 无法考虑性能差异 | 实现相对复杂 |
复杂度 | 低(静态、无状态) | 高(需实时监控连接数) |
动态适应性 | 弱(无法响应负载变化) | 强(实时调整) |
性能差异兼容性 | 弱(需加权轮询改进) | 中(需加权最小连接优化) |
适用场景 | 短连接、服务器性能均衡 | 长连接、负载波动大 |
1.5 负载均衡常见配置
1.5.1 探测协议
负载均衡的健康探测协议有很多种类型:
- HTTP探测:通过发送HTTP请求(如GET方法)到指定路径,根据返回的状态码(如200 OK)判断服务端健康状态。适用于Web服务场景,可深度检测应用层可用性。
- HTTPS探测:在HTTP探测基础上增加SSL/TLS加密,适用于需要安全验证的场景。
- TCP探测:基于TCP三次握手建立连接,成功后立即断开(可能发送RST包)。仅检测端口可达性,不涉及应用层协议,适用于数据库、邮件服务等非HTTP场景。
- UDP探测:向目标端口发送UDP数据包,根据响应判断服务端状态。常用于DNS、流媒体等基于UDP协议的服务
- ICMP探测:通过Ping命令检测网络层连通性,适用于基础网络可达性检查,无法检测应用服务是否正常
- 数据库协议探测:如MySQL的专项协议健康检查,查询select 1 from dual返回结果
对于数据库层而言,使用兼容数据库协议探测,通过连接数据库并查询语句返回结果的方式,能更加准确的判断数据库是否健康。
1.5.2 会话保持
会话保持(Session Persistence),用于确保来自同一用户的请求在特定时间段内始终被转发到同一台后端服务器。会话保持适用于需要保存会话状态的应用场景,比如购物车、登录信息等,避免因请求被分发到不同服务器导致会话数据丢失。
会话保持在实现方式上有以下几种:
- 基于源IP地址(四层会话保持):根据客户端IP哈希值分配请求,实现简单但存在局限性。例如,多个用户通过同一代理(NAT)访问时,可能导致服务器负载不均。
- 基于Cookie(七层会话保持):由负载均衡器生成并插入Cookie,后续请求根据Cookie值分配服务器。此方法灵活性高,但需客户端支持Cookie。
- 基于Session存储:通过共享存储(如数据库、Redis)在多台服务器间同步Session信息,适用于高并发场景,但需额外维护存储系统。
- 长连接保持:维持TCP连接不断开,复用同一连接处理后续请求,减少连接开销,但需客户端和服务端支持,且存在连接泄漏风险。
另外需要配置会话保持时间,超时后若无新请求,会话自动终止。同时会话保持可能影响负载均衡的均匀性,并且需要防范Cookie篡改或Session劫持。
1.5.3 X-Forwarded-For
在负载均衡场景中,X-Forwarded-For(XFF)是一个关键的HTTP头部字段,用于透传客户端的原始IP地址,其核心作用是解决在反向代理或负载均衡器后端的服务器无法直接获取客户端真实IP的问题。当客户端请求经过负载均衡器(如Nginx、HAProxy)时,负载均衡器将客户端的原始IP地址添加到X-Forwarded-For头中,供后端服务器识别。但是实际使用过程中X-Forwarded-For并没有配置,因此在服务后端比如数据库层并不能看到客户端真实的IP地址,需要通过其它方法比如报文解析或NAT转换的方式获得。
参考资料:
- https://blog.csdn.net/wendao76/article/details/142490846
- https://zhuanlan.zhihu.com/p/5108202387
- 负载均衡算法介绍及应用连接池负载不均问题分析
相关文章:

负载均衡相关基本概念
负载均衡在系统架构设计中至关重要,其核心目标是合理分配负载,提升系统整体性能和可靠性。本文简要介绍了负载均衡的基本概念,包括四层和七层负载均衡、负载均衡的使用场景和实现方式、负载均衡的常用算法以及一些配置相关知识。 1、负载均衡…...
服务器中日志分析的作用都有哪些
服务器日志是用来检测和排查可疑行为的主要工具,运维团队可以通过分析和解读日志文件,发现服务器中潜在的网络安全威胁或异常活动,下面,就让小编和大家一起来了解一下服务器中日志分析的作用都有什么吧! 对于服务器中的…...
【React】useId
在 React 中,useId 是 React 18 引入的一个 Hook,用于生成一个在组件生命周期中保持稳定的唯一 ID。它主要用于: 无障碍(accessibility)场景,比如表单控件需要一个 id 和 label 的 htmlFor 属性配对。服务…...
【51单片机】0. 基础软件安装
最近心血来潮对单片机感兴趣,想着以后工作不景气了就跳槽,兴趣使然为以后做打算吧,开始跟着江科大学习单片机 1. 需要安装的软件说明 使用到的软件包括: Keli:写嵌入式代码的 stc-isp:烧录&下载代码…...

集成电路设计:从概念到实现的完整解析优雅草卓伊凡
集成电路设计:从概念到实现的完整解析优雅草卓伊凡 一、集成电路设计:芯片制造的”灵魂蓝图” 1.1 什么是集成电路设计? 集成电路(IC)设计是指通过电子设计自动化(EDA)工具,将数百…...

动态规划之网格图模型(二)
文章目录 动态规划之网格图模型(二)LeetCode 931. 下降路径最小和思路Golang 代码 LeetCode 2684. 矩阵中移动的最大次数思路Golang 代码 LeetCode 2304. 网格中的最小路径代价思路Golang 代码 LeetCode 1289. 下降路径最小和 II思路Golang 代码 LeetCod…...
uniapp 集成腾讯云 IM 消息搜索功能
UniApp 集成腾讯云 IM 消息搜索功能实战指南 一、功能实现原理 腾讯云 IM 通过 消息漫游 服务端搜索接口 实现消息检索,核心机制如下: 数据存储:消息默认存储7天(可扩展至30天)索引构建:基于消息内容自…...

robot_lab——rsl_rl的train.py整体逻辑
文章目录 Go2机器人训练流程详细分析概述1. 训练启动流程1.1 命令行参数解析RSL-RL相关参数组Isaac Sim应用启动参数组 1.2 RL配置1.3 Isaac Sim启动 2. 环境配置加载2.1 Hydra配置系统 3. 环境创建与初始化3.1 Gym环境创建3.2 Manager系统初始化3.2.1 ObservationManager3.2.2…...
AI推荐系统演进史:从协同过滤到图神经网络与强化学习的融合
每一次滑动手机屏幕,电商平台向你推荐心仪商品的背后,是超过百亿量级的浮点运算。从早期的“猜你喜欢”到如今的“比你更懂你”,商品推荐引擎已悄然完成从简单规则到深度智能的技术跃迁。 一、协同过滤:推荐系统的基石与演进 协同…...
Java-IO流之压缩与解压缩流详解
Java-IO流之压缩与解压缩流详解 一、压缩与解压缩概述1.1 基本概念1.2 Java中的压缩类库1.3 核心类与接口 二、ZIP压缩与解压缩2.1 ZIP格式简介2.2 使用ZipOutputStream创建ZIP文件2.3 使用ZipInputStream读取ZIP文件 三、GZIP压缩与解压缩3.1 GZIP格式简介3.2 使用GZIPOutputS…...

.NET 原生驾驭 AI 新基建实战系列(三):Chroma ── 轻松构建智能应用的向量数据库
在人工智能AI和机器学习ML迅猛发展的今天,数据的存储和检索需求发生了巨大变化。传统的数据库擅长处理结构化数据,但在面对高维向量数据时往往力不从心。向量数据库作为一种新兴技术,专为AI应用设计,能够高效地存储和查询高维向量…...
有声书画本
有声书画本服务标准 有声喵连接 一、基础服务(5r/w字) 核心: 基础删(快捷键AltD)调,优化播讲流畅度 执行: 删除冗余旁白 删除角色动作/心理的重复描述(例:小明冷笑道…...
StarRocks与Apache Iceberg:构建高效湖仓一体的实时分析平台
## 引言:数据湖的挑战与演进 在数据驱动的时代,企业数据湖需要同时满足海量存储、高性能查询、多引擎协作和实时更新等复杂需求。传统基于 Hive 的数据湖方案面临元数据管理低效、缺乏 ACID 事务支持、查询性能瓶颈等问题。在此背景下,**Sta…...
WebRTC 与 WebSocket 的关联关系
WebRTC(Web Real-Time Communication)与 WebSocket 作为重要技术,被广泛应用于各类实时交互场景。虽然它们在功能和特性上存在明显差异,但在实际应用中也有着紧密的关联,共同为用户提供流畅的实时交互体验。 一、WebR…...

8.RV1126-OPENCV 视频中添加LOGO
一.视频中添加 LOGO 图像大体流程 首先初始化VI,VENC模块并使能,然后创建两个线程:1.把LOGO灰度化,然后获取VI原始数据,其次把VI数据Mat化并创建一个感兴趣区域,最后把LOGO放感兴趣区域里并把数据发送给VENC。2.专门获…...

API管理是什么?API自动化测试怎么搭建?
目录 一、API管理是什么 (一)API管理的定义 (二)API管理的重要性 二、API管理的主要内容 (一)API设计 1. 遵循标准规范 2. 考虑可扩展性 3. 保证接口的易用性 (二)API开发 …...
Next.js+prisma开发一
1.初始化Next.js项目 #按版本安装 npx create-next-app13.4.5 如果最新版本 执行:npx create-next-applatest2. 安装Prima和客户端 npm install prisma --save-dev npm install prisma/client3.初始化Prisma,以SQLit举例 # 初始化 Prisma 并配置 SQLi…...

GIC v3 v4 虚拟化架构
ARMV8-A架构中包含了对虚拟化的支持。为了与架构保持匹配,GICV3也对虚拟化做了支持。新增了以下特性: 对CPU interface的硬件虚拟化虚拟中断maintenance 中断:用于通知监管程序(例如hypervisor)一些特定的虚拟机事件 …...

2025远离Deno和Fresh
原创作者:庄晓立(LIIGO) 原创时间:2025年6月6日 原创链接:https://blog.csdn.net/liigo/article/details/148479884 版权所有,转载请注明出处! 相识 Deno,是Nodejs原开发者Ryan Da…...
相机camera开发之差异对比核查一:测试机和对比机的硬件配置差异对比
【关注我,后续持续新增专题博文,谢谢!!!】 上一篇我们讲了: 这一篇我们开始讲: 目录 一、背景 二、:Camera硬件配置差异 2.1:硬件配置差异核查项 2.2 :核查方式 2.3 :高通camx平台核查 2.4 :MTK平台核查...

Flask+LayUI开发手记(七):头像的上传及突破static目录限制
看了看,上篇开发手记是去年8月份写的,到现在差2个月整一年了。停更这么长时间,第一个原因是中间帮朋友忙一个活,那个技术架构是用springboot的,虽然前端也用layUI,但和Flask-python完全不搭界,所…...
uv管理spaCy语言模型
本文记录如何在使用uv管理python项目dependencies时,把spaCy的模型也纳入其中. spaCy 一、spaCy简介 spaCy是一个开源的自然语言处理(NLP)库,它主要用于处理文本数据。它支持多种语言,包括英语、中文等。它是由Expl…...

MiniExcel模板填充Excel导出
目录 1.官方文档 2. 把要导出的数据new一个匿名对象 3.导出 4.注意事项 5.模板制作 6.结果 1.官方文档 https://gitee.com/dotnetchina/MiniExcel/#%E6%A8%A1%E6%9D%BF%E5%A1%AB%E5%85%85-excel // 1. By POCO var value new {Name "Jack",CreateDate n…...
NoSQL之redis哨兵
一、哨兵的核心功能 监控(Monitoring) 持续检查主节点和从节点的运行状态(是否存活、延迟等)。 自动故障转移(Automatic Failover) 当主节点不可用时,自动选举一个从节点升级为主节点。 更新…...

MCP协议重构AI Agent生态:万能插槽如何终结工具孤岛?
前言 在人工智能技术快速发展的2025年,MCP(Model Context Protocol,模型上下文协议)正逐渐成为AI Agent生态系统的关键基础设施。这一由Anthropic主导的开放协议,旨在解决AI模型与外部工具和数据源之间的连接难题,被业界形象地称…...

阿里云事件总线 EventBridge 正式商业化,构建智能化时代的企业级云上事件枢纽
作者:肯梦、稚柳 产品演进历程:在技术浪潮中的成长之路 早在 2018 年,Gartner 评估报告便将事件驱动模型(Event-Driven Model)列为十大战略技术趋势之一,指出事件驱动架构(EDA,Eve…...

CentOS8.3+Kubernetes1.32.5+Docker28.2.2高可用集群二进制部署
一、准备工作 1.1 主机列表 HostnameHost IPDocker IPRolek8s31.vm.com192.168.26.3110.26.31.1/24master&worker、etcd、dockerk8s32.vm.com192.168.26.3210.26.32.1/24master&worker、etcd、dockerk8s33.vm.com192.168.26.3310.26.33.1/24master&worker、etcd、…...

学习日记-day23-6.6
完成目标: 知识点: 1.IO流_转换流使用 ## 转换流_InputStreamReader1.字节流读取中文在编码一致的情况,也不要边读边看,因为如果字节读不准,读不全,输出的内容有可能会出现乱码 2.所以,我们学了字符流,字符流读取文本文档中的内容如果编码一致,就不会出…...

Pytorch安装后 如何快速查看经典的网络模型.py文件(例如Alexnet,VGG)(已解决)
当你用conda 安装好虚拟环境后, 找到你的Anaconda 的安装位置。 我的在D盘下; 然后 从Anaconda3文件夹开始:一级一级的查看,一直到models Anaconda3\envs\openmmlab\Lib\site-packages\torchvision\models 在models下面&#x…...
《ERP原理与应用教程》第3版习题和答案
ERP原理与应用教程是一门系统介绍企业资源计划(Enterprise Resource Planning, ERP)系统核心理论、技术架构及实施应用的综合性课程。它主要面向管理类、信息类、工程类等专业学生及企业管理者,旨在培养对现代企业信息化管理的理解与实践能力。以下是该课程的详细解析: 一…...