UPS 原理和故障案例分享
摘要:不间断电源UPS (Uninterruptible Power System),主要是由整流器、 逆变器、静态旁路和储能装置等组成;具备高可靠性、高可用性和高质量的独立 电源。通过对收集的 UPS 故障案例进行分析,从施工,调试和运行三个方面筛选 出四个故障案例与大家进行分享。
关键词:数据中心;UPS;滤波电容;旁路带载不均衡
1. UPS原理
1.1 UPS 结构简图
1.2 主要元器件和功能介绍
(1)整流器(Rectifier):是一个将交流(AC)转化为直流(DC)的装置,由整流桥、 控制逻辑和滤波电路等组成。主要功能为:1将交流电(AC)变成直流电(DC), 经滤波后供给负载或逆变器使用;2为蓄电池提供充电电压,起到充电器的 作用。
(2)逆变器(Inverter):是一个将直流(DC)转化为交流(AC)的装置,由逆变桥、 控制逻辑和滤波电路等组成。应用于 UPS 时,将直流电(DC)转化为 50Hz 交流电(220/380AC)。
(3) 静态旁路:可以隔离逆变器并提供额外交流旁路电源向末端负载供电,由旁路静态开关、控制逻辑和驱动电路等组成,并与逆变器电源输出静态开关进行联锁,用于负载电源的不间断切换。
(4) EMI 滤波:由串联电抗器和并联电容器组成的低通滤波装置(常用有:LC 滤波器/LCL 滤波器),对高频干扰信号有较大的阻碍和抑制作用。其主要作用: 1抑制交流电网中的高频干扰对设备的影响;2抑制设备(高频开关电源)产 生的高频干扰对交流电网的影响。
(5)滤波电容:是并联在整流电路输出端,用于降低交流脉动波纹系数、平滑直 流输出的储能器件。采用直流供电的电子电路中,滤波电容能使直流电源输 出平滑稳定,同时降低交变脉动电流对电子电路的影响,还可以吸收电子电 路工作中产生的电流波动和交流电源串入的干扰,使电子电路的工作性能更 加稳定。
(6) DC/DC变换器:是将基础直流电源(电压固定)转变为其他电压值的直流变换 装置,也称为直流斩波。按功能类型分为:降压斩波器、升压斩波器和降压/升压斩波器。
(7)旁路追踪:UPS 的旁路追踪功能是实现不间断供电的重要控制技术之一。
1) 由于故障发生的随机性,UPS本身不知道在什么时间需要切换至旁路。所 以逆变器会时刻跟踪旁路,用于调整逆变器的输出电源波形,使之与旁路 电源同频率、同相位、同幅度;这样 UPS 的逆变器和旁路之间才能进行不间断切换。
2) 为了保证UPS输出合格纯净的电源,UPS允许的频率、相位和幅度的偏差很小,这样就与市电有差异,存在一个同步窗口(可参考 UPS 手册关于输 出电能质量的各项指标和规定)。在同步窗口范围内,逆变器会持续追踪 旁路电源;如果旁路电源的质量超出同步的范围,逆变器输出就不会跟踪 旁路,将以自己的本征频率、相位和幅度工作,并触发内部事件记录。通 常记录事件信息内容有两种: 1旁路超限,2旁路不同步。
2.故障案例
2.1 案例一:开启 UPS 进行并机时发生电容损坏,设备顶部冒烟(蒸汽)并喷射出大量电解质
(1)故障背景:两台 600kVA 的 UPS(1#、2#)并机系统,进行并机时突发电容故障。(2) 故障情况:1#和 2#UPS 送电正常,进行并机操作时,2#UPS 顶部冒烟(蒸汽)并喷出大量电解质。由于是 UPS 开机时发生故障,工程师应急处理及时并未发生短路和其他次生故障。
(3) 故障原因:经过拆机检查后,发现 C 相逆变器模块有一个电容(直流母线)内部短路损坏。
(4) 故障处理:更换 2#UPS 的 C 相逆变器模块。
(5)总结分析
1) 故障UPS是2018年9月完成综合测试投入使用,2020年2月发生电容损坏故障;由于 UPS 运行时间约 1 年半左右,对该批次的电容质量产生担忧。 在故障维修完成后,要求 UPS 生产厂家将故障配件进行检测,并对同批次 电容使用情况进行追踪。
2) 通过对厂家提供的测试报告内容进行分析,以及同批次电容也无不良记 录,初步判断为个别元器件随机发生的故障。后期对 UPS 运行情况的跟进, 该数据中心内同批次的 36 台 UPS(含故障机组)使用至今约 5 年,设备运行 正常,并未发生过类似故障。
(6)电容的使用寿命和预防性维护
1) 满足以下任何一个条件,均可以判断电容的工作寿命已经结束。
a)外观:不能有明显异常,比如破损、鼓起、漏液、爆裂等。
b) 容量:低于产品手册的规定值;无规定时,容量<80%初始容量。c) 其他:电容的漏电流或损耗超过产品手册内的规定值。
2) 数据中心UPS配电室的温/湿度环境较好,电容使用5~6年后一般不会失 效,但漏电流和损耗会增加。随着继续使用的时间越长,发生失效的概率 加大,UPS 自身又无法监测电容的寿命,就如一颗“哑弹”时刻存在安全 隐患。因此一旦发生电容失效,容易造成 UPS 故障宕机,严重时可能会扩 大故障范围,影响末端设备的供电可靠性。所以 UPS 维护手册一般要求设 备运行满 5 年后,就需要进行一次检查和大修,并更换电容和风扇。
3) 行业标准《YD/T1970.4-2009 通信局(站)电源系统维护技术要求》对电容 和散热风扇进行预防性维护的建议。
2.2 案例二:正常运行的 UPS 并机系统发生单机故障,故障 UPS 直接宕机
(1)故障背景:四台 600kVA 的 UPS(1#、2#、3#、4#)并机系统,正常运行中突发 单机故障,造成 2#UPS 故障宕机和 1#UPS 受冲击存在安全隐患。
(2)故障情况
1) 运维工作人员现场检查,发现2#UPS故障宕机(告警:直流母线欠压),1#、3#和 4#UPS 正常并机运行。查看正常运行 UPS 的控制面板,均无告警信息。2) 厂家工程师到达现场后,对故障设备进行检查;发现 2#UPS 的 1 号模块REC-A相、INV-A 和 B 相模块温度异常、保险断开、K3 故障损坏。
3) 检查1#、3#和4#UPS内部的运行日志,发现故障期间1#UPS有电池供电记 录,1#UPS的2号模块C相INV模块温度异常,一个保险断开。3#和4#UPS经检查后,内部监控参数无异常。
(3) 故障原因
1) 厂家对返回模块检测,发现2#UPS的A相整流和逆变模块以及B相逆变模 块故障;B 相整流模块、C 相整流和逆变模块,以及电池模块仅是熔丝熔 断。
2) 经过QA和RD一同拆解,认为是INV-A模块故障引起后续故障,分析为IGBT模块击穿损坏,并引起直流熔丝损坏。
(4)故障处理:更换 1#UPS 和 2#UPS 的故障模块、熔丝、接口板件和输出接触器 等配件。
(5)总结分析
1) 此次故障案例有两个特点,1故障短路电流大,产生的热效应和电动力大,造成硬件损坏严重;2不仅发生故障的 UPS 出现宕机,还对并机系统内的1#UPS 产生冲击,造成 2 号模块 C 相 INV 模块温度异常,一个保险断开, 存在安全隐患(UPS 操作面板无故障告警)。
2) 在UPS并机系统发生短路故障后,除了对故障UPS进行检查外,还需对该 组的其他 UPS 进行一次全面的检查,排查 UPS 的潜在隐患。不要因为设备 表面运行正常和操作面板无告警信息,出现错误判断,为以后的运行安全 埋下隐患。
2.3 案例三:进行 UPS 开机测试时,直流框架断路器整定模块(带液晶显示)故障损坏
(1)故障背景:UPS 开机进行单机测试和蓄电池充电。
(2) 故障情况:直流框架断路器整定模块故障损坏,内部电路板烧坏。
(3) 故障原因:UPS 控制软件问题,导致直流母线有较大的交变脉动电流,造成直流框架断路器整定模块内部电路板烧坏。
(4) 故障处理:更新 UPS 控制软件版本,优化控制方法。
(5)总结分析
1) 从UPS主路拓扑结构分析,能造成直流母线存在较大交变脉动电流的主要原因有两个:1直流母线上有部分电容失效,电容的容量减小,滤波能力 下降;2整流器控制或参数存在缺陷,造成直流母线上的交变脉动电流含 量过大,造成直流母线上的电容无法完全滤除。
2) 现场对UPS(新设备)电容进行检查,可以排除电容原因引起的故障,初步 怀疑 UPS 的控制软件有问题。通过对 UPS 控制软件进行版本更新后,问题 得到解决,UPS 运行正常。
2.4 案例四:UPS 并机系统旁路带载测试时,出现严重的带载不平衡
(1)故障背景:三台 600kVA 的 UPS(1#、2#、3#)并机系统,进行旁路带载测试, 出现严重的带载不平衡。
(2)故障情况:IT 机房负载加到约 1040KW(4KW*260),1#UPS 负载率为 54%,2#UPS负载率为59%,3#UPS 负载率为 80%,由于三台 UPS 的负载率偏差太大,暂停此测试项目,并查找原因。
(3) 故障原因:三台 UPS 静态旁路输入电缆和 UPS 输出电缆总阻抗相差过大,造成UPS 旁路带载时,发生严重的带载不平衡。
(4) 故障处理:对旁路和输出电缆的长度进行复核和测量,对总阻抗小的电缆进行整改和更换。
(5) 总结分析
1) 600kVA的UPS有功输出600kVA*0.9=540kW,旁路输入框架断路器长延时 最大值为1000A,带载容量658kVA,按阻性负载计算是658kW。运行1000A电流时 UPS 的负载率:658/540*100%=121.9%。所以在三台 UPS 并机系统 静态旁路进行带载测试时,其中任意一台负载率超过 121.9%,将会造成旁 路输入框架断路器陆续跳闸,严重时可能造成 UPS 故障损坏(例如:熔丝 或静态开关损坏)。
2) 对UPS旁路电缆型号、长度、近似直流电阻进行统计和计算,1#UPS电缆 总长 25.5 米,2#UPS 电缆总长 21 米,3#UPS 电缆总长 16.5 米。
图5 UPS旁路整改前电缆参数统计
3)整改方案的目标:UPS 并机系统旁路带载时,UPS 负载率最大值和最小值 的差值≤10%。根据“图 5”数据进行分析,为了减少整改时的工作量和难 度,决定对 2#和 3#UPS 的输出电缆进行更换。电缆更换后,1#UPS 电缆总 长 25.5 米,2#UPS 电缆总长 25 米,3#UPS 电缆总长 25.5 米。
图6 UPS旁路整改后电缆参数统计
4)备注说明:1由于电缆厂家资料只提供了电缆的近似直流电阻参数(20°C 时),所以不考虑电抗。2旁路参数的统计和计算时,不考虑静态旁路的 导通电阻、电缆接头制作时损失部分和线路节点处的接触电阻等。
(6) Simulink仿真1) Simulink模型
2)电缆整改前,测试和仿真数据对比
3)电缆整改后,测试和仿真数据对比
4)备注说明:Simulink仿真数据是理想化的计算结果,仅供整改前的参考, 还需以综合测试验证的结果为准。
(7)类似案例分析
UPS 并机系统旁路带载不均衡时,常用的整改方式有以下 4 种。1)更换旁路电缆;
2) 在旁路串联补偿电感;
3) 在旁路电缆上安装均流磁环;
4) 采用带负载均衡功能的静态旁路控制板。(8)“图 8”是旁路输入电缆安装均流磁环的情况。从右侧图片来看,使用均流 磁环整改时,建议安装数量不宜过多。
综上所述,以上所有整改方案,都费时、费力和费钱,需额外增加人力和建 设成本。所以要规避UPS 旁路带载不均衡问题的发生,需要在建设期间做好以下 工作:1合理的 UPS 和配电柜位置布局,2根据设备位置合理的裁剪电缆,3电 缆敷设和制作电缆头时,要做好交底和监督工作。
3.结语
(1) UPS是数据中心十分关键的设备,为重要的动力、弱电和 IT 设备等提供不间 断的可靠电源;其设备性能、可靠性和可用性直接影响数据中心稳定运行和 安全运行。
(2)现场运维团队在高等级的事件或故障处理完成后,需举一反三,查明故障原 因,开展复盘和培训工作,通过总结经验教训和制订切实可行的预防措施, 防止类似事件或故障的再次发生。
4.参考文献
〔1〕 高频机型 UPS 技术及应用/王其英主编,北京:中国电力出版社,2010.10
〔2〕 YD/T 1970.4-2009 通信局(站)电源系统维护技术要求 第 4 部分:不间断
电源(UPS)系统
〔3〕 大型数据中心 UPS 超远距离并机系统的实现-王群力
〔4〕 YD/T 1095-2018 通信用交流不间断电源(UPS)
相关文章:

UPS 原理和故障案例分享
摘要:不间断电源UPS (Uninterruptible Power System),主要是由整流器、 逆变器、静态旁路和储能装置等组成;具备高可靠性、高可用性和高质量的独立 电源。通过对收集的 UPS 故障案例进行分析,从施工,调试和运行三个方面筛选 出四个故障案例与…...

Stream流中的 max()和 sorted()方法
需求:某个公司的开发部门,分为开发 一部 和 二部 ,现在需要进行年中数据结算。分析: 员工信息至少包含了(名称、性别、工资、奖金、处罚记录)开发一部有 4 个员工、开发二部有 5 名员工分别筛选出 2 个部门…...

云上攻防-云原生篇Docker安全权限环境检测容器逃逸特权模式危险挂载
文章目录 前言1、Docker是干嘛的?2、Docker对于渗透测试影响?3、Docker渗透测试点有那些?4、前渗透-判断在Docker中方式一:查询cgroup信息方式二:检查/.dockerenv文件方式三:检查mount信息方式四࿱…...

PDE数值解中,为什么要引入弱解(weak solution)的概念?
See https://www.zhihu.com/question/24243246?utm_sourceqq&utm_mediumsocial&utm_oi1315073218793488384...
使用pdfjs实现在线预览pdf
在工作中可能会遇到前端展示pdf文件进行预览并提供下载的需求场景,例如操作指引,这个时候需要寻找一款实现该功能的插件,以pdjjs举例子 1. 安装pdf.js npm install pdfjs-dist2. 引入pdf.js import pdfjsLib from pdfjs-dist3.加载pdf文件流 这个地方区分是请求后端接口还是…...

汇编语言基础
引言 汇编语言是直接在硬件之上工作的编程语言,首先要了解硬件系统的结构,才能有效的应用汇编语言对其编程。汇编课程的研究重点放在如何利用硬件系统的编程结构和指令集有效灵活的控制系统进行工作。 基础知识 1.1机器语言 机器语言是机器指令的集合…...

格式工厂怎么把两个视频合并在一起
免费的工具谁不喜欢呢,今天为大家介绍的是格式工厂这款多功能视频转换软件,然而今天主要为大家介绍的是格式工厂的视频合并功能。 是的,你没有听错,格式工厂除了转换之外,还可以视频合适、视频剪辑、视频分割、去水印…...

2.MySQL表的操作
个人主页:Lei宝啊 愿所有美好如期而遇 表的操作 (1)表的创建 CREATE TABLE table_name ( field1 datatype, field2 datatype, field3 datatype ) character set 字符集 collate 校验规则 engine 存储引擎; 存储引擎的不同会导致创建表的文件不同。 换个引擎。 t…...
网络安全之应急流程
近期需要弄一个网络安全应急的流程,其实对于网络安全应急并不陌生,只是在一些特定的环境上会遇到一些难以解决的问题或者缺少某个岗位的技术人员,因为不同运营商的应急小队也是不同的岗位,如今有着安全设备的告警和预警࿰…...
[Python进阶] 操纵鼠标:pyuserinput
6.2 操纵鼠标:pyuserinput 6.2.1 说明 在安装pyuserinput库时会自动安装PyMouse和PyKeyboard库。前者主要用来操作鼠标,包括鼠标的点击、移动等。后者主要用来操作键盘,包括键盘按键的按下、弹起等。 这两个库还可以同时对鼠标和键盘的事件…...

【LeetCode】每日一题两数之和寻找正序数组的中位数找出字符串中第一个匹配项的下标在排序数组中查找元素的第一个和最后一个位置
主页点击直达:个人主页 我的小仓库:代码仓库 C语言偷着笑:C语言专栏 数据结构挨打小记:初阶数据结构专栏 Linux被操作记:Linux专栏 LeetCode刷题掉发记:LeetCode刷题 算法:算法专栏 C头…...

与HTTP相关的各种协议
TCP/IP TCP/IP协议是目前网络世界“事实上”的标准通信协议,实际上是一系列网络通信协议的统称,其中最核心的两个协议是 TCP和IP,其他的还有 UDP、ICMP、ARP 等等,共同构成了一个复杂但有层次的协议栈。 这个协议栈有四层&#x…...

常见的网络攻击手段
网络攻击对个人、组织和整个社会都带来了严重的威胁,因此必须采取有效的安全措施来保护网络系统和用户的信息安全。网站是攻击者经常瞄准的目标,以下是一些常见的攻击方式: 1. DDoS攻击(分布式拒绝服务攻击)࿱…...

学习笔记---超基础+详细+新手的顺序表~~
目录 1.顺序表的前言 1.1 顺序表--->通讯录📇 1.2 数据结构的相关概念🏇 1.2.1 什么是数据结构 1.2.1 为什么需要数据结构 2. 顺序表概念及分类 2.1 顺序表的概念🐙 2.2 顺序表的分类🐫 2.2.1 顺序表和数组的区别 2.…...
Java高级-CompletableFuture并发编程利器
CompletableFuture核心Api 1.概述2.Async2.a) supplyAsync2.b) runAsync 3.Then3.a) thenApply()3.b) thenApplyAsync() 1.概述 Future可以在并发编程中异步获取结果 CompletableFuture实现了Future接口,肯定也会有Future的功能,也相当于是Future的一个…...
python、java、c++哪一个前景比较好?
Python是一种广泛使用的高级编程语言,适用于数据分析、人工智能、机器学习等领域。Java是一种通用的编程语言,适用于企业级应用开发、网站开发、软件开发、嵌入式领域等。C是一种系统编程语言,适用于嵌入式开发、游戏开发、音视频、服务端开发…...

【排序算法】详解直接插入排序和希尔排序原理及其性能分析
文章目录 插入排序算法原理细节分析代码实现复杂度分析:稳定性分析:与冒泡排序的对比 希尔排序算法原理细节分析代码实现复杂度分析稳定性分析 总结对比 插入排序 算法原理 插入排序又或者说直接插入排序,是一种和冒泡排序类似的并且比较简单的排序方法, 基本思想…...
JDK1.8对HashMap的优化、以及通过源码解析1,8扩容机制
JDK 1.8 对 HashMap 进行了一些优化,主要包括以下几个方面的改进: 红黑树:在 JDK 1.8 中,当哈希碰撞(多个键映射到同一个桶)达到一定程度时,HashMap 会将链表转化为红黑树,以提高查找…...
Linux串口断帧处理
报文格式 1 Byte 4 Byte N Byte 4 Byte 1 Byte 0x02 报文长度 报文 CRC16 0x03 1. 每条报文以 STX(0x02)起始符开始,以 ETX(0x03)终止符结束。 2. 报文正文长度采用 4 字节的 10 进制字符串标识,如报文正…...

springboot集成kafka
1、引入依赖 <dependency><groupId>org.springframework.kafka</groupId><artifactId>spring-kafka</artifactId><version>2.8.6</version></dependency> 2、配置 server:port: 9099 spring:kafka:bootstrap-servers: 192.1…...
深入浅出:JavaScript 中的 `window.crypto.getRandomValues()` 方法
深入浅出:JavaScript 中的 window.crypto.getRandomValues() 方法 在现代 Web 开发中,随机数的生成看似简单,却隐藏着许多玄机。无论是生成密码、加密密钥,还是创建安全令牌,随机数的质量直接关系到系统的安全性。Jav…...

visual studio 2022更改主题为深色
visual studio 2022更改主题为深色 点击visual studio 上方的 工具-> 选项 在选项窗口中,选择 环境 -> 常规 ,将其中的颜色主题改成深色 点击确定,更改完成...

YSYX学习记录(八)
C语言,练习0: 先创建一个文件夹,我用的是物理机: 安装build-essential 练习1: 我注释掉了 #include <stdio.h> 出现下面错误 在你的文本编辑器中打开ex1文件,随机修改或删除一部分,之后…...

江苏艾立泰跨国资源接力:废料变黄金的绿色供应链革命
在华东塑料包装行业面临限塑令深度调整的背景下,江苏艾立泰以一场跨国资源接力的创新实践,重新定义了绿色供应链的边界。 跨国回收网络:废料变黄金的全球棋局 艾立泰在欧洲、东南亚建立再生塑料回收点,将海外废弃包装箱通过标准…...

《基于Apache Flink的流处理》笔记
思维导图 1-3 章 4-7章 8-11 章 参考资料 源码: https://github.com/streaming-with-flink 博客 https://flink.apache.org/bloghttps://www.ververica.com/blog 聚会及会议 https://flink-forward.orghttps://www.meetup.com/topics/apache-flink https://n…...
【RockeMQ】第2节|RocketMQ快速实战以及核⼼概念详解(二)
升级Dledger高可用集群 一、主从架构的不足与Dledger的定位 主从架构缺陷 数据备份依赖Slave节点,但无自动故障转移能力,Master宕机后需人工切换,期间消息可能无法读取。Slave仅存储数据,无法主动升级为Master响应请求ÿ…...

ios苹果系统,js 滑动屏幕、锚定无效
现象:window.addEventListener监听touch无效,划不动屏幕,但是代码逻辑都有执行到。 scrollIntoView也无效。 原因:这是因为 iOS 的触摸事件处理机制和 touch-action: none 的设置有关。ios有太多得交互动作,从而会影响…...

3-11单元格区域边界定位(End属性)学习笔记
返回一个Range 对象,只读。该对象代表包含源区域的区域上端下端左端右端的最后一个单元格。等同于按键 End 向上键(End(xlUp))、End向下键(End(xlDown))、End向左键(End(xlToLeft)End向右键(End(xlToRight)) 注意:它移动的位置必须是相连的有内容的单元格…...
基于Java Swing的电子通讯录设计与实现:附系统托盘功能代码详解
JAVASQL电子通讯录带系统托盘 一、系统概述 本电子通讯录系统采用Java Swing开发桌面应用,结合SQLite数据库实现联系人管理功能,并集成系统托盘功能提升用户体验。系统支持联系人的增删改查、分组管理、搜索过滤等功能,同时可以最小化到系统…...
A2A JS SDK 完整教程:快速入门指南
目录 什么是 A2A JS SDK?A2A JS 安装与设置A2A JS 核心概念创建你的第一个 A2A JS 代理A2A JS 服务端开发A2A JS 客户端使用A2A JS 高级特性A2A JS 最佳实践A2A JS 故障排除 什么是 A2A JS SDK? A2A JS SDK 是一个专为 JavaScript/TypeScript 开发者设计的强大库ÿ…...