docker版jxTMS使用指南:数据采集系统的高可用性
本文讲解4.6版jxTMS中数据采集系统的高可用性,整个系列的文章请查看:4.6版升级内容
docker版本的使用,请查看:docker版jxTMS使用指南
4.0版jxTMS的说明,请查看:4.0版升级内容
4.2版jxTMS的说明,请查看:4.2版升级内容
4.4版jxTMS的说明,请查看:4.4版升级内容
standalone构型转为了分布式构型,就自然而然的会出现一个高可用性的问题。传统上,高可用性有三种,即所谓的负载均衡、双机热备、双机冷备。
但这三者的概念以今天的技术水平来看都很过时了,所以笔者作了自己的修正:分布式系统、在线热备、在线冷备。
三者的共性都是通过增加冗余的备份机以在某台正在提供服务的服务器失效后能自动的由备份机接管服务,最大化的减少服务中断时间、尽可能的提高服务的可用性。
三者的区别是:
1、分布式系统,所有机器同时工作,无分主次
优点是所有服务器同时提供服务,浪费率低,抗冲击性好,服务宕机时影响面小,理论上的故障间隔最小。
缺点是系统需要专门的调度管理将服务请求较平均的分散到所有服务器上,这就需要复杂的服务跟踪、管理与调度,建设成本会高很多。此外,提供的最好是无状态服务,这样就不需要考虑服务交接时的复杂性来。
但这样的要求对业务的限制太多、效率太低;而如果提供有状态的服务,那就需要采取多种技术手段来确保状态的维持,如基于状态/连接的服务分发、采用高速缓存、服务事务化等等。
总的来说,分布式的优缺点都比较鲜明,需要针对应用的特点进行细致的调教,一般都是高投入的专用系统,不太适合jxTMS所期望的低成本、通用性与开箱即用的要求。
2、在线热备,分为主机与备份机,主机工作备份机不工作,在主机故障时,备份机可直接接管服务
3、在线冷备,分为主机与备份机,主机工作备份机不工作,在主机故障时,备份机丢弃现有服务请求后接管服务
可以看出,热备与冷备的区别在于对待正在处理服务请求的响应机制:热备需要从机保持切换前的主机服务状态;冷备则直接丢弃主机的服务状态,从零开始提供服务。
热备可以用高速缓存甚至数据库来实现,但其缺点和分布式是一样的:阶段性的中间数据全部要放入缓存以实现服务的事务化,性能影响较大而且服务编写较为复杂【自然成本就高】。
冷备则非常简单,明确所提供的服务存在失效的可能,这样在请求方请求服务超时或返回无效请求后,再次请求即可,即用会话的复杂性来对冲服务的可靠性承诺。
想实现完美的带状态接管,必须使用持久化的高速缓存完整记录服务请求、服务状态并将服务事务化,以及服务的请求异步化,这都会导致成本高、性能低且应用编写繁琐。
综上,我们可以用两个公式来概括这三者的关系:
在线热备 = 在线冷备 + 服务事务化基础上的状态同步
分布式 = 在线热备 + 服务管控与调度
相比来说,在线冷备实现起来简便、可靠、坚固,适用面广、技术门槛低、系统开销也小的多。缺点就是服务存在失效的可能,所以需要将服务请求会话化,即保留服务请求的现场,检查服务请求的执行结果,当请求失败后重新发起服务请求或进行容错处理。但相对复杂的服务状态同步来说,会话管理的技术难度与实现成本都非常低。
考虑到这一点,所以jxTMS依托catalogService实现的就是在线冷备方案。
但docker版jxTMS所展示的数据采集与处理系统却自然而然的成了在线热备。这是基于如下两点:
1、数据采集是天然的无状态。即本次所接收到的数据,和之前接收到的历史数据无关
2、前面强调过多次的,通过数据总线将数据采集与数据应用切分开来。所以,哪怕数据应用的部分是有状态的,但因为是和采集部分隔离的,所以不会影响到数据采集与处理的无状态性
注:数据采集系统的热备并不意味着主机故障到从机接管之间的数据不会丢失。但由于目前jxTMS的数据采集主要通过mqtt推送,而mqtt也是具备数据保持能力甚至数据持久能力的,如果调整这方面的配合,以及优化服务保活间隔的设置,是可以实现最小化的数据丢失率的。甚至,理论上,是可以以部分性能的损失为代价实现0数据丢失的服务接管能力
在线热备的关键性支撑
1、服务的状态检测
catalogService提供了保活机制,即各服务必须先注册,注册成功后必须以可自定义的间隔向catalogService发送keeplive消息。
当超过三次未收到当前已注册的服务的keeplive消息,catalogService即认为该服务已经失联,就会将其从目录中删除掉,其它服务就可以再次注册了。
2、一致性保证
主机宕机,从机接管,中间出现数据丢失是可以接受的【取决于业务需要与零丢失所需成本之间的平衡】,但系统必须保证主从的一致性。即从机的行为不能与主机行为不一样。
而影响主从一致性的是三个方面:
-
代码的一致性,这是通过代码管理、版本管理来实现的,不在本文讨论范围之内
-
配置的一致性,以前的docker版jxTMS主要采用本地文件的配置方式,这时想要保持配置的一致性,只要保证两服务器上的配置文件一致即可。但目前已经将配置逐步迁移到基于数据总线,所以配置一致性的保持就较为复杂了【需要考虑前文所提到的水平切片、单服务器上运行多种服务等等】,但由于笔者目前也没有太复杂的应用场景,所以目前这一部分比较简单,并没有对请求方以及请求参数做任何的识别与处理
-
管理命令执行结果的一致性,以前的docker版jxTMS主要通过服务来进行管理,但我们正在讨论的在线备份方案中从机根本就没有注册到系统中来,所以管理命令或者迁移到基于数据总线来做;或者还是通过服务发送给主机来执行,但在主机执行完毕后需要通过数据总线广播给从机进行同步。笔者更倾向于后者
注1:目前的数据总线中已经实现了缓存功能,所以管理命令执行结果的一致性可通过主机执行完管理命令后刷新相应的缓存即可实现。即管理命令的执行结果需要存放到数据库中或基于数据总线上的缓存中,这就自动实现了主从在一致性方面的实时同步
注2:这里只讲了系统层面的一致性,还有应用层面各功能模块的一致性【本质上其实就是工作数据的同步】。而各功能模块的一致性保证,本质上就是热备与冷备的区别,所以其基本原则是:如果应用层面的一致性难以保证,那就应以冷备模式工作
3、检测到主机失联后,从机立即接管服务
当主机所注册的服务因为超时没有keeplive而被catalogService从目录中被删除掉后,以同样间隔持续向catalogService进行注册的从机再次注册时,catalogService就会批准本次注册,然后从机会接收到注册通过的响应,就可以执行接管服务的准备动作了。
服务接管
从机的服务接管主要包括两部分内容:
1、主机失联后会取消对服务地址的监听,而从机在接管服务后会向消息系统注册对服务地址的监听
每个服务都有一个服务监听地址:{服务类型}.{服务名}。已经完成注册的主机会监听该地址,一方面通过消息系统为客户提供服务;另一方面则是通过该地址接受jxTMS主系统发出的管理命令。
2、执行所有受主从切换影响的模块注册的模块相关的服务开关命令
有的功能模块不受主从切换的影响,始终处于就绪待命状态,如用户授权、设备等模块;有的模块则受主从切换的影响,如mqtt模块,只有主机才能从mqtt服务器订阅主题接收数据,从机则不能订阅【包括主机失去和MQ的连接但没有失去到mqtt的连接这种极端情况,当出现这种情况时会切换到从机,应取消订阅】;又如site站点模块,从机是不会接收数据的,所以必须停止通过钉钉发送站点失联告警。
这些会受到主从切换影响的模块在启动时需要注册两个事件通知:注册到catalogService、和catalogService失联。我们以mqtt模块来举例说明,其相应的代码是:
#__init__函数中
#允许订阅有两种情况:没有启动服务以及启动服务并注册到了服务中
self._permit = False
mainService.registerConnectDual(self._name, self.permit, self.refuse, informDual=self._checkServiceState)#下面是三个事件响应函数与状态通知函数#服务是否启动
def _checkServiceState(self, state):if not state:#服务没有启动需要允许连接self.permit()#注册到catalogService
def permit(self):self._permit = Trueif self._connectted:for topic in self._mqttServerTopic:self._subscribe(topic)#和catalogService失联
def refuse(self):self._permit = Falseif self._connectted:for topic in self._mqttServerTopic:jxGo.log('info', f'mqttClient[{self._name}] unsubscribe topic[{topic}]')self._client.unsubscribe(topic)
上述代码已经非常直白了,所以我们介绍一下mainService模块中的registerConnectDual函数、
registerConnectDual(cls, connectDual, disconnectDual, delaySeconds=5, informDual=None)
注册主服务的连接与失联事件响应函数
参数:connectDual:注册到catalogService的事件响应函数,无参disconnectDual:和catalogService失联的事件响应函数,无参delaySeconds:延时多少秒后通知是否启动了服务informDual:服务状态通知函数,delaySeconds秒被调用
返回值:无
说明:informDual的签名是:informDual(state)state--服务是否启动,True:启动;False:未启动
设置informDual函数的原因在于,所有的功能模块,如mqtt,都必须在服务启动前完成初始化工作。这是由于jxTMS的服务会启动一个无限循环来实现注册与保活。
所以呢,所有的功能模块在初始化时都是不知道是否启动了服务的。启动了服务,自然会通过connectDual来切换到工作状态,但如果没有启动服务,又需要切换到工作状态才是,而这就需要informDual通过延时进行检测并发出通知了。
注意
本文所讲述的在线备份,属于系统部分失效后的抢救性措施。而在线备份能否抢救成功,关键是主从的一致性保证。而热备所要求的严格一致,需要的成本太高,只适合特定应用场景下的、高投入的自用系统。
jxTMS首先考虑的是低成本下的通用性,是以低的建设成本、低的开发成本、低的维护成本来快速构建自己的应用系统,所以提供的是简单、可靠、坚固的在线冷备模式,只有天然无状态的,如数据采集与处理系统,可工作于在线热备模式。
参考资料:
jxTMS设计思想
jxTMS编程手册
下面的系列文章讲述了如何用jxTMS开发一个实用的业务功能:
如何用jxTMS开发一个功能
下面的系列文章讲述了jxTMS的一些基本开发能力:
jxTMS的HelloWorld
相关文章:
docker版jxTMS使用指南:数据采集系统的高可用性
本文讲解4.6版jxTMS中数据采集系统的高可用性,整个系列的文章请查看:4.6版升级内容 docker版本的使用,请查看:docker版jxTMS使用指南 4.0版jxTMS的说明,请查看:4.0版升级内容 4.2版jxTMS的说明ÿ…...
vue如何禁止通过页面输入路径跳转页面
要禁止通过页面输入路径跳转页面,你可以使用Vue Router的导航守卫(navigation guards)来拦截导航并阻止不希望的跳转。 下面是一种常见的方法,你可以在全局导航守卫(global navigation guards)中实现这个功…...
mac,linux环境的基础工具安装【jdk,tomcat】
安装 一 linux环境一)、JDK安装卸载: 二)、 tomcat 安装1、[下载](https://mirrors.bfsu.edu.cn/apache/tomcat/tomcat-8/v8.5.63/bin/apache-tomcat-8.5.63.tar.gz)后,在目录 /usr/local/tomcat下,解压缩2、配置tomca…...
chrome窗口
chrome 窗口的层次: 父窗口类名:Chrome_WidgetWin_1 有两个子窗口: Chrome_RenderWidgetHostHWNDIntermediate D3D Window // 用于匹配 Chrome 窗口的窗口类的前缀。 onst wchar_t kChromeWindowClassPrefix[] L"Chrome_WidgetWin_…...
某快递公司Java一面
1.平衡二叉树和红黑树的区别? 平衡二叉树是一种二叉搜索树,其左子树和右子树的高度差不超过1,以确保在最坏情况下的查找效率是O(log n)。而红黑树是一种自平衡二叉搜索树,通过引入颜色标记(红色和黑色)来维…...
【C++ Primer Plus学习记录】指针——声明和初始化指针
指针用于存储值的地址,因此,指针名表示的地址。*运算符被称为间接值或解除引用运算符,将其应用于指针,可以得到该地址处存储的值。 例如,假设manly是一个指针,则manly表示的是一个地址,而*manl…...
切换至root用户时,命令提示符颜色为白色,如何修改?
当我切换至root用户时,发现命令提示符里的内容全部为白色,如图所示: 这让人看着不愉快,上网先搜索下解决方案:【切换到 root 账户字体全是白的,怎么改颜色啊】- 百度贴吧,但是这个解决方案只是…...
设计模式——17. 状态模式
1. 说明 状态模式(State Pattern)是一种行为设计模式,它允许一个对象在其内部状态发生改变时改变其行为。状态模式将对象的状态封装成不同的状态对象,并将状态切换时的行为委托给当前状态对象。这样,对象在不同状态下具有不同的行为,而无需在对象本身中使用大量的条件语…...
系统架构设计:14 论软基于架构的软件设计方法(ABSD)的软件开发
目录 1 基于架构的软件设计(ABSD) 2 基于架构的软件开发过程 2.1 架构需求过程 2.2 架构设计过程</...
如何在 Spring Boot 中进行文件上传
在 Spring Boot 中进行文件上传 文件上传是Web应用程序中常见的功能之一,它允许用户将文件从客户端上传到服务器。Spring Boot提供了便捷的方式来处理文件上传,并且整合了Spring框架的强大功能,使文件上传变得相对简单。本文将介绍如何在Spr…...
Python 图形化界面基础篇:将应用程序打包为可执行文件
Python 图形化界面基础篇:将应用程序打包为可执行文件 引言 PyInstaller 简介步骤1:安装 PyInstaller 步骤2:创建 Python GUI 应用程序步骤3:使用 PyInstaller 打包应用程序 完整示例代码解释结论 引言 在开发完一个图形用户界面…...
Android 13.0 蓝牙遥控器确认键弹不出输入法的解决方法
1.概述 在android13.0设备定制化开发时,遥控器是使用红外遥控器,也有使用蓝牙遥控器的,所以出现的问题不一定相同,今天遇到个问题就是蓝牙遥控器在输入数据时弹不出输入法的问题 首选排除输入法的问题,安装其他的输入法,也是同样的问题,这样就确定是系统EditText控件相关…...
spring boot面试50问
目录 前言: 1. 什么是 Spring Boot? 2. 为什么要用SpringBoot? 3. SpringBoot与SpringCloud 区别? 4. Spring Boot 有哪些优点? 5. Spring Boot 的核心注解是哪个?它主要由哪几个注解组成的࿱…...
条例24~25(设计与声明)
条例24 若所有参数皆需要类型转换,请为此采用非成员函数 有时候让类型内成员函数支持隐式类型转换是不妥善的。比如当我们想在类内实现operator *() 模拟乘法的时候。通常情况下表现良好,但若你想额外实现混合式运算。例如 int…...
Spring5应用之事务处理
作者简介:☕️大家好,我是Aomsir,一个爱折腾的开发者! 个人主页:Aomsir_Spring5应用专栏,Netty应用专栏,RPC应用专栏-CSDN博客 当前专栏:Spring5应用专栏_Aomsir的博客-CSDN博客 文章目录 参考文献前言事务…...
Python 中最常用的4种股票价格移动平均方法(三)
一、简介 移动平均线是各级交易者和投资者最广泛使用的技术指标之一。它们通过计算特定时期内的平均价格来帮助消除股票价格的固有波动性。移动平均线计算起来很简单,但也有更复杂的形式,旨在捕捉市场的更多细微差别。 这个由四部分组成的系列将讨论总共 4 种不同的移动平均方…...
Mybaits缓存踩的坑
记Mybaits缓存踩的坑 1.问题提出 最近开发一个记录操作前后修改内容的功能,获取修改前数据比较简单,直接从数据库获取,记录修改后的功能也比较简单,直接将用户修改的内容封装成po对象,然后两个比对就可以了ÿ…...
全国工商注册数据库的作用
随着经济的发展和市场竞争的加剧,越来越多的人开始关注公司的工商信息。这些信息不仅可以帮助人们了解公司的基本情况,还可以为投资者、合作伙伴、员工等提供决策依据。 工商数据库提供了全国范围内企业的基本信息。这些信息包括企业的名称、统一社会信用…...
【Linux】NTP时间服务器Chrony配置详解
🍁 博主 "开着拖拉机回家"带您 Go to New World.✨🍁 🦄 个人主页——🎐开着拖拉机回家_大数据运维-CSDN博客 🎐✨🍁 🪁🍁 希望本文能够给您带来一定的帮助🌸文…...
今年的秋招面试,确实有点难。
不可否认的是,今年秋招确实有点难 从今年的形势来看,好的 offer 都掌握在少数人的手里,想要秋招找到理想的工作,要么学历好,要么技术功底很扎实,这两样都不占的话,就业压力就会比较大。 如何从…...
深入剖析AI大模型:大模型时代的 Prompt 工程全解析
今天聊的内容,我认为是AI开发里面非常重要的内容。它在AI开发里无处不在,当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗",或者让翻译模型 "将这段合同翻译成商务日语" 时,输入的这句话就是 Prompt。…...
渗透实战PortSwigger靶场-XSS Lab 14:大多数标签和属性被阻止
<script>标签被拦截 我们需要把全部可用的 tag 和 event 进行暴力破解 XSS cheat sheet: https://portswigger.net/web-security/cross-site-scripting/cheat-sheet 通过爆破发现body可以用 再把全部 events 放进去爆破 这些 event 全部可用 <body onres…...
c++ 面试题(1)-----深度优先搜索(DFS)实现
操作系统:ubuntu22.04 IDE:Visual Studio Code 编程语言:C11 题目描述 地上有一个 m 行 n 列的方格,从坐标 [0,0] 起始。一个机器人可以从某一格移动到上下左右四个格子,但不能进入行坐标和列坐标的数位之和大于 k 的格子。 例…...
DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
前一阵子在百度 AI 开发者大会上,看到基于小智 AI DIY 玩具的演示,感觉有点意思,想着自己也来试试。 如果只是想烧录现成的固件,乐鑫官方除了提供了 Windows 版本的 Flash 下载工具 之外,还提供了基于网页版的 ESP LA…...
Matlab | matlab常用命令总结
常用命令 一、 基础操作与环境二、 矩阵与数组操作(核心)三、 绘图与可视化四、 编程与控制流五、 符号计算 (Symbolic Math Toolbox)六、 文件与数据 I/O七、 常用函数类别重要提示这是一份 MATLAB 常用命令和功能的总结,涵盖了基础操作、矩阵运算、绘图、编程和文件处理等…...
Caliper 配置文件解析:fisco-bcos.json
config.yaml 文件 config.yaml 是 Caliper 的主配置文件,通常包含以下内容: test:name: fisco-bcos-test # 测试名称description: Performance test of FISCO-BCOS # 测试描述workers:type: local # 工作进程类型number: 5 # 工作进程数量monitor:type: - docker- pro…...
脑机新手指南(七):OpenBCI_GUI:从环境搭建到数据可视化(上)
一、OpenBCI_GUI 项目概述 (一)项目背景与目标 OpenBCI 是一个开源的脑电信号采集硬件平台,其配套的 OpenBCI_GUI 则是专为该硬件设计的图形化界面工具。对于研究人员、开发者和学生而言,首次接触 OpenBCI 设备时,往…...
python爬虫——气象数据爬取
一、导入库与全局配置 python 运行 import json import datetime import time import requests from sqlalchemy import create_engine import csv import pandas as pd作用: 引入数据解析、网络请求、时间处理、数据库操作等所需库。requests:发送 …...
Python 训练营打卡 Day 47
注意力热力图可视化 在day 46代码的基础上,对比不同卷积层热力图可视化的结果 import torch import torch.nn as nn import torch.optim as optim from torchvision import datasets, transforms from torch.utils.data import DataLoader import matplotlib.pypl…...
如何通过git命令查看项目连接的仓库地址?
要通过 Git 命令查看项目连接的仓库地址,您可以使用以下几种方法: 1. 查看所有远程仓库地址 使用 git remote -v 命令,它会显示项目中配置的所有远程仓库及其对应的 URL: git remote -v输出示例: origin https://…...
