当前位置: 首页 > news >正文

Keepalived实现服务器的高可用性

目录

  • 背景
  • 方案简介
    • Keepalived
    • Heartbeat
  • Keepalived技术介绍
    • Keepalived通信方式
    • 时间同步
  • Keepalived配置案例
    • Keepalived日志配置
    • Keepalived服务配置
      • 全局配置段
      • VRRP配置段
      • Keepalived服务启动
  • 服务异常检测

背景

在实际应用中,为了提高服务器的高可用性,往往会部署多套服务器,避免一台服务器故障后,引起服务瘫痪。针对无需数据冗余的服务,可以用第三方的成熟方案实现高可用性。
第三方方案可与当前业务逻辑完全分离,互不影响,实现更加灵活。目前主要存在两种成熟的高可用性方案,Keepalived与Heartbeat。

方案简介

Keepalived

Keepalived可用于服务器状态检测,如果有一台服务器宕机,或工作出现故障,Keepalived将检测到,并将有故障的服务器从集群系统中剔除,同时使用其他服务器代替该服务器的工作,当服务器工作正常后Keepalived自动将服务器加入到服务器群中,这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的服务器。

  1. 优势:使用更简单:从安装、配置、使用、维护等角度上对比,Keepalived都比Heartbeat简单,并且满足集群倒切需求;
  2. 劣势:没有管理功能;
  3. 编码难度较小,满足功能需求

Heartbeat

Heartbeat 项目是 Linux-HA 工程的一个组成部分,它实现了一个高可用集群系统。Heartbeat(Linux-HA)的工作原理:Heartbeat最核心的包括两个部分,心跳监测部分和资源接管部分,心跳监测可以通过网络链路和串口进行,而且支持冗余链路,它们之间相互发送报文来告诉对方自己当前的状态,如果在指定的时间内未收到对方发送的报文,那么就认为对方失效,这时需启动资源接管模块来接管运 行在对方主机上的资源或者服务。

  1. 优势:功能更强大,配套工具更全,适合做大型集群管理,而Keepalived主要用于集群倒换,基本没有管理功能;
  2. 劣势:功能复杂,使用难度较大;
  3. 编码难度大,主要用于大型集群管理。

综上所述,针对只有两架服务器作为温备,组成的冗余系统,Keepalived方式即可满足需求,实现设备倒切。

以下主要介绍Keepalived的实现方式

Keepalived技术介绍

Keepalived通信方式

Keepalived支持单播和组播两种方式,由于方案中目前只存在两台设备作为温备,单播即可满足要求,同时也可避免其他系统Keepalived组播消息干扰。
Keepalived通信消息中携带鉴权类型为PASS方式,密码为一组任意的字符串,保证Keepalived安全通信。

时间同步

Keepalived通信裁决主备时,要求两台服务器的时间差不能太大,否则无法正确进行主备裁决,因此该方案采用NTP方式进行设备时间同步。
服务器操作系统安装时,已默认安装NTP服务,该文档只讲述NTP服务的配置。NTP配置文件路径:/etc/ntp.conf。在配置文件中分别添加如下两行:

server xx.xx.xx.xx
server 127.127.1.0

xx.xx.xx.xx为NTP服务器IP,表示该设备向NTP服务器同步时间。
第二行表示当上级NTP时钟失效时,使用本地时钟继续提供服务,方便其他设备进行时间同步。

当两台设备时间相差过大时,NTP服务无法进行时间同步。所以,需要结合ntpdate服务进行时间同步。ntpdate可强制进行时间同步。可在开机启动脚本(/etc/rc.d/rc.local)中添加如下三行:

service ntpd stop
ntpdate xx.xx.xx.xx
service ntpd start

由于NTP、ntpdate两个服务冲突,必须停止NTP服务后,ntpdate才能提供服务。
xx.xx.xx.xx为NTP服务器IP,表示设备向NTP服务器强制同步时间。
最后再重新启动NTP服务

NTP结合ntpdate时间同步后,会出现硬件时间与系统时间不一致的情况,可在文件/etc/sysconfig/ntpd添加如下配置向,使硬件时间与系统时间保持一致。

SYNC_HWCLOCK=yes

NTP时间同步时,硬件时间也进行相应的时间同步。

Keepalived配置案例

Keepalived日志配置

Keepalived安装成功后,配置其日志输出路径为:/var/log/keepalived.log。

在/etc/sysconfig/keepalived配置文件中将KEEPALIVED_OPTIONS设置修改为

KEEPALIVED_OPTIONS=”-D -d -S 0”

同时在/etc/rsyslog.conf配置文件中,添加一行

local0.* /var/log/keepalived.log

Keepalived服务配置

Keepalived服务配置共分为三个部分:全局配置段、VRRP配置段、LVS配置段。其中全局配置段用于定义全局设置,VRRRP配置段用于配置实例,LVS配置段用于定义虚拟服务器的设置。该方案中无需LVS配置段。

全局配置段

全局配置段中只需修改router_id即可,其中温备的两台设备该值必须区分开,作为设备唯一标志。
示例

global_defs {
notification_email {
acassen@firewall.loc
failover@firewall.loc
sysadmin@firewall.loc
}
notification_email_from Alexandre.Cassen@firewall.loc
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id LVS_DEVEL1
}

VRRP配置段

VRRP配置段内包含服务监控脚本及vrrp同步组配置、相应的实例配置。
vrrp_script为监控脚本,定时执行周期为2秒,用于监控四个浮动IP的状态。
vrrp_sync_group为同步组配置,组内共有两个实例,任何一个监控实例出现异常后,即进行主备切换。角色切换后,执行notify脚本,服务器根据角色执行相应的操作。

vrrp_script monitor_service {
script "monitor_service.sh " 20.31.250.13 20.31.250.14 192.168.10.13 192.168.10.14
interval 2
}
vrrp_sync_group VG_1 {
group {
VI_1
VI_2
}
notify_master “/etc/keepalived/notify.sh master”
notify_backup “/etc/keepalived/notify.sh backup”
notify_fault “/etc/keepalived/notify.sh fault”
}

需要监测两个网卡时可写两个实例,实例名对应于同步组group内的节点名,对于只需监测一个网卡的情况,可只写一个实例。该方案以两个实例为例进行介绍,两个实例只有网卡名、IP、virtual_router_id,其他项都基本一致。

实例1

vrrp_instance VI_1 {
state BACKUP
nopreempt
interface bond0
track_interface {
bond0
}
virtual_router_id 133
priority 100
advert_int 1
authentication {
auth_type PASS
auth_pass 337639943
}
unicast_src_ip 20.31.250.10
unicast_peer {
20.31.250.11
}
virtual_ipaddress {
20.31.250.13
20.31.250.14
}
track_script {
monitor_service
}

实例2

vrrp_instance VI_2 {
state BACKUP
nopreempt
interface eth2
track_interface {
eth2
}
virtual_router_id 233
priority 100
advert_int 1
authentication {
auth_type PASS
auth_pass 337639943
}
unicast_src_ip 192.168.10.10
unicast_peer {
192.168.10.11
}
virtual_ipaddress {
192.168.10.13
192.168.10.14
}
track_script {
monitor_service
}

实例参数介绍

参数名称解释
state可配置为MASTER、BACKUP,该方案中,温备两台设备都配置为BACKUP
interface浮动IP绑定的物理网口
track_interface监控的物理网口
virtual_router_id唯一标识id,用于区分vrrp实例,温备两台设备VI_1都配置为133,VI_2都配置为233
priority优先级,默认配置为100
advert_int发送vrrp通告的时间间隔,默认为1秒
authenticationvrrp实例协商的方式及密码,方式默认为PASS,密码为本地核心网十进制IP地址
unicast_src_ip本端interface网口上的固定IP
unicast_peer对端interface网口上的固定IP
virtual_ipaddressInterface网口上的浮动IP
track_script监控脚本,默认为vrrp_scrip定义的脚本

Keepalived服务启动

Keepalived安装完成后,可通过命令 service keepalived start 启动。
同时在开机启动配置文件/etc/rc.d/rc.local中添加如下一行,使Keep alived可开机自启动。

service keepalived start

服务异常检测

Keepalived服务只能监测硬件、网络的状态,无法服务进行检测。所以,一般需要增加服务异常检测。
在/etc/crontab定时任务文件中增加一行,每十分钟执行一次定时任务。

*/10 * * * * root my_keepalived_crontime.sh

当十分钟内,服务重启超过5次,则认为设备或服务出现问题,进行主备切换。

相关文章:

Keepalived实现服务器的高可用性

目录 背景方案简介KeepalivedHeartbeat Keepalived技术介绍Keepalived通信方式时间同步 Keepalived配置案例Keepalived日志配置Keepalived服务配置全局配置段VRRP配置段Keepalived服务启动 服务异常检测 背景 在实际应用中,为了提高服务器的高可用性,往…...

Python程序化交易接口批量获取数据源码

小编举例下面是一个简单的示例代码,展示如何使用Python的程序化交易接口批量获取数据,例如开发文档参考:MetaTradeAPI (metatradeapi) - Gitee.com 签名 int Init(); 功能 API 初始化 参数 无 返回值 授权成功的交易账户数量 返回值 &…...

【强化学习】基本概念

基本大概框架 强化学习的主要角色是 智能体 (agent)和 环境,环境是智能体存在和互动的世界。智能体根据当前的环境做出action,action影响环境。然后智能体根据新的环境再进行action。 基础用语 状态(state, s)&…...

0001__安装electron失败 postinstall: `node install.js`

不一样的 npm 快速安装electron的方案 - 简书 2、手动下载出错的文件 打开浏览器输入 下述网址, 找到你要的版本号, 点击后找到你的平台点击即可下载了。https://registry.npmmirror.com/binary.html?pathelectron/ 作者:一颗人心 链接&…...

Linux测开常用命令总结

文章目录 Linux系统中文件目录树 基本指令的使用: Linux命令的帮助信息查看 --help command --help 说明: 显示command 命令的帮助信息通过man命令查看帮助信息 man command( 命令的名称) man 命令查看的帮助信息更加详细ls,pwd&#xff0c…...

xml转化为txt数据的脚本,为yolo提供训练

这里写自定义目录标题 xml转化为txt数据的脚本 xml转化为txt数据的脚本 代码如下: import xml.etree.ElementTree as ET import os, cv2 import numpy as np from os import listdir from os.path import joinclasses []def convert(size, box):dw 1. / (size[0…...

【H5页面嵌入到小程序或APP中实现手机号点击复制和拨号功能】

在H5界面嵌入到小程序和移动应用&#xff08;安卓和iOS&#xff09;中实现手指点击手机号弹出弹窗&#xff0c;包含呼叫和复制选项&#xff0c;是可以实现的。下面我将为你提供一个基本的示例&#xff0c;并解释在小程序、安卓和iOS中要做的支持工作。 <!DOCTYPE html> …...

Kubernetes技术--k8s核心技术 configMap

1.概述 configMap最主要的作用是存储一些不加密的数据到/etcd,让pod以变量或者数据卷(volume)挂载到容器。 应用场景:配置文件、存储信息等 2.使用 -1.创建配置文件。 这里我们需要先编写一个配置文件。使用redis,如下所示:...

Springboot动态修改日志级别

在开发和运维过程中&#xff0c;我们经常需要调整日志级别来查看不同级别的日志信息。传统的做法是修改配置文件&#xff0c;然后重启应用程序。但是&#xff0c;在分布式系统中&#xff0c;重启应用程序可能比较麻烦&#xff0c;而且也影响了业务的正常运行。 Springboot提供…...

新手将最简单的springboot部署上tomcat出现的意外问题

现阶段springboot部署到tomcat的文章一抓一大把且都相同,便贴一个地址以展示流程: SpringBoot打war包部署Tomcat(最全)_spring boot war 部署tomcat_聊Java的博客-CSDN博客 那么就说一下我出现的问题: 在完整复现流程且确认代码无误的情况下,部署到tomcat,此时问题出现了:启动…...

P1177 【模板】排序(Sort排序)

题目描述 将读入的 N N N 个数从小到大排序后输出。 输入格式 第一行为一个正整数 N N N。 第二行包含 N N N 个空格隔开的正整数 a i a_i ai​&#xff0c;为你需要进行排序的数。 输出格式 将给定的 N N N 个数从小到大输出&#xff0c;数之间空格隔开&#xff0c…...

软件测试(黑盒测试、白盒测试、灰盒测试)

软件测试方法大类上分为黑盒测试、白盒测试和灰盒测试三种 一、黑盒测试 黑盒测试通俗来说即不知道代码是怎么写的。具体实现逻辑&#xff0c;基于代码输入有哪些应该输出什么进行测试的方法。其方法有&#xff1a;基于直觉和经验的方法&#xff08;IEBT&#xff09;、基于需…...

昨天面试的时候被提问到的问题集合。

1、vue的双向绑定原理是什么&#xff1f;里面的关键点在哪里&#xff1f; 2、实现水平垂直居中的方式&#xff1f; 3、常用伪元素有哪一些&#xff1f; 4、移动端如何适配不同屏幕尺寸&#xff1f; 5、本地存储有哪一些&#xff1f;他们三者有什么区别&#xff1f; 6、JS的数据…...

广电运营商三网融合监控运维方案

随着三网融合逐步发展、深化&#xff0c;广电网络从为用户提供原本单一的信息服务转向了集语音、文字、图像为一体的信息服务&#xff0c;同时也实现了由单一独立的网络向综合性网络的改变。如何在业务的融合与竞争中创造核心竞争力&#xff0c;利用自身网络覆盖率上的优势&…...

数据库锁简析

数据库大并发操作要考虑死锁和锁的性能问题。用T1代表一个数据库执行请求&#xff0c;T2代表另一个请求&#xff0c;也可以理解为T1为一个线程&#xff0c;T2 为另一个线程。T3,T4以此类推。下面以SQL Server为例。 锁的种类 共享锁(Shared lock) 例1&#xff1a;T1: select…...

说说广播流与普通流

分析&回答 user actions 可以看作是事件流&#xff08;普通流&#xff09;patterns 为广播流,把全量数据加载到不同的计算节点。 广播流 Broadcast是一份存储在TaskManager内存中的只读的缓存数据在执行job的过程中需要反复使用的数据&#xff0c;为了达到数据共享&am…...

内卷的本质和大数据在计量经济学领域的运用思考

内卷的本质和大数据在计量经济学领域的运用思考 今天我们来思考两个问题&#xff1a; 当下经济的困局在哪里&#xff1f;为何内卷越来越严重&#xff1f;内卷的本质是什么&#xff1f;为何会出现内卷&#xff1f;市场经济运行的底层逻辑是什么&#xff1f;西方经济学理论的指导…...

毕业设计-摄像头识别二维码

本毕业设计采用imx6ull-linux4.1.15-qt5.6开发板进行测试 相关交叉编译包和摄像头测试程序已上传&#xff1a;https://download.csdn.net/download/qq_42952079/88282608 将zbar和opencv下的lib库文件拷贝到开发板的lib目录下&#xff0c;将camera可执行文件拷贝到开发板目录下…...

封装动态表单组件

技术栈&#xff1a;vue2 js webpack 需求&#xff1a; 利用数据渲染表单&#xff0c;实现代码的精简化及效率的提升。 效果图&#xff1a; 封装的组件&#xff1a; <div v-if"formConfig"><el-formv-bind"$attrs"ref"formDom":model…...

提高Python并发性能 - asyncio/aiohttp介绍

在进行大规模数据采集时&#xff0c;如何提高Python爬虫的并发性能是一个关键问题。本文将向您介绍使用asyncio和aiohttp库实现异步网络请求的方法&#xff0c;并通过具体结果和结论展示它们对于优化爬虫效率所带来的效果。 1. 什么是异步编程&#xff1f; 异步编程是一种非阻…...

前端倒计时误差!

提示:记录工作中遇到的需求及解决办法 文章目录 前言一、误差从何而来?二、五大解决方案1. 动态校准法(基础版)2. Web Worker 计时3. 服务器时间同步4. Performance API 高精度计时5. 页面可见性API优化三、生产环境最佳实践四、终极解决方案架构前言 前几天听说公司某个项…...

MMaDA: Multimodal Large Diffusion Language Models

CODE &#xff1a; https://github.com/Gen-Verse/MMaDA Abstract 我们介绍了一种新型的多模态扩散基础模型MMaDA&#xff0c;它被设计用于在文本推理、多模态理解和文本到图像生成等不同领域实现卓越的性能。该方法的特点是三个关键创新:(i) MMaDA采用统一的扩散架构&#xf…...

Neo4j 集群管理:原理、技术与最佳实践深度解析

Neo4j 的集群技术是其企业级高可用性、可扩展性和容错能力的核心。通过深入分析官方文档,本文将系统阐述其集群管理的核心原理、关键技术、实用技巧和行业最佳实践。 Neo4j 的 Causal Clustering 架构提供了一个强大而灵活的基石,用于构建高可用、可扩展且一致的图数据库服务…...

【配置 YOLOX 用于按目录分类的图片数据集】

现在的图标点选越来越多&#xff0c;如何一步解决&#xff0c;采用 YOLOX 目标检测模式则可以轻松解决 要在 YOLOX 中使用按目录分类的图片数据集&#xff08;每个目录代表一个类别&#xff0c;目录下是该类别的所有图片&#xff09;&#xff0c;你需要进行以下配置步骤&#x…...

OPenCV CUDA模块图像处理-----对图像执行 均值漂移滤波(Mean Shift Filtering)函数meanShiftFiltering()

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 在 GPU 上对图像执行 均值漂移滤波&#xff08;Mean Shift Filtering&#xff09;&#xff0c;用于图像分割或平滑处理。 该函数将输入图像中的…...

【网络安全】开源系统getshell漏洞挖掘

审计过程&#xff1a; 在入口文件admin/index.php中&#xff1a; 用户可以通过m,c,a等参数控制加载的文件和方法&#xff0c;在app/system/entrance.php中存在重点代码&#xff1a; 当M_TYPE system并且M_MODULE include时&#xff0c;会设置常量PATH_OWN_FILE为PATH_APP.M_T…...

uniapp 字符包含的相关方法

在uniapp中&#xff0c;如果你想检查一个字符串是否包含另一个子字符串&#xff0c;你可以使用JavaScript中的includes()方法或者indexOf()方法。这两种方法都可以达到目的&#xff0c;但它们在处理方式和返回值上有所不同。 使用includes()方法 includes()方法用于判断一个字…...

windows系统MySQL安装文档

概览&#xff1a;本文讨论了MySQL的安装、使用过程中涉及的解压、配置、初始化、注册服务、启动、修改密码、登录、退出以及卸载等相关内容&#xff0c;为学习者提供全面的操作指导。关键要点包括&#xff1a; 解压 &#xff1a;下载完成后解压压缩包&#xff0c;得到MySQL 8.…...

CVPR2025重磅突破:AnomalyAny框架实现单样本生成逼真异常数据,破解视觉检测瓶颈!

本文介绍了一种名为AnomalyAny的创新框架&#xff0c;该方法利用Stable Diffusion的强大生成能力&#xff0c;仅需单个正常样本和文本描述&#xff0c;即可生成逼真且多样化的异常样本&#xff0c;有效解决了视觉异常检测中异常样本稀缺的难题&#xff0c;为工业质检、医疗影像…...

区块链技术概述

区块链技术是一种去中心化、分布式账本技术&#xff0c;通过密码学、共识机制和智能合约等核心组件&#xff0c;实现数据不可篡改、透明可追溯的系统。 一、核心技术 1. 去中心化 特点&#xff1a;数据存储在网络中的多个节点&#xff08;计算机&#xff09;&#xff0c;而非…...