后台运维操作建议
文章目录
- 1.版本升级
- 2.配置发布
- 3.数据库/脚本操作
- 4.发布依赖确认
- 5.发布规范
- 6.服务下线
- 参考文献
1.版本升级
版本升级是软件维护和演进中的关键环节,但它可能带来一系列问题。这些问题涉及兼容性、功能、性能、安全性等方面。
- 【强制】版本管理:使用版本控制工具管理版本,确保不同版本间的兼容性。遵循语义版本控制(SemVer)原则,以清晰标识版本间的兼容性。
- 【强制】迁移指南:提供详细的迁移指南和文档,帮助用户了解版本升级的变化和兼容性注意事项。
- 【强制】回归测试:在新版本发布前,执行回归测试,确保新版本的代码不会破坏旧版本的功能。
- 【强制】灰度发布:在新版本发布时,采用灰度发布的方式,逐步将流量引导到新版本,并监控兼容性问题。
- 【建议】自动化测试:建立向后兼容性的自动化测试,模拟旧版本客户端的行为,验证其在新版本环境下的兼容性。
2.配置发布
服务配置变更是系统维护和优化的重要操作,但如果配置变更过程中出现错误,可能会导致线上问题。以下是规避服务配置变更引发问题的措施:
- 【强制】配置梳理。在发布前,梳理所有依赖的配置项,确保所有配置项的完整性,发布模板中的 checklist 需要有此动作。
- 【强制】配置 Review。服务配置发布需要经过其他同事 Review 同意后方可发布。
- 【强制】预发布环境验证:在将配置变更应用到生产环境之前,先在预发布环境中进行测试,确保配置变更不会引入新的问题。
- 【强制】发布后验证,由测试同学在生产环境进行回归验证,确保配置加载正确且系统功能正常。
- 【强制】配置回滚:建立有效的回滚机制,在配置变更出现问题时能够快速恢复到稳定的配置。
- 【建议】发布前验证:在配置变更前,使用配置验证工具或脚本检查配置文件的正确性,确保语法和参数设置无误。
- 【建议】在配置文件中注释说明每个字段及其取值的含义。
3.数据库/脚本操作
- 【强制】在进行数据库和脚本操作前,必须让相关团队(如开发、运维)review,确认操作需求的详细描述和业务背景,确认操作的合理性和必要性,确保操作设计符合业务需求,并记录所有操作场景及其用途。
- 【强制】优化脚本和SQL语句,确保操作高效且不会对系统性能造成影响。例如,分批删除数据避免全表扫描锁表
- 【强制】在涉及多个步骤的操作中(如批量更新),使用数据库事务,确保操作的原子性和一致性。
- 【强制】使用 DMS 平台进行数据库变更操作,严格控制数据库和脚本操作权限,确保只有授权人员才能进行相关操作。
- 【强制】按照预先制定的操作步骤进行操作,确保每一步操作都记录在案。
- 【强制】在发布完成后,及时进行回归验证,确保操作执行正确且系统功能正常。
- 【强制】对定期脚本的执行过程和结果要有监控告警和打印日志。
- 【建议】涉及重大的变更发布时,制定详细的回滚方案,确保在操作出现问题时能够快速恢复到操作前的状态。常见的手段是备份当前数据库状态,准备好回滚脚本。
- 【建议】在操作完成后,进行总结和反馈,记录操作过程中出现的问题和解决方案,以便后续改进。
- 【建议】定期进行数据库和脚本操作相关的培训和知识共享,提升团队成员的操作能力。
4.发布依赖确认
发布依赖问题通常涉及到在软件发布过程中,系统组件、库或服务的依赖关系出现不一致或冲突,可能导致应用程序运行不稳定或失败。
为避免发布依赖不满足导致的问题,可通过如下措施规避:
- 【强制】跨组的事项负责人需要梳理发布依赖项。
- 【强制】跨组的事项一定要确定负责人,统一发布节奏。
- 【强制】现网功能有损,修复发布的第一时间应该是修复功能。要根据功能的情况、修复的复杂度,重要程度去思考如何发布。
5.发布规范
系统发布规范是指在软件系统开发和部署过程中,为了确保系统的稳定性、安全性和可维护性而制定的一系列标准和流程。这些规范有助于团队在发布新版本时保持一致性,减少错误,确保用户体验。以下是一些关键的系统发布规范:
强制:
- 确认即将发布的版本已通过CI/CD流水线的所有测试,并且版本号正确。
- CI流水线应该有增量覆盖率的拦截节点,不允许代码未经测试就发布上线。
- 检查服务器配置、网络连接、数据库、MQ、Redis 等,确保已经配置正确。
- 选择适当的发布时间,如盘后,确保在问题发生时有足够的时间进行处理,且不会影响到大部分用户。
- 在发布完成后,及时进行功能验证,确保新版本功能正常,系统稳定。例如验证关键功能、接口、性能指标等。
- 严格控制发布权限,确保只有授权人员才能进行服务发布操作。
- 涉及其他依赖方的发布,需要通知对应依赖方,依赖方确认后方可发布。比如发布大流量场景应提前通知数据上游扩容,以免请求量激增导致上游服务被压垮。
建议:
- 涉及重大发布时,按照预先制定的发布步骤进行操作,确保每一步操作都记录在案。
- 在发布完成后,进行总结和反馈,记录发布过程中出现的问题和解决方案,以便后续改进。
- 编写详细的发布文档,记录发布步骤、注意事项、回滚方案等。
- 定期进行发布相关的培训和知识共享,提升团队成员的发布操作能力。
- 生产环境的变更及时同步到验证群,并@相关同事进行double check。
6.服务下线
服务下线属于高危高作,可能会对系统的可用性和用户体验产生负面影响。为减少服务下线所带来的问题需要制定严格的规范流程和应急措施。
- 【强制】制定下线计划:明确服务下线的目标和理由(如淘汰过时的服务、进行重大升级等)。制定详细的时间表,包括服务下线的开始时间、各阶段时间点和预计完成时间。
- 【强制】通知相关方:内部通知:通知开发、运维、产品、客服等相关团队,确保所有团队了解服务下线的计划和影响。外部通知:向用户发布公告,告知服务下线的时间、影响范围和替代方案。如果可能,提供替代服务或解决方案。
- 【强制】逐步下线:根据服务的功能模块逐步下线,减少对用户的影响。可以通过逐步停用功能或减少流量的方式进行。
- 【强制】回滚计划。指定服务下线过程中发生意外情况的回复计划,比如服务重新上线,数据恢复等。
- 【建议】收集反馈:用户反馈:收集用户对服务下线过程的反馈,了解用户体验和问题。内部反馈:收集团队对下线过程的反馈,评估下线过程中的问题和改进建议。
参考文献
相关文章:

后台运维操作建议
文章目录 1.版本升级2.配置发布3.数据库/脚本操作4.发布依赖确认5.发布规范6.服务下线参考文献 1.版本升级 版本升级是软件维护和演进中的关键环节,但它可能带来一系列问题。这些问题涉及兼容性、功能、性能、安全性等方面。 【强制】版本管理:使用版本…...

NX二次开发调用内部函数设置对象穿透显示DSS_ATTR_set_show_through
获取动态库libdisp.dll的路径 void TcharToChar(const TCHAR* tchar, char* _char) {int iLength; #if UNICODE//获取字节长度 iLength = WideCharToMultiByte(CP_ACP, 0, tchar, -1, NULL, 0, NULL, NULL);//将tchar值赋给_char WideCharToMultiByte(CP_ACP, 0, tchar, …...

ubuntu16.04ros-用海龟机器人仿真循线系统
下载安装sudo apt-get install ros-kinetic-turtlebot ros-kinetic-turtlebot-apps ros-kinetic-turtlebot-interactions ros-kinetic-turtlebot-simulator ros-kinetic-kobuki-ftdi sudo apt-get install ros-kinetic-rocon-*echo "source /opt/ros/kinetic/setup.bash…...

解决Ubuntu 20.04上编译OpenCV 3.2时遇到的stdlib.h缺失错误
解决Ubuntu 20.04上编译OpenCV 3.2时遇到的stdlib.h缺失错误 您在 Ubuntu 20.04 上编译 OpenCV 3.2 时遇到的错误与 C 标准库的头文件配置问题有关。错误消息指出系统无法找到 <stdlib.h>,这通常与预编译头文件的处理、GCC 版本或者头文件搜索路径有关。下面…...

HTML综合案例
为了前端考试。 效果图: HTML代码: <!DOCTYPE html> <html lang"zh-CN"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><…...

TanStack——为现代前端开发提供高性能和灵活的工具
TanStack 是一个由社区主导的开源项目集合,专注于为现代前端开发提供高性能和灵活的工具。它包括多个流行的 JavaScript 和 TypeScript 库,主要用于处理表格、查询、虚拟化、状态管理等功能。 文章目录 1、TanStack Query:1.1 useQuery&#…...

Java爬虫️ 使用Jsoup库进行API请求有什么优势?
在Java的世界里,Jsoup库以其强大的HTML解析能力而闻名。它不仅仅是一个简单的解析器,更是一个功能齐全的工具箱,为开发者提供了从网页抓取到数据处理的一站式解决方案。本文将深入探讨使用Jsoup库进行API请求的优势,并提供代码示例…...

React源码02 - 基础知识 React API 一览
1. JSX到JavaScript的转换 <div id"div" key"key"><span>1</span><span>2</span> </div>React.createElement("div", // 大写开头会当做原生dom标签的字符串,而组件使用大写开头时,这…...

COMSOL with Matlab
文章目录 基本介绍COMSOL with MatlabCOMSOL主Matlab辅Matlab为主Comsol为辅 操作步骤常用指令mphopenmphgeommghmeshmphmeshstatsmphnavigatormphplot常用指令mphsavemphlaunchModelUtil.clear 实例教学自动另存新档**把语法套用到边界条件**把语法套用到另存新档 函数及其微分…...

【报表查询】.NET开源ORM框架 SqlSugar 系列
文章目录 前言实践一、按月统计没有为0实践二、 统计某月每天的数量实践三、对象和表随意JOIN实践四、 List<int>和表随意JOIN实践五、大数据处理实践六、每10分钟统计Count实践七、 每个ID都要对应时间总结 前言 在我们实际开发场景中,报表是最常见的功能&a…...

PostgreSQL数据库访问限制详解
pg_hba.conf 文件是 PostgreSQL 数据库系统中非常重要的一个配置文件,它用于定义哪些用户(或客户端)可以连接到 PostgreSQL 数据库服务器,以及他们可以使用哪些认证方法进行连接。 pg_hba.conf 的名称来源于 "Host-Based Aut…...

【test linux】创建一个ext4类型的文件系统
创建一个ext4类型的文件系统 dd 是一个非常强大的命令行工具,用于在Unix/Linux系统中进行低级别的数据复制和转换。这条命令的具体参数含义如下: if/dev/zero:指定输入文件(input file)为 /dev/zero,这是一…...

如何在繁忙的生活中找到自己的节奏?
目录 一、理解生活节奏的重要性 二、分析当前生活节奏 1. 时间分配 2. 心理状态 3. 身体状况 4. 生活习惯 1. 快慢适中 2. 张弛结合 3. 与目标相符 三、掌握调整生活节奏的策略 1. 设定优先级 2. 合理规划时间 3. 学会拒绝与取舍 4. 保持健康的生活方式 5. 留出…...

AI-PR曲线
PR曲线 人工智能里面的一个小概念。 2.3 性能度量(查全率,查准率,F1,PR曲线与ROC曲线) 预测出来的是一个概率,不能根据概率来说它是正类还是负类,要有一个阈值。 查准率(Precision&…...

Guava 提供了集合操作 `List`、`Set` 和 `Map` 三个工具类
入门示例 guava 最佳实践 学习指南 以下是使用Google Guava库中的工具方法来创建和操作List、Set、Map集合的一些示例: List相关操作 创建List 使用Lists.newArrayList()创建一个新的可变ArrayList实例。List<Integer> list Lists.newArrayList(1, 2, 3);/…...

深入解析 Elasticsearch 集群配置文件参数
在自建 Elasticsearch 集群时,我们需要通过 elasticsearch.yml 文件对节点角色、网络设置、集群发现和数据存储路径等进行灵活配置。配置项的合理设置对集群的稳定性、性能与扩展性影响深远。本文将以一个示例配置文件为蓝本,逐条解析各参数的含义与建议…...

WebMvcConfigurer和WebMvcConfigurationSupport(MVC配置)
一:基本介绍 WebMvcConfigurer是接口,用于配置全局的SpringMVC的相关属性,采用JAVABean的方式来代替传统的XML配置文件,提供了跨域设置、静态资源处理器、类型转化器、自定义拦截器、页面跳转等能力。 WebMvcConfigurationSupport是webmvc的…...

用 javascript 来回答宇宙外面是什么
宇宙外面是什么呢? 估计这个问题要困扰很多人, 让我们用一段 javascript 代码来回答一下. 一, 从一段代码说起 var 地球 {名字 : "地球",女友 : "月亮",外面 : {名字 : "太阳系",老大 : "太阳",老二 : {名字 : "木星",二…...

我的性能优化经验
专业方向:App cpu/memory/gpu/流畅度/响应时间的优化,Anr,Framework CarPowerManagementService模块的(STR),从0~1完成性能监控体系搭建,完成3大版本迭代高质量性能交付 响应时间: …...

XSLT 编辑 XML
XSLT 编辑 XML 介绍 XSLT(可扩展样式表语言转换)是一种用于转换XML文档的语言。它允许开发人员将XML数据转换为其他格式,如HTML、PDF或纯文本。XSLT通过使用XPath查询来定位XML文档中的元素,并对这些元素应用转换规则。在本教程…...

数智读书笔记系列010 生命3.0:人工智能时代 人类的进化与重生
书名:生命3.0 生命3.0:人工智能时代,人类的进化与重生 著者:[美]迈克斯•泰格马克 迈克斯・泰格马克 教育背景与职业 教育背景:迈克斯・泰格马克毕业于麻省理工学院,获物理学博士学位。职业经…...

Transfomer的各层矩阵
一、输入 输入一句话:Hello CYZLAB the inspired world 每个单词为一个token 二、Embedding 这里的词向量维度为6,矩阵的行数为token数,列数是词向量的维度 这列是注释不算hello122694CYZLAB222372the222596inspired132440world431273 …...

代码随想录第51天
99.岛屿数量 深搜 import java.util.*;class Main{static int[][] directions {{0, 1}, {1, 0}, {0, -1}, {-1, 0}};static boolean[][] visited;public static void main(String[] args) {Scanner sc new Scanner(System.in);int n sc.nextInt();int m sc.nextInt();int…...

基础库httpx的使用
urllib 库和 requests 库的使用,已经可以爬取绝大多数网站的数据,但对于某些网站依然无能为力。什么情况?这些网站强制使用HTTP/2.0协议访问,这时 urllib 和requests 是无法爬取数据的,因为它们只支持 HTTP/1.1,不支持…...

c++中如何保持结构体的线程安全?3D坐标的线程安全:从理论到最优解
使用mutex的困扰 struct Point3d {std::mutex mtx;double x, y, z;void set(double nx, double ny, double nz) {std::lock_guard<std::mutex> lock(mtx);x nx; y ny; z nz;} };这种方案虽然安全,但性能开销确实不小。每次访问都需要加锁解锁,…...

Zabbix6.0升级为6.4
为了体验一些新的功能,比如 Webhook 和问题抑制等,升级个小版本。 一、环境信息 1. 版本要求 一定要事先查看官方文档,确认组件要求的版本,否则版本过高或者过低都会出现问题。 2. 升级前后信息 环境升级前升级后操作系统CentOS…...

答题考试系统v1.6.1高级版源码分享+uniapp+搭建测试环境
一.系统介绍 一款基于FastAdminThinkPHPUniapp开发的小程序答题考试系统,支持多种试题类型、多种试题难度、练题、考试、补考模式,提供全部前后台无加密源代码,支持私有化部署 二.测试环境 系统环境:CentOS、 运行环境&#x…...

【Lua热更新】下篇 -- 更新中
上篇链接:【Lua热更新】上篇 文章目录 三、xLua热更新📖1.概述📚︎2.导入xLua框架🔖3. C#调用Lua3.1Lua解析器3.2Lua文件夹的重定向3.3Lua解析器管理器3.4全局变量获取3.5全局函数获取3.6映射到List和Dictionary3.7映射到类3.8映…...

射频测试入门学习(三)——程控仪器是怎样和电脑连接通信的
目录 一、程控仪器需要哪些条件 二、可程控仪器 三、专业的仪器通信软件、驱动 四、编程语言 五、电脑控制仪器条件汇总 六、仪器指令查询 七、结语 一、程控仪器需要哪些条件 1、需要具备硬件条件(可程控的仪器、个人计算机(PC)) 2、专业的仪器通信软件、驱动 3、…...

并发控制之Semaphore
Semaphore 作用 信号量,用于控制同时访问特定资源的线程数量,通过协调各个线程,以确保对共享资源的访问不会导致冲突或数据不一致等问题,有点类似令牌桶,内部维护一组许可证, acquire获取许可证…...