当前位置: 首页 > news >正文

后台运维操作建议

文章目录

  • 1.版本升级
  • 2.配置发布
  • 3.数据库/脚本操作
  • 4.发布依赖确认
  • 5.发布规范
  • 6.服务下线
  • 参考文献

1.版本升级

版本升级是软件维护和演进中的关键环节,但它可能带来一系列问题。这些问题涉及兼容性、功能、性能、安全性等方面。

  • 【强制】版本管理:使用版本控制工具管理版本,确保不同版本间的兼容性。遵循语义版本控制(SemVer)原则,以清晰标识版本间的兼容性。
  • 【强制】迁移指南:提供详细的迁移指南和文档,帮助用户了解版本升级的变化和兼容性注意事项。
  • 【强制】回归测试:在新版本发布前,执行回归测试,确保新版本的代码不会破坏旧版本的功能。
  • 【强制】灰度发布:在新版本发布时,采用灰度发布的方式,逐步将流量引导到新版本,并监控兼容性问题。
  • 【建议】自动化测试:建立向后兼容性的自动化测试,模拟旧版本客户端的行为,验证其在新版本环境下的兼容性。

2.配置发布

服务配置变更是系统维护和优化的重要操作,但如果配置变更过程中出现错误,可能会导致线上问题。以下是规避服务配置变更引发问题的措施:

  • 【强制】配置梳理。在发布前,梳理所有依赖的配置项,确保所有配置项的完整性,发布模板中的 checklist 需要有此动作。
  • 【强制】配置 Review。服务配置发布需要经过其他同事 Review 同意后方可发布。
  • 【强制】预发布环境验证:在将配置变更应用到生产环境之前,先在预发布环境中进行测试,确保配置变更不会引入新的问题。
  • 【强制】发布后验证,由测试同学在生产环境进行回归验证,确保配置加载正确且系统功能正常。
  • 【强制】配置回滚:建立有效的回滚机制,在配置变更出现问题时能够快速恢复到稳定的配置。
  • 【建议】发布前验证:在配置变更前,使用配置验证工具或脚本检查配置文件的正确性,确保语法和参数设置无误。
  • 【建议】在配置文件中注释说明每个字段及其取值的含义。

3.数据库/脚本操作

  • 【强制】在进行数据库和脚本操作前,必须让相关团队(如开发、运维)review,确认操作需求的详细描述和业务背景,确认操作的合理性和必要性,确保操作设计符合业务需求,并记录所有操作场景及其用途。
  • 【强制】优化脚本和SQL语句,确保操作高效且不会对系统性能造成影响。例如,分批删除数据避免全表扫描锁表
  • 【强制】在涉及多个步骤的操作中(如批量更新),使用数据库事务,确保操作的原子性和一致性。
  • 【强制】使用 DMS 平台进行数据库变更操作,严格控制数据库和脚本操作权限,确保只有授权人员才能进行相关操作。
  • 【强制】按照预先制定的操作步骤进行操作,确保每一步操作都记录在案。
  • 【强制】在发布完成后,及时进行回归验证,确保操作执行正确且系统功能正常。
  • 【强制】对定期脚本的执行过程和结果要有监控告警和打印日志。
  • 【建议】涉及重大的变更发布时,制定详细的回滚方案,确保在操作出现问题时能够快速恢复到操作前的状态。常见的手段是备份当前数据库状态,准备好回滚脚本。
  • 【建议】在操作完成后,进行总结和反馈,记录操作过程中出现的问题和解决方案,以便后续改进。
  • 【建议】定期进行数据库和脚本操作相关的培训和知识共享,提升团队成员的操作能力。

4.发布依赖确认

发布依赖问题通常涉及到在软件发布过程中,系统组件、库或服务的依赖关系出现不一致或冲突,可能导致应用程序运行不稳定或失败。

为避免发布依赖不满足导致的问题,可通过如下措施规避:

  • 【强制】跨组的事项负责人需要梳理发布依赖项。
  • 【强制】跨组的事项一定要确定负责人,统一发布节奏。
  • 【强制】现网功能有损,修复发布的第一时间应该是修复功能。要根据功能的情况、修复的复杂度,重要程度去思考如何发布。

5.发布规范

系统发布规范是指在软件系统开发和部署过程中,为了确保系统的稳定性、安全性和可维护性而制定的一系列标准和流程。这些规范有助于团队在发布新版本时保持一致性,减少错误,确保用户体验。以下是一些关键的系统发布规范:

强制:

  • 确认即将发布的版本已通过CI/CD流水线的所有测试,并且版本号正确。
  • CI流水线应该有增量覆盖率的拦截节点,不允许代码未经测试就发布上线。
  • 检查服务器配置、网络连接、数据库、MQ、Redis 等,确保已经配置正确。
  • 选择适当的发布时间,如盘后,确保在问题发生时有足够的时间进行处理,且不会影响到大部分用户。
  • 在发布完成后,及时进行功能验证,确保新版本功能正常,系统稳定。例如验证关键功能、接口、性能指标等。
  • 严格控制发布权限,确保只有授权人员才能进行服务发布操作。
  • 涉及其他依赖方的发布,需要通知对应依赖方,依赖方确认后方可发布。比如发布大流量场景应提前通知数据上游扩容,以免请求量激增导致上游服务被压垮。

建议:

  • 涉及重大发布时,按照预先制定的发布步骤进行操作,确保每一步操作都记录在案。
  • 在发布完成后,进行总结和反馈,记录发布过程中出现的问题和解决方案,以便后续改进。
  • 编写详细的发布文档,记录发布步骤、注意事项、回滚方案等。
  • 定期进行发布相关的培训和知识共享,提升团队成员的发布操作能力。
  • 生产环境的变更及时同步到验证群,并@相关同事进行double check。

6.服务下线

服务下线属于高危高作,可能会对系统的可用性和用户体验产生负面影响。为减少服务下线所带来的问题需要制定严格的规范流程和应急措施。

  • 【强制】制定下线计划:明确服务下线的目标和理由(如淘汰过时的服务、进行重大升级等)。制定详细的时间表,包括服务下线的开始时间、各阶段时间点和预计完成时间。
  • 【强制】通知相关方:内部通知:通知开发、运维、产品、客服等相关团队,确保所有团队了解服务下线的计划和影响。外部通知:向用户发布公告,告知服务下线的时间、影响范围和替代方案。如果可能,提供替代服务或解决方案。
  • 【强制】逐步下线:根据服务的功能模块逐步下线,减少对用户的影响。可以通过逐步停用功能或减少流量的方式进行。
  • 【强制】回滚计划。指定服务下线过程中发生意外情况的回复计划,比如服务重新上线,数据恢复等。
  • 【建议】收集反馈:用户反馈:收集用户对服务下线过程的反馈,了解用户体验和问题。内部反馈:收集团队对下线过程的反馈,评估下线过程中的问题和改进建议。

参考文献

相关文章:

后台运维操作建议

文章目录 1.版本升级2.配置发布3.数据库/脚本操作4.发布依赖确认5.发布规范6.服务下线参考文献 1.版本升级 版本升级是软件维护和演进中的关键环节,但它可能带来一系列问题。这些问题涉及兼容性、功能、性能、安全性等方面。 【强制】版本管理:使用版本…...

NX二次开发调用内部函数设置对象穿透显示DSS_ATTR_set_show_through

获取动态库libdisp.dll的路径 void TcharToChar(const TCHAR* tchar, char* _char) {int iLength; #if UNICODE//获取字节长度 iLength = WideCharToMultiByte(CP_ACP, 0, tchar, -1, NULL, 0, NULL, NULL);//将tchar值赋给_char WideCharToMultiByte(CP_ACP, 0, tchar, …...

ubuntu16.04ros-用海龟机器人仿真循线系统

下载安装sudo apt-get install ros-kinetic-turtlebot ros-kinetic-turtlebot-apps ros-kinetic-turtlebot-interactions ros-kinetic-turtlebot-simulator ros-kinetic-kobuki-ftdi sudo apt-get install ros-kinetic-rocon-*echo "source /opt/ros/kinetic/setup.bash…...

解决Ubuntu 20.04上编译OpenCV 3.2时遇到的stdlib.h缺失错误

解决Ubuntu 20.04上编译OpenCV 3.2时遇到的stdlib.h缺失错误 您在 Ubuntu 20.04 上编译 OpenCV 3.2 时遇到的错误与 C 标准库的头文件配置问题有关。错误消息指出系统无法找到 <stdlib.h>&#xff0c;这通常与预编译头文件的处理、GCC 版本或者头文件搜索路径有关。下面…...

HTML综合案例

为了前端考试。 效果图&#xff1a; HTML代码&#xff1a; <!DOCTYPE html> <html lang"zh-CN"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><…...

TanStack——为现代前端开发提供高性能和灵活的工具

TanStack 是一个由社区主导的开源项目集合&#xff0c;专注于为现代前端开发提供高性能和灵活的工具。它包括多个流行的 JavaScript 和 TypeScript 库&#xff0c;主要用于处理表格、查询、虚拟化、状态管理等功能。 文章目录 1、TanStack Query&#xff1a;1.1 useQuery&#…...

Java爬虫️ 使用Jsoup库进行API请求有什么优势?

在Java的世界里&#xff0c;Jsoup库以其强大的HTML解析能力而闻名。它不仅仅是一个简单的解析器&#xff0c;更是一个功能齐全的工具箱&#xff0c;为开发者提供了从网页抓取到数据处理的一站式解决方案。本文将深入探讨使用Jsoup库进行API请求的优势&#xff0c;并提供代码示例…...

React源码02 - 基础知识 React API 一览

1. JSX到JavaScript的转换 <div id"div" key"key"><span>1</span><span>2</span> </div>React.createElement("div", // 大写开头会当做原生dom标签的字符串&#xff0c;而组件使用大写开头时&#xff0c;这…...

COMSOL with Matlab

文章目录 基本介绍COMSOL with MatlabCOMSOL主Matlab辅Matlab为主Comsol为辅 操作步骤常用指令mphopenmphgeommghmeshmphmeshstatsmphnavigatormphplot常用指令mphsavemphlaunchModelUtil.clear 实例教学自动另存新档**把语法套用到边界条件**把语法套用到另存新档 函数及其微分…...

【报表查询】.NET开源ORM框架 SqlSugar 系列

文章目录 前言实践一、按月统计没有为0实践二、 统计某月每天的数量实践三、对象和表随意JOIN实践四、 List<int>和表随意JOIN实践五、大数据处理实践六、每10分钟统计Count实践七、 每个ID都要对应时间总结 前言 在我们实际开发场景中&#xff0c;报表是最常见的功能&a…...

PostgreSQL数据库访问限制详解

pg_hba.conf 文件是 PostgreSQL 数据库系统中非常重要的一个配置文件&#xff0c;它用于定义哪些用户&#xff08;或客户端&#xff09;可以连接到 PostgreSQL 数据库服务器&#xff0c;以及他们可以使用哪些认证方法进行连接。 pg_hba.conf 的名称来源于 "Host-Based Aut…...

【test linux】创建一个ext4类型的文件系统

创建一个ext4类型的文件系统 dd 是一个非常强大的命令行工具&#xff0c;用于在Unix/Linux系统中进行低级别的数据复制和转换。这条命令的具体参数含义如下&#xff1a; if/dev/zero&#xff1a;指定输入文件&#xff08;input file&#xff09;为 /dev/zero&#xff0c;这是一…...

如何在繁忙的生活中找到自己的节奏?

目录 一、理解生活节奏的重要性 二、分析当前生活节奏 1. 时间分配 2. 心理状态 3. 身体状况 4. 生活习惯 1. 快慢适中 2. 张弛结合 3. 与目标相符 三、掌握调整生活节奏的策略 1. 设定优先级 2. 合理规划时间 3. 学会拒绝与取舍 4. 保持健康的生活方式 5. 留出…...

AI-PR曲线

PR曲线 人工智能里面的一个小概念。 2.3 性能度量&#xff08;查全率&#xff0c;查准率&#xff0c;F1&#xff0c;PR曲线与ROC曲线&#xff09; 预测出来的是一个概率&#xff0c;不能根据概率来说它是正类还是负类&#xff0c;要有一个阈值。 查准率&#xff08;Precision&…...

Guava 提供了集合操作 `List`、`Set` 和 `Map` 三个工具类

入门示例 guava 最佳实践 学习指南 以下是使用Google Guava库中的工具方法来创建和操作List、Set、Map集合的一些示例&#xff1a; List相关操作 创建List 使用Lists.newArrayList()创建一个新的可变ArrayList实例。List<Integer> list Lists.newArrayList(1, 2, 3);/…...

深入解析 Elasticsearch 集群配置文件参数

在自建 Elasticsearch 集群时&#xff0c;我们需要通过 elasticsearch.yml 文件对节点角色、网络设置、集群发现和数据存储路径等进行灵活配置。配置项的合理设置对集群的稳定性、性能与扩展性影响深远。本文将以一个示例配置文件为蓝本&#xff0c;逐条解析各参数的含义与建议…...

WebMvcConfigurer和WebMvcConfigurationSupport(MVC配置)

一:基本介绍 WebMvcConfigurer是接口&#xff0c;用于配置全局的SpringMVC的相关属性&#xff0c;采用JAVABean的方式来代替传统的XML配置文件&#xff0c;提供了跨域设置、静态资源处理器、类型转化器、自定义拦截器、页面跳转等能力。 WebMvcConfigurationSupport是webmvc的…...

用 javascript 来回答宇宙外面是什么

宇宙外面是什么呢? 估计这个问题要困扰很多人, 让我们用一段 javascript 代码来回答一下. 一, 从一段代码说起 var 地球 {名字 : "地球",女友 : "月亮",外面 : {名字 : "太阳系",老大 : "太阳",老二 : {名字 : "木星",二…...

我的性能优化经验

专业方向&#xff1a;App cpu/memory/gpu/流畅度/响应时间的优化&#xff0c;Anr&#xff0c;Framework CarPowerManagementService模块的&#xff08;STR&#xff09;&#xff0c;从0~1完成性能监控体系搭建&#xff0c;完成3大版本迭代高质量性能交付 响应时间&#xff1a; …...

XSLT 编辑 XML

XSLT 编辑 XML 介绍 XSLT&#xff08;可扩展样式表语言转换&#xff09;是一种用于转换XML文档的语言。它允许开发人员将XML数据转换为其他格式&#xff0c;如HTML、PDF或纯文本。XSLT通过使用XPath查询来定位XML文档中的元素&#xff0c;并对这些元素应用转换规则。在本教程…...

数智读书笔记系列010 生命3.0:人工智能时代 人类的进化与重生

书名&#xff1a;生命3.0 生命3.0&#xff1a;人工智能时代,人类的进化与重生 著者&#xff1a;&#xff3b;美&#xff3d;迈克斯•泰格马克 迈克斯・泰格马克 教育背景与职业 教育背景&#xff1a;迈克斯・泰格马克毕业于麻省理工学院&#xff0c;获物理学博士学位。职业经…...

Transfomer的各层矩阵

一、输入 输入一句话&#xff1a;Hello CYZLAB the inspired world 每个单词为一个token 二、Embedding 这里的词向量维度为6&#xff0c;矩阵的行数为token数&#xff0c;列数是词向量的维度 这列是注释不算hello122694CYZLAB222372the222596inspired132440world431273 …...

代码随想录第51天

99.岛屿数量 深搜 import java.util.*;class Main{static int[][] directions {{0, 1}, {1, 0}, {0, -1}, {-1, 0}};static boolean[][] visited;public static void main(String[] args) {Scanner sc new Scanner(System.in);int n sc.nextInt();int m sc.nextInt();int…...

基础库httpx的使用

urllib 库和 requests 库的使用&#xff0c;已经可以爬取绝大多数网站的数据&#xff0c;但对于某些网站依然无能为力。什么情况?这些网站强制使用HTTP/2.0协议访问&#xff0c;这时 urllib 和requests 是无法爬取数据的&#xff0c;因为它们只支持 HTTP/1.1&#xff0c;不支持…...

c++中如何保持结构体的线程安全?3D坐标的线程安全:从理论到最优解

使用mutex的困扰 struct Point3d {std::mutex mtx;double x, y, z;void set(double nx, double ny, double nz) {std::lock_guard<std::mutex> lock(mtx);x nx; y ny; z nz;} };这种方案虽然安全&#xff0c;但性能开销确实不小。每次访问都需要加锁解锁&#xff0c;…...

Zabbix6.0升级为6.4

为了体验一些新的功能&#xff0c;比如 Webhook 和问题抑制等&#xff0c;升级个小版本。 一、环境信息 1. 版本要求 一定要事先查看官方文档&#xff0c;确认组件要求的版本&#xff0c;否则版本过高或者过低都会出现问题。 2. 升级前后信息 环境升级前升级后操作系统CentOS…...

答题考试系统v1.6.1高级版源码分享+uniapp+搭建测试环境

一.系统介绍 一款基于FastAdminThinkPHPUniapp开发的小程序答题考试系统&#xff0c;支持多种试题类型、多种试题难度、练题、考试、补考模式&#xff0c;提供全部前后台无加密源代码&#xff0c;支持私有化部署 二.测试环境 系统环境&#xff1a;CentOS、 运行环境&#x…...

【Lua热更新】下篇 -- 更新中

上篇链接&#xff1a;【Lua热更新】上篇 文章目录 三、xLua热更新&#x1f4d6;1.概述&#x1f4da;︎2.导入xLua框架&#x1f516;3. C#调用Lua3.1Lua解析器3.2Lua文件夹的重定向3.3Lua解析器管理器3.4全局变量获取3.5全局函数获取3.6映射到List和Dictionary3.7映射到类3.8映…...

射频测试入门学习(三)——程控仪器是怎样和电脑连接通信的

目录 一、程控仪器需要哪些条件 二、可程控仪器 三、专业的仪器通信软件、驱动 四、编程语言 五、电脑控制仪器条件汇总 六、仪器指令查询 七、结语 一、程控仪器需要哪些条件 1、需要具备硬件条件(可程控的仪器、个人计算机(PC)) 2、专业的仪器通信软件、驱动 3、…...

并发控制之Semaphore

Semaphore 作用 信号量&#xff0c;用于控制同时访问特定资源的线程数量&#xff0c;通过协调各个线程&#xff0c;以确保对共享资源的访问不会导致冲突或数据不一致等问题&#xff0c;有点类似令牌桶&#xff0c;内部维护一组许可证&#xff0c; acquire获取许可证&#xf…...