当前位置: 首页 > news >正文

云原生业务全流程DevOps配置预研与实践

背景

我在一个二线城市(山东济南),相对与北上广深杭这些IT业发达的城市来说,济南IT业对于业内新技术的接受度是有点慢的,国内很多一线大厂早先几年前就开始实践使用的技术,我们这边也是近两年才开始慢慢兴起。
我本人是在21年开始正式接触云原生。我们当时的CTO是一个比较有超前意识(相对而言),且是一个敢于尝试的领导。当时公司的平台系统,平时虽然运行的挺好,但每年的那几个关键集中业务期,因并发量大,总会崩溃几十分钟。客户对此非常不瞒,公司上下从业务部门到研发部门都面临着巨大的压力。
解决问题的方法无非就那么几种:

  • 优化服务性能,提升业务并发,治标治本。但是要能做,也不至于拖了这么长时间了
  • 扩容集群,用预算换并发,治标不治本。超额预算对高层无法交代
  • 引入新技术,多方位对问题进行缓解或解决

然后经过种种决策,我们决定上马K8S+Istio,来解决我们所面临的“难题”。
过程中我们肯定会遇到很多新的难题,比如:

  • 新知识的学习与应用,每个团队成员都需要更新自己的知识体系
  • 新框架的使用与老框架之间转换的时间成本把控
  • 团队成员对新体系的接纳
  • 新体系的初体验是否会给团队带来效率问题等等。

为了使团队能够更快的接受,并且不给团队带来因为新体系而造成的额外问题。我们的CTO提出了一系列要求:

  • 提升产品交付质量!但是,需要整体组织协作起来,并且有技术指导及平台支撑
  • 提高产研效率和价值产出!但是,希望避免无效的加班加点和无效的工作产出
  • 尽量不要增加个体的工作复杂和繁重度,如果能简化、便利化就更好

基于以上要求,作为先头部队,我开始了一系列的预研工作。本篇我将讲一讲基于DevOps的自动化流水线的实践工作

预研

如何减轻团队负担、提升效率?

自动化!让重复性的工作全部自动化,让流程性的东西自动化,让不需要主观判断的东西自动化!

如何全流程自动化?

流水线!从开发到上线,中间需要经历检测、构建、测试、部署等等多个步骤,使用流水按将这些步骤串联起来,通过各种条件判断,完全可以解放出更多的人力。

整个自动化流水线需要哪些工具?下面我们来聊一聊。

配置

CI/CD平台

要跑流水线,我们首先得有一个CI/CD平台,那我们平时会用到哪些CI/CD工具呢?

  • Jenkins

老牌流水线平台,做软件的大部分人应该都知道

部署方式:宿主机直接部署、容器化部署、K8S部署都可以

优点很多,社区强大、插件丰富等等。但是缺点页比较明显,只能单master部署,虽然可以通过slave扩展,但是一旦master挂掉,队列就失败了。

参考地址:https://www.jenkins.io/zh/

  • Jenkins X

Jenkins X是基于Kubernetes的持续集成、持续部署平台。也是Jenkins的子项目。Jenkins X旨在使程序员在研发过程中能够轻松遵循DevOps原理和最佳实践。

Jenkins X 基于松耦合架构的 DevOps 模型,被设计用来支持在多个团队间,部署大量可重复、可管理的分布式微服务。在Jenkins X的设计中,整合了Tekton,Helm,Draft,GitOps,以及Nexus,Chartmuseum,Monocular,Skaffold等诸多系统和工具,从而实现自动构建编译环境,生成容器镜像,流水线,自动化部署,并通过简单的Review实现不同环境间的自动发布

参考地址:https://www.jenkins.io/zh/projects/jenkins-x/

在这里插入图片描述

  • Tekton

Tekton 是一个基于 Kubernetes 的云原生 CI/CD 开源框架,属于 CD 基金会的项目之一。Tekton 通过定义 CRD 的方式,让用户以灵活的自定义流水线以满足自身 CI/CD 需求。

Tekton 引入了几个新的 CRD,包括 Task、Pipeline、TaskRun 和 PipelineRun

参考地址:https://tekton.dev/

  • ArgoCD

ArgoCD从名字就能看出它是一个CD工具,不具备CI能力。Argo CD 是一个为 Kubernetes 而生的,遵循声明式 GitOps 理念的持续部署(CD)工具。Argo CD 可在 Git 存储库更改时自动同步和部署应用程序。

Argo CD 是通过一个 Kubernetes 控制器来实现的,它持续 watch 正在运行的应用程序并将当前的实时状态与所需的目标状态( Git 存储库中指定的)进行比较。已经部署的应用程序的实际状态与目标状态有差异,则被认为是异常状态,Argo CD 会报告显示这些差异,同时提供工具来自动或手动将状态同步到期望的目标状态。在 Git 仓库中对期望目标状态所做的任何修改都可以自动应用反馈到指定的目标环境中去。

参考地址:https://argo-cd.readthedocs.io/en/stable/

在这里插入图片描述

关于他们的详细对比,知乎上有一篇文章:https://zhuanlan.zhihu.com/p/613527858 供大家参考,此处就不再赘述了。

代码检测

代码检测可以初步判断研发人员提交的代码是否符合相关规范,比如bug数、单元测试覆盖率等等,满足编码规范才能进入下一流程,如果连团队制定的编码规范都无法满足,则直接终止流水线继续进行。

常用的工具有sonarqube,因为他有社区版,免费。社区版缺点是某些语言不支持,需要自己找第三方的插件包。商业版的收费比较贵。
参考地址:https://www.sonarsource.com/

详细介绍文档:https://zhuanlan.zhihu.com/p/617789712

自动化测试

现在比较成熟的自动化测试一般是指API测试,前端的UI虽然也有自动化测试,但是没有特别成熟和方便的工具,这里推荐国内飞致云开发的开源持续测试平台MeterSphere。

MeterSphere 是一站式的开源持续测试平台,遵循 GPL v3 开源许可协议,涵盖测试管理、接口测试、UI 测试和性能测试等功能,全面兼容 JMeter、Selenium 等主流开源标准,有效助力开发和测试团队充分利用云弹性进行高度可扩展的自动化测试,加速高质量的软件交付。

在这里插入图片描述
参考地址:https://metersphere.io/

它虽然带有UI测试,但那是企业版功能,收费。metersphere带有jenkins插件,可以对接jenkins,完成流水线自动化测试。

开源地址:https://github.com/metersphere

结果通知

流水线的运行结果需要通过有效途径及时通知责任人,现在大众的办公软件都有基于webhook或者自开发应用的通知方式,比如飞书、钉钉、企业微信等,如果没有自开发应用机器人的经验,可以直接使用这些工具的群机器人,自带webhook,将流程相关人员集合到一个群里,不通的流程@不同的责任人即可。详情请参考各工具官方开发文档。
企业微信:https://open.work.weixin.qq.com/
钉钉:https://open.dingtalk.com/
飞书:https://open.feishu.cn/

版本管理

首选还是gitlab,功能齐全,方便实用。但是这个根据各公司具体规定执行,不做讨论。

sql版本管理

sql的版本管理是各难点,项目上经常会因为sql与代码关系的管理出现问题,最好是能有一个sql版本管理工具,比较推荐的是国外的一款开源工具Liquibase,这款工具支持多款数据库,大家有兴趣的可以去了解一下。
相关介绍:https://zhuanlan.zhihu.com/p/660238054
开源地址:https://github.com/liquibase/liquibase

多集群功能架构图示例

根据以上工具,大概绘制了一个多集群下的功能架构图
在这里插入图片描述
这里是在大业务量,预算充足或者对性能要求较高的情况下,做的一个规划,在预算不足的情况下,可以将一些集群功能合并,比如将构建集群放到开发或者测试集群里。

自动化的核心就是构建集群,CI/CD的所有功能都集中在这个集群上。这个集群的构建需要有以下几个关键点:

  1. 选定合适的CI/CD工具,这个是基座。之前写过一篇文章,介绍如何使用Jenkins对接K8S的,有兴趣的可以参考一下:https://blog.csdn.net/Mrheiiow/article/details/131421444
    其他CI/CD工具网上都有相关教程,我在后边也会慢慢整理相关部署过程。
  2. 各功能平台对接CI/CD工具。这个网上或者官方也有相应的教程,可以惨开,我们当时主要实践的是Jenkins,所以后期我也会整理一份各种工具对接Jenkins的流程文档
  3. 如果有条件,最好是基于部署好的这一套,开发一个前端控制界面,并做好权限划分,最主要的是针对流水线的的控制的,不是针对这些工具使用的,这样方便对整个发版流程进行控制,经验之谈。

在云原生领域,还有一个更受大家倾向的GitOps,他倡导IaC(Infrastructure as Code):基础设施即代码,我个人觉得他比传统的部署方式更方便,之前写过一篇博文:https://blog.csdn.net/Mrheiiow/article/details/130106620,有兴趣的可以看一下

相关文章:

云原生业务全流程DevOps配置预研与实践

背景 我在一个二线城市(山东济南),相对与北上广深杭这些IT业发达的城市来说,济南IT业对于业内新技术的接受度是有点慢的,国内很多一线大厂早先几年前就开始实践使用的技术,我们这边也是近两年才开始慢慢兴…...

SouthLeetCode-打卡24年01月第5周

SouthLeetCode-打卡24年01月第5周 // Date : 2024/01/39 ~ 2024/01/31 031.删除链表的倒数第 N 个结点 (1) 题目描述 031#LeetCode.19.#北岸计划2024/01/29 (2) 题解代码 Version1.0 class Solution {public ListNode removeNthFromEnd(ListNode head, int n) {if(head …...

【国产MCU】-CH32V307-通用DMA控制器及使用

通用DMA控制器及使用 文章目录 通用DMA控制器及使用1、通用DMA控制器介绍2、DMA驱动API介绍3、DMA使用实例直接存储器访问控制器(DMA)提供在外设和存储器之间或存储器和存储器之间的高速数据传输方式,无须CPU 干预,数据可以通过DMA 快速地移动,以节省CPU 的资源来做其他操…...

mysql8.0-cnf文件

一、my.cnf 文件 注意:根据自己环境进行参数的调整。 [client] port 3307 socket /data/mysql8.0.35/3307/tmp/mysql.sock[mysqldump] quick max_allowed_packet 64M[mysql] prompt"\u\h: \R:\m:\s [\d]> " no-auto-rehash[mysqld] ###### BASIC…...

MySQL进阶45讲【11】怎么更好地给字符串字段加索引?

1 前言 现在,几乎所有的系统都支持邮箱登录,如何在邮箱这样的字段上建立合理的索引,是我们今天要讨论的问题。 假设,现在维护一个支持邮箱登录的系统,用户表是这么定义的: mysql> create table SUser…...

​(三)hadoop之hive的搭建1

下载 访问官方网站https://hive.apache.org/ 点击downloads 点击Download a release now! 点击https://dlcdn.apache.org/hive/ 选择最新的稳定版 复制最新的url 在linux执行下载命令 wget https://dlcdn.apache.org/hive/hive-3.1.3/apache-hive-3.1.3-bin.tar.gz 2.解压…...

Spring事务传播机制

Spring事务传播机制 回顾简单介绍事务的传播机制有哪些Propagation.REQUIREDPropagation.SUPPORTSPropagation.MANDATORYPropagation.REQUIRES_NEWPropagation.NOT_SUPPORTEDPropagation.NEVERPropagation.NESTED 实例REQUIREDREQUIRES_NEWNEVERNESTEDREQUIRED和NESTED的区别 回…...

智能分析网关V4+EasyCVR视频融合平台——高速公路交通情况的实时监控和分析一体化方案

随着2024年春运帷幕的拉开,不少人的返乡之旅也即将开启,从这几日的新闻来看,高速上一路飘红。伴随恶劣天气,加上激增的车流,极易导致高速瘫痪,无法正常使用。为解决此问题,助力高速高效运营&…...

Vue3.0(一):Vue的引入-options api-模板语法

Vue的引入方式 CDN方式进行引入 将以下 script标签引入即可 <script src"https://unpkg.com/vue3/dist/vue.global.js"></script><!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><met…...

API网关-Apisix多节点搭建(RPM包方式)

文章目录 前言一、介绍1. 端口介绍2. APISIX节点介绍3. apisix单机安装配置教程(选看) 二、准备1. 配置集群免密登录2. 搭建etcd集群 三、安装apisix节点1. 复制脚本2. 增加执行权限3. 分发脚本4. 执行脚本5. 配置apisix的etcd集群地址 四、安装apisix-dashboard1. 复制脚本2. …...

HAL库配置片内FLASH读写

一、FLASH简介 不同型号的 STM32F40xx/41xx&#xff0c;其 FLASH 容量也有所不同&#xff0c;最小的只有 128K 字节&#xff0c;最大 的则达到了 1024K 字节。我们的探索者开发板选择的是 STM32F407ZGT6 的 FLASH 容量为 1024K 字节。 主存储器&#xff0c;存放代码和数据常数&…...

日志记录——单片机可执行文件合并

一&#xff1a;需求场景 现在有一片单片机&#xff0c;执行程序包括自定义boot和应用程序app, 在将打包好的固件给到生产是有以下问题&#xff0c;由于要通过jlink烧录boot&#xff0c;然后上电启动boot&#xff0c;通过boot烧录初始化程序&#xff0c;过程过于复杂&#xff0…...

2024数模美赛C题F题完整代码结果展示

C&#xff1a;Momentum in Tennis 实在精力有限&#xff0c;完整讲解可以移步去看我的讲解视频啦&#xff1a; 美赛C题每一问代码结果讲解及进度说明 F&#xff1a;Reducing lllegal Wildlife Trade 实在精力有限&#xff0c;完整讲解可以移步去看我的讲解视频啦&#xff1a; ​…...

H5调用安卓原生相机API案例

1、在activity_main.xml文件里添加webview标签 <WebViewandroid:id="@+id/webview"android:layout_width="match_parent"android:layout_height="match_parent"> </WebView> 2、AndroidManifest.xml(权限和活动声明) 开启访问…...

Java面试——计网篇

一、基础篇 1、 TCP/IP 网络模型 对于同一台设备上的进程间通信&#xff0c;有很多种方式&#xff0c;比如有管道、消息队列、共享内存、信号等方式&#xff0c;而对于不同设备上的进程间通信&#xff0c;就需要网络通信&#xff0c;而设备是多样性的&#xff0c;所以要兼容多…...

函数式接口当参数使用

如果函数式接口作为一个方法的参数&#xff0c;就以为着要方法调用方自己实现业务逻辑&#xff0c;常见的使用场景是一个业务整体逻辑是不相上下的&#xff0c;但是在某一个步骤有不同的逻辑&#xff0c;例如数据处理有不同的策略&#xff0c;如果有大量的if-els&#xff0c;或…...

全面详解Maven的配置文件settings.xml

全面详解Maven的配置文件settings.xml setting文件位置maven多仓库查找依赖的顺序大致如下&#xff1a;基本配置选项localRepository(本地仓库设置)mirrors(镜像设置)servers(服务器)Profiles(配置文件)Active Profiles(激活配置文件Profiles的Profile) Maven是一个用于构建和管…...

【Spring连载】使用Spring Data访问Redis(十四)----Redis Repositories

【Spring连载】使用Spring Data访问Redis&#xff08;十四&#xff09;----Redis Repositories 一、Core concepts二、Defining Repository Interfaces三、Creating Repository Instances四、Usage五、Object Mapping Fundamentals六、对象到Hash映射Object-to-Hash Mapping七、…...

小鹏汽车穿越“生死线”

文&#xff5c;刘俊宏编&#xff5c;王一粟 “颠覆与涅槃&#xff0c;颠覆自我与重新涅槃&#xff0c;让企业在变革中更完美的蜕变。” 2024新年伊始&#xff0c;小鹏汽车董事长兼CEO何小鹏对2023年的蜕变显然非常刻骨铭心。无论是在汽车新势力&#xff0c;还是放眼整个中国汽…...

AIPC专题:深耕笔电背光模组领域,AIPC与车载显示拉动公司成长

今天分享的是AIPC系列深度研究报告&#xff1a;《AIPC专题&#xff1a;深耕笔电背光模组领域&#xff0c;AIPC与车载显示拉动公司成长》。 &#xff08;报告出品方&#xff1a;东兴证券&#xff09; 报告共计&#xff1a;19页 公司深耕笔电背光模组&#xff0c;主要下游客户为…...

【HarmonyOS 5.0】DevEco Testing:鸿蒙应用质量保障的终极武器

——全方位测试解决方案与代码实战 一、工具定位与核心能力 DevEco Testing是HarmonyOS官方推出的​​一体化测试平台​​&#xff0c;覆盖应用全生命周期测试需求&#xff0c;主要提供五大核心能力&#xff1a; ​​测试类型​​​​检测目标​​​​关键指标​​功能体验基…...

关于nvm与node.js

1 安装nvm 安装过程中手动修改 nvm的安装路径&#xff0c; 以及修改 通过nvm安装node后正在使用的node的存放目录【这句话可能难以理解&#xff0c;但接着往下看你就了然了】 2 修改nvm中settings.txt文件配置 nvm安装成功后&#xff0c;通常在该文件中会出现以下配置&…...

MVC 数据库

MVC 数据库 引言 在软件开发领域,Model-View-Controller(MVC)是一种流行的软件架构模式,它将应用程序分为三个核心组件:模型(Model)、视图(View)和控制器(Controller)。这种模式有助于提高代码的可维护性和可扩展性。本文将深入探讨MVC架构与数据库之间的关系,以…...

【ROS】Nav2源码之nav2_behavior_tree-行为树节点列表

1、行为树节点分类 在 Nav2(Navigation2)的行为树框架中,行为树节点插件按照功能分为 Action(动作节点)、Condition(条件节点)、Control(控制节点) 和 Decorator(装饰节点) 四类。 1.1 动作节点 Action 执行具体的机器人操作或任务,直接与硬件、传感器或外部系统…...

MySQL中【正则表达式】用法

MySQL 中正则表达式通过 REGEXP 或 RLIKE 操作符实现&#xff08;两者等价&#xff09;&#xff0c;用于在 WHERE 子句中进行复杂的字符串模式匹配。以下是核心用法和示例&#xff1a; 一、基础语法 SELECT column_name FROM table_name WHERE column_name REGEXP pattern; …...

06 Deep learning神经网络编程基础 激活函数 --吴恩达

深度学习激活函数详解 一、核心作用 引入非线性:使神经网络可学习复杂模式控制输出范围:如Sigmoid将输出限制在(0,1)梯度传递:影响反向传播的稳定性二、常见类型及数学表达 Sigmoid σ ( x ) = 1 1 +...

Netty从入门到进阶(二)

二、Netty入门 1. 概述 1.1 Netty是什么 Netty is an asynchronous event-driven network application framework for rapid development of maintainable high performance protocol servers & clients. Netty是一个异步的、基于事件驱动的网络应用框架&#xff0c;用于…...

三分算法与DeepSeek辅助证明是单峰函数

前置 单峰函数有唯一的最大值&#xff0c;最大值左侧的数值严格单调递增&#xff0c;最大值右侧的数值严格单调递减。 单谷函数有唯一的最小值&#xff0c;最小值左侧的数值严格单调递减&#xff0c;最小值右侧的数值严格单调递增。 三分的本质 三分和二分一样都是通过不断缩…...

GO协程(Goroutine)问题总结

在使用Go语言来编写代码时&#xff0c;遇到的一些问题总结一下 [参考文档]&#xff1a;https://www.topgoer.com/%E5%B9%B6%E5%8F%91%E7%BC%96%E7%A8%8B/goroutine.html 1. main()函数默认的Goroutine 场景再现&#xff1a; 今天在看到这个教程的时候&#xff0c;在自己的电…...

打手机检测算法AI智能分析网关V4守护公共/工业/医疗等多场景安全应用

一、方案背景​ 在现代生产与生活场景中&#xff0c;如工厂高危作业区、医院手术室、公共场景等&#xff0c;人员违规打手机的行为潜藏着巨大风险。传统依靠人工巡查的监管方式&#xff0c;存在效率低、覆盖面不足、判断主观性强等问题&#xff0c;难以满足对人员打手机行为精…...