Kubernetes集群监控,kube-prometheus安装教程,一键部署
Kube-prometheus介绍
Kube-prometheus 是一个用于监控 Kubernetes 集群的完整解决方案。它基于 Prometheus 生态系统,提供了一整套预配置的组件和配置文件,以便轻松地在 Kubernetes 上部署和运行 Prometheus 监控系统。
Kube-prometheus 主要包括以下组件:
Prometheus Operator:简化了 Prometheus 的部署和管理。它通过 Kubernetes CRD(自定义资源定义)来管理 Prometheus 实例和 Alertmanager 实例。
Prometheus:一个开源的系统监控和报警工具。它通过拉取方式收集时序数据,并提供一个灵活的查询语言(PromQL)来分析数据。
Alertmanager:处理来自 Prometheus 的警报,可以对警报进行分组、路由和通知。
Grafana:一个开源的分析平台,用于可视化数据,支持多种数据源。它可以用来创建和分享仪表板(Dashboards)。
Node Exporter:一个收集主机硬件和操作系统指标的工具。
Kube-state-metrics:从 Kubernetes API 服务器收集集群状态数据的工具。
Prometheus Adapter:将 Prometheus 的自定义指标暴露给 Kubernetes 的 Horizontal Pod Autoscaler (HPA) 使用。
Kube-prometheus 的主要特点和优势包括:
- 预配置:提供了一整套预先配置好的 Prometheus、Alertmanager 和 Grafana 的配置文件,开箱即用。
- 集成性强:所有组件都紧密集成,可以方便地一起使用。
- 可扩展性:基于 Kubernetes 的部署方式,使得监控系统能够方便地扩展和升级。
- 社区支持:作为一个被广泛使用的项目,有着良好的社区支持和文档。
要使用 Kube-prometheus,通常通过 Helm Chart 或者直接使用项目中的 Kubernetes 清单文件来部署。部署完成后,你可以访问 Grafana 来查看集群的监控指标和预定义的仪表板,同时通过 Prometheus 和 Alertmanager 来管理和处理监控数据和警报。
Kube-prometheus安装部署
拉取镜像
git clone https://mirror.ghproxy.com/https://github.com/prometheus-operator/kube-prometheus.git
将目录更改为清单 manifests
cd kube-prometheus/manifests
修改Grafana服务YAML
修改为NodePort类型,集群外可以访问
sed -i "/ports:/i \ \ type: NodePort" grafana-service.yaml
#下面这个也可以不执行,自动生成随机的端口
sed -i "/targetPort: http/i \ \ \ \ nodePort: 31100" grafana-service.yaml
修改Prometheus服务YAML
修改为NodePort类型,集群外可以访问
sed -i "/ports:/i \ \ type: NodePort" prometheus-service.yaml
#下面这个也可以不执行,自动生成随机的端口
sed -i "/targetPort: web/i \ \ \ \ nodePort: 31101" prometheus-service.yaml
安装CRD
kubectl create -f setup/
安装prometheus, alertmanager, grafana, kube-state-metrics, node-exporter等资源
kubectl apply -f .
安装成功,查看pod,svc
kubectl get pod,svc -n monitoring -o wide
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES
pod/alertmanager-main-0 2/2 Running 6 (18m ago) 4d16h 10.244.1.183 slave1 <none> <none>
pod/alertmanager-main-1 2/2 Running 6 (18m ago) 4d16h 10.244.1.176 slave1 <none> <none>
pod/alertmanager-main-2 2/2 Running 6 (18m ago) 4d16h 10.244.1.173 slave1 <none> <none>
pod/blackbox-exporter-6fc96d64db-687gh 3/3 Running 9 (18m ago) 4d17h 10.244.1.165 slave1 <none> <none>
pod/grafana-85c87f8769-xqlq5 1/1 Running 3 (18m ago) 4d17h 10.244.1.166 slave1 <none> <none>
pod/kube-state-metrics-6d79c8794-tpbtr 3/3 Running 9 (18m ago) 4d17h 10.244.1.164 slave1 <none> <none>
pod/node-exporter-2dz4d 2/2 Running 14 (18m ago) 7d19h 192.168.10.22 slave1 <none> <none>
pod/node-exporter-rqplj 2/2 Running 10 (18m ago) 7d19h 192.168.10.21 main <none> <none>
pod/prometheus-adapter-9f76d56cc-47qgh 1/1 Running 5 (18m ago) 4d17h 10.244.1.170 slave1 <none> <none>
pod/prometheus-adapter-9f76d56cc-zt64q 1/1 Running 5 (18m ago) 4d17h 10.244.1.179 slave1 <none> <none>
pod/prometheus-k8s-0 2/2 Running 7 (18m ago) 4d16h 10.244.1.175 slave1 <none> <none>
pod/prometheus-k8s-1 2/2 Running 7 (18m ago) 4d16h 10.244.1.181 slave1 <none> <none>
pod/prometheus-operator-84978f59d-jf5cn 2/2 Running 6 (18m ago) 4d17h 10.244.1.169 slave1 <none> <none>NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE SELECTOR
service/alertmanager-main ClusterIP 10.100.61.145 <none> 9093/TCP,8080/TCP 7d19h app.kubernetes.io/component=alert-router,app.kubernetes.io/instance=main,app.kubernetes.io/name=alertmanager,app.kubernetes.io/part-of=kube-prometheus
service/alertmanager-operated ClusterIP None <none> 9093/TCP,9094/TCP,9094/UDP 7d19h app.kubernetes.io/name=alertmanager
service/blackbox-exporter ClusterIP 10.107.213.75 <none> 9115/TCP,19115/TCP 7d19h app.kubernetes.io/component=exporter,app.kubernetes.io/name=blackbox-exporter,app.kubernetes.io/part-of=kube-prometheus
service/grafana NodePort 10.102.185.87 <none> 3000:31100/TCP 7d19h app.kubernetes.io/component=grafana,app.kubernetes.io/name=grafana,app.kubernetes.io/part-of=kube-prometheus
service/kube-state-metrics ClusterIP None <none> 8443/TCP,9443/TCP 7d19h app.kubernetes.io/component=exporter,app.kubernetes.io/name=kube-state-metrics,app.kubernetes.io/part-of=kube-prometheus
service/node-exporter ClusterIP None <none> 9100/TCP 7d19h app.kubernetes.io/component=exporter,app.kubernetes.io/name=node-exporter,app.kubernetes.io/part-of=kube-prometheus
service/prometheus-adapter ClusterIP 10.101.25.109 <none> 443/TCP 7d19h app.kubernetes.io/component=metrics-adapter,app.kubernetes.io/name=prometheus-adapter,app.kubernetes.io/part-of=kube-prometheus
service/prometheus-k8s NodePort 10.107.214.35 <none> 9090:31101/TCP,8080:30323/TCP 7d19h app.kubernetes.io/component=prometheus,app.kubernetes.io/instance=k8s,app.kubernetes.io/name=prometheus,app.kubernetes.io/part-of=kube-prometheus
service/prometheus-operated ClusterIP None <none> 9090/TCP 4d18h app.kubernetes.io/name=prometheus
service/prometheus-operator ClusterIP None <none> 8443/TCP 7d19h app.kubernetes.io/component=controller,app.kubernetes.io/name=prometheus-operator,app.kubernetes.io/part-of=kube-prometheus
访问
prometheus-k8s在slave1上面,用slave1的ip加prometheus-k8s的端口http://192.168.10.21:31101/访问
grafana也在slave1上面,用slave1的ip加grafana的端口http://192.168.10.21:31100/访问 ,默认账户密码:admin:admin
一键部署shell脚本
#!/bin/bash# Clone the repository
git clone https://mirror.ghproxy.com/https://github.com/prometheus-operator/kube-prometheus.git# Change directory to manifests
cd kube-prometheus/manifests# Prompt the user to enter Grafana NodePort
echo "Enter the Grafana NodePort (default is 31100):"
read grafana_nodeport
grafana_nodeport=${grafana_nodeport:-31100} # Default to 31100 if user doesn't provide any input# Modify Grafana service YAML
sed -i "/ports:/i \ \ type: NodePort" grafana-service.yaml
sed -i "/targetPort: http/i \ \ \ \ nodePort: $grafana_nodeport" grafana-service.yaml# Prompt the user to enter Prometheus NodePort
echo "Enter the Prometheus NodePort (default is 31101):"
read prometheus_nodeport
prometheus_nodeport=${prometheus_nodeport:-31101} # Default to 31101 if user doesn't provide any input# Modify Prometheus service YAML
sed -i "/ports:/i \ \ type: NodePort" prometheus-service.yaml
sed -i "/targetPort: web/i \ \ \ \ nodePort: $prometheus_nodeport" prometheus-service.yamlkubectl create -f setup/kubectl wait \--for condition=Established \--all CustomResourceDefinition \--namespace=monitoring# Apply the Kubernetes manifests
kubectl apply -f .相关文章:
Kubernetes集群监控,kube-prometheus安装教程,一键部署
Kube-prometheus介绍 Kube-prometheus 是一个用于监控 Kubernetes 集群的完整解决方案。它基于 Prometheus 生态系统,提供了一整套预配置的组件和配置文件,以便轻松地在 Kubernetes 上部署和运行 Prometheus 监控系统。 Kube-prometheus 主要包括以下组…...
【Gradio】快速入门
https://www.gradio.app/ Gradio 是一个开源 Python 软件包https://github.com/gradio-app/gradio ,可以让你快速为机器学习模型、API 或任何任意 Python 函数创建一个演示或网络应用程序。然后,您就可以使用 Gradio 内置的分享功能,在几秒钟…...
深度学习Day-19:DenseNet算法实战与解析
🍨 本文为:[🔗365天深度学习训练营] 中的学习记录博客 🍖 原作者:[K同学啊 | 接辅导、项目定制] 要求: 根据 Pytorch 代码,编写出 TensorFlow 代码研究 DenseNet 与 ResNetV 的区别改进思路是…...
基于openssl实现AES ECB加解密
AES加密,全称高级加密标准(Advanced Encryption Standard),是一种广泛使用的对称加密算法,用于保护电子数据的安全。以下是AES加密的基本原理和特点: 基本概念 对称加密:AES是一种对称加密算法…...
Git:从配置到合并冲突
目录 1.前言 2.Git的下载与初始化配置 3.Git中新建仓库 4.Git的工作区域和文件状态 5.Git中查看操作和提交记录 6.Git中添加和提交文件 7.Git中回退提交版本 8.Git中查看版本间的差异 9.Git中删除文件 10.Git中忽略指定文件 11.Git中配置SSH密钥 12.Git中关联克隆仓库 13.Git中…...
leetcode hot100 之 最长公共子序列
题目 给定两个字符串 text1 和 text2,返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 ,返回 0 。 一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(…...
短剧APP开发,新的“财富”
在数字化时代,开发短剧APP不仅是顺应潮流的必然选择,更是抓住市场机遇的关键所在。为确保短剧APP能有效地吸引并留住用户,以下是一些主要功能及其介绍: 1、短剧搜索 关键词搜索:用户可以通过输入关键词(如…...
Uniapp与第三方应用数据通讯
首先说明一点,这个只是uniapp代码编写的应用之间相互传递数据,uniapp编写的与其他语言编写的我尚不知道能不能传递。 应用1: plus.runtime.launchApplication({pname: "应用的appid",// extra 中可以自定数据,url和da…...
AI大模型战场:通用大模型与垂直大模型的角逐
随着人工智能技术的迅猛发展,AI大模型已成为推动科技进步的重要力量。然而,在AI大模型的战场上,通用大模型与垂直大模型之间的分化日益明显。两者各有其独特的优势和潜力,在不同的应用场景中发挥着重要作用。那么,在这…...
linux的一些知识点分享-------关于操作维护的一些知识点
Apache服务器的监听端口,默认为() Apache服务器的监听端口,默认为80。 vsftpd中,可以不需提供账号密码就能进行访问的用户是( ) 在vsftpd(Very Secure FTP Daemon)中,可以不需要提供账号密码就能进行访问的用户通常是匿名用户。…...
Python使用tkinter库设置背景图片、label显示位置和label设置显示图片
tkinter 设置背景图片 label显示位置 label设置显示图片 from tkinter import * import tkinter as tk from PIL import ImageTk from PIL import Imagedef get_img(filename, width, height):im Image.open(filename).resize((width, height))im ImageTk.PhotoImage(im)…...
OpenStack是什么?
OpenStack是一个开源的云计算管理平台项目,它是一系列软件开源项目的组合。该项目由美国国家航空航天局(NASA)和Rackspace合作研发并发起,旨在提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台。OpenStack不仅是一个软…...
2024下《系统规划与管理师》50个高频考点汇总!背就有效
2024上半年软考考试已经结束,有不少小伙伴已经开始准备下半年软考了,但是大家要注意:今年高项仅考上半年一次,下半年考的高级科目只有系规难度相对较低,系规需要学习的内容比高项少很多,高项第四版教程731页…...
软件游戏提示msvcp140.dll丢失的原因分析及解决方法
在计算机使用过程中,我们经常会遇到一些错误提示,其中之一就是“计算机缺失msvcp140.dll”。那么,这个错误是什么意思呢?它会造成哪些问题?小编将从以下几个方面进行详细解析。 一,了解msvcp140.dll是什么 …...
备战 清华大学 上机编程考试-冲刺前50%,倒数第3天
T1:水滴 - 模拟 这是一个经典的游戏。 在一个 𝑛𝑚 的棋盘上,每一个格子中都有一些水滴。 玩家的操作是,在一个格子中加一滴水。 当一个格子中的水滴数超过了 4,这一大滴水就会因格子承载不住而向外扩散。扩散的规…...
docker的安装及docker常用命令
目录 环境介绍docker卸载docker安装docker镜像命令查看docker可用的镜像查看docker可安装的镜像安装镜像删除镜像 docker容器命令查看容器启动容器启动示例进入容器内部停止容器删除容器容器和主机之间的文件复制 docker网络命令创建docker网络查看docker网络删除docker网络 do…...
Dell服务器根据GPU温度调整风扇转速
前言 dell服务器自动风扇是根据CPU温度来调速的,我跑AI的时候cpu温度不高但是GPU温度很高导致显卡卡死PVE虚拟机直接挂起无法运行,我看了下也没有基于显卡温度调速的脚本,于是我就自己写了一个 基于ipmi工具 乌班图等linux先安装ipmi apt …...
快捷键专栏 IDEA、Navicat、电脑、Excle、Word等
标题 电脑篇windowsR 配合以下常用命令连上公司网线WiFi速度变慢问题解决Windows10 设置鼠标右键在此处打开cmd和Powershell窗口、关机打开电脑诊断工具系统设置常用设置查看电脑出场日期 systeminfo删除文件显示已在另一个程序打开?找回回收站删除的文件WindowsR输…...
卸载MySQL5.0,安装MySQL8.0
卸载MySQL 1、以管理员身份运行cmd,删除MySQL服务 2、卸载MySQL 3、删除残余文件 4、清楚注册表 winR -> regedit 5、删除环境变量 安装MySQL步骤 官方下载地址 https://www.mysql.com/downloads/ 以上步骤即完成MySQL数据库安装。...
苹果WWDC重磅发布的IOS 18、Apple Intelligence背后的技术分析!
2024年6月10日,在2024年WWDC全球开发者大会上,苹果推出了Apple Intelligence,这是深度集成到iOS 18、iPadOS 18和macOS Sequoia中的个人智能系统。 为了让大模型能在 iPhone 端侧跑,苹果还是做了很多事情的。接下来就跟大家介绍一…...
零门槛NAS搭建:WinNAS如何让普通电脑秒变私有云?
一、核心优势:专为Windows用户设计的极简NAS WinNAS由深圳耘想存储科技开发,是一款收费低廉但功能全面的Windows NAS工具,主打“无学习成本部署” 。与其他NAS软件相比,其优势在于: 无需硬件改造:将任意W…...
Unity3D中Gfx.WaitForPresent优化方案
前言 在Unity中,Gfx.WaitForPresent占用CPU过高通常表示主线程在等待GPU完成渲染(即CPU被阻塞),这表明存在GPU瓶颈或垂直同步/帧率设置问题。以下是系统的优化方案: 对惹,这里有一个游戏开发交流小组&…...
生成 Git SSH 证书
🔑 1. 生成 SSH 密钥对 在终端(Windows 使用 Git Bash,Mac/Linux 使用 Terminal)执行命令: ssh-keygen -t rsa -b 4096 -C "your_emailexample.com" 参数说明: -t rsa&#x…...
【python异步多线程】异步多线程爬虫代码示例
claude生成的python多线程、异步代码示例,模拟20个网页的爬取,每个网页假设要0.5-2秒完成。 代码 Python多线程爬虫教程 核心概念 多线程:允许程序同时执行多个任务,提高IO密集型任务(如网络请求)的效率…...
分布式增量爬虫实现方案
之前我们在讨论的是分布式爬虫如何实现增量爬取。增量爬虫的目标是只爬取新产生或发生变化的页面,避免重复抓取,以节省资源和时间。 在分布式环境下,增量爬虫的实现需要考虑多个爬虫节点之间的协调和去重。 另一种思路:将增量判…...
在Mathematica中实现Newton-Raphson迭代的收敛时间算法(一般三次多项式)
考察一般的三次多项式,以r为参数: p[z_, r_] : z^3 (r - 1) z - r; roots[r_] : z /. Solve[p[z, r] 0, z]; 此多项式的根为: 尽管看起来这个多项式是特殊的,其实一般的三次多项式都是可以通过线性变换化为这个形式…...
通过 Ansible 在 Windows 2022 上安装 IIS Web 服务器
拓扑结构 这是一个用于通过 Ansible 部署 IIS Web 服务器的实验室拓扑。 前提条件: 在被管理的节点上安装WinRm 准备一张自签名的证书 开放防火墙入站tcp 5985 5986端口 准备自签名证书 PS C:\Users\azureuser> $cert New-SelfSignedCertificate -DnsName &…...
在树莓派上添加音频输入设备的几种方法
在树莓派上添加音频输入设备可以通过以下步骤完成,具体方法取决于设备类型(如USB麦克风、3.5mm接口麦克风或HDMI音频输入)。以下是详细指南: 1. 连接音频输入设备 USB麦克风/声卡:直接插入树莓派的USB接口。3.5mm麦克…...
基于鸿蒙(HarmonyOS5)的打车小程序
1. 开发环境准备 安装DevEco Studio (鸿蒙官方IDE)配置HarmonyOS SDK申请开发者账号和必要的API密钥 2. 项目结构设计 ├── entry │ ├── src │ │ ├── main │ │ │ ├── ets │ │ │ │ ├── pages │ │ │ │ │ ├── H…...
6️⃣Go 语言中的哈希、加密与序列化:通往区块链世界的钥匙
Go 语言中的哈希、加密与序列化:通往区块链世界的钥匙 一、前言:离区块链还有多远? 区块链听起来可能遥不可及,似乎是只有密码学专家和资深工程师才能涉足的领域。但事实上,构建一个区块链的核心并不复杂,尤其当你已经掌握了一门系统编程语言,比如 Go。 要真正理解区…...
