大数据-之LibrA数据库系统告警处理(ALM-25005 Nscd服务异常)
告警解释
系统每60秒周期性检测nscd服务的状态,如果连续4次(3分钟)查询不到nscd进程或者无法获取ldapserver中的用户时,产生该告警。
当进程恢复且可以获取ldapserver中的用户时,告警恢复。
告警属性
| 告警ID | 告警级别 | 可自动清除 |
|---|---|---|
| 25005 | 严重 | 是 |
告警参数
| 参数名称 | 参数含义 |
|---|---|
| ServiceName | 产生告警的服务名称。 |
| HostName | 产生告警的主机节点信息。 |
对系统的影响
nscd服务不可用时,可能会影响该节点从LdapServer上同步数据,此时,使用id命令可能会获取不到ldap中的数据,影响上层业务。
可能原因
- nscd服务未启动。
- 网络故障,无法访问ldap服务器。
- Name Service服务异常。
- OS执行命令慢导致无法查询用户。
处理步骤
检查nscd服务是否启动。
- 在FusionInsight Manager界面,单击“告警管理”。记录该告警定位信息中的“HostName”的IP地址为IP1(若出现多个告警,则分别记录其中的IP地址为IP1、IP2、IP3等)。
- 联系运维人员,使用PuTTY工具登录IP1节点,在该节点上执行命令ps -ef | grep nscd,查看是否有/usr/sbin/nscd进程启动。
- 是,执行步骤 5。
- 否,执行步骤 3。
- 以root用户执行service nscd restart命令,重启nscd服务,执行ps -ef | grep nscd,查看服务是否启动。
- 是,执行步骤 4。
- 否,执行步骤 15。
- 5分钟后,以root用户再次执行ps -ef | grep nscd命令,查看服务是否存在。
- 是,执行步骤 11。
- 否,执行步骤 15。
检查网络是否故障,无法访问ldap服务器。
检查Name Service服务是否异常。
- 用root用户登录故障节点,执行命令cat /etc/nsswitch.conf,查看NameService配置中的“passwd”、“group”、“services”、“netgroup”、“aliases”五项配置是否正确。
正确配置请参照: “passwd: compat ldap”、“group: compat ldap”、“services: files ldap”、“netgroup: files ldap”、“aliases: files ldap”
- 是,执行步骤 7。
- 否,执行。步骤 9
- 用root用户登录故障节点,执行命令cat /etc/nscd.conf,查看配置文件中“enable-cache passwd”、“positive-time-to-live passwd”、“enable-cache group”、“positive-time-to-live group”四项配置是否正确。
正确配置请参照: “enable-cache passwd yes ”、“positive-time-to-live passwd yes”、“enable-cache group yes”、“positive-time-to-live group yes”
- 是,执行步骤 8。
- 否,执行步骤 10。
- 用root用户执行/usr/sbin/nscd -i group和/usr/sbin/nscd -i passwd命令,等待2分钟,执行id admin和id backup/manager命令,查看是否能查询到结果。
- 是,执行步骤 11。
- 否,执行步骤 15。
- 以root用户执行vi /etc/nsswitch.conf命令,将步骤 6中的五项配置项改成正确配置,保存后执行service nscd restart命令重启nscd服务,等待2分钟,执行id admin和id backup/manager命令,查看是否能查询到结果。
- 是,执行步骤 11。
- 否,执行步骤 15。
- 以root用户执行vi /etc/nscd.conf命令,将步骤 7中的四项配置项改成正确配置,保存后执行service nscd restart命令重启nscd服务,等待2分钟,执行id admin和id backup/manager命令,查看是否能查询到结果。
- 是,执行。步骤 11
- 否,执行步骤 15。
- 登录FusionInsight Manager界面,等待5分钟,然后查看“ALM-25005 Nscd服务异常”告警是否恢复。
- 是,处理完毕。
- 否,执行步骤 12。
检查操作系统执行命令是否卡顿。
- 用root用户登录故障节点,执行命令id admin,观察命令返回结果时长,观察执行命令是否缓慢(超过3s即可认为执行命令慢)。
是,执行步骤 13。
否,执行步骤 15。
- 执行命令cat /var/log/messages,查看nscd是否频繁重启或者存在Can't contact LDAP server的异常信息。
nscd异常信息样例
是,执行步骤 14。
否,执行步骤 15。
- 执行命令vi$BIGDATA_HOME/tmp/random_ldap_ip_order,修改末尾数字,若原本为奇数则改为偶数,若原本为偶数则修改为奇数;
执行命令vi/etc/ldap.conf,将URI配置项的前两个IP进行颠倒,保存退出。
执行命令service nscd restart,重启nscd服务,等待5分钟,再次执行id admin命令,观察返回结果时长,观察执行命令是否缓慢。
是,执行步骤 15。
否,登录其他故障节点执行步骤 12至步骤 14;收集日志,并排查“/etc/ldap.conf”修改前URI中第一个ldapserver节点,是否故障,
例如业务IP不可达、网络延时过长或者部署其他异常的软件。
收集故障信息。
相关文章:
大数据-之LibrA数据库系统告警处理(ALM-25005 Nscd服务异常)
告警解释 系统每60秒周期性检测nscd服务的状态,如果连续4次(3分钟)查询不到nscd进程或者无法获取ldapserver中的用户时,产生该告警。 当进程恢复且可以获取ldapserver中的用户时,告警恢复。 告警属性 告警ID 告警级…...
NLP:使用 SciKit Learn 的文本矢量化方法
一、说明 本文是使用所有 SciKit Learns 预处理方法生成文本数字表示的深入解释和教程。对于以下每个矢量化器,将给出一个简短的定义和实际示例:one-hot、count、dict、TfIdf 和哈希矢量化器。 SciKit Learn 是一个用于机器学习项目的广泛库,…...
这些仪表板常用的数据分析模型,你都见过吗?
本文由葡萄城技术团队发布。转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具、解决方案和服务,赋能开发者。 ##前言 在数字化时代,数据已经成为了企业决策和管理的重要依据。而仪表板作为一种数据可视化工具&#x…...
【Proteus仿真】【Arduino单片机】多功能数字时钟设计
文章目录 一、功能简介二、软件设计三、实验现象联系作者 一、功能简介 本项目使用Proteus8仿真Arduino单片机控制器,使用PCF8574、LCD1602液晶、DS1302温度传感器、DS1302时钟、按键、蜂鸣器等。 主要功能: 系统运行后,LCD1602显示当前日期…...
c语言回文数
以下是用C语言编写的回文数代码: #include <stdio.h>int main() { int num, reversedNum 0, remainder, originalNum; printf("请输入一个正整数:"); scanf("%d", &num); originalNum num; while (num …...
【学习记录】从0开始的Linux学习之旅——编译linux内核
一、学习背景 从接触嵌入式至今,除了安装过双系统接触了一丢丢linux外,linux在我眼中向来是个传说。而如今得到了一块树莓派,于是决心把linux搞起来。 二、概念学习 Linux操作系统通常是基于Linux内核,并结合GNU项目中的工具和应…...
uni-app - 日期 · 时间选择器
目录 1.基本介绍 2.案例介绍 ①注意事项: ②效果展示 3.代码展示 ①view部分 ②js部分 ③css样式 1.基本介绍 从底部弹起的滚动选择器。支持五种选择器,通过mode来区分,分别是普通选择器,多列选择器,时间选择器&a…...
使用USB转JTAG芯片CH347在Vivado下调试
简介 高速USB转接芯片CH347是一款集成480Mbps高速USB接口、JTAG接口、SPI接口、I2C接口、异步UART串口、GPIO接口等多种硬件接口的转换芯片。 通过XVC协议,将CH347应用于Vivado下,简单尝试可以成功,源码如下,希望可以一起共建&a…...
硬技能之上的软技巧(三)
在硬技能的基础上,如何运用软技巧来进一步提升个人能力和职业发展。在之前的讨论中,我们提到了硬技能和软技巧的基本概念,以及如何运用软技巧来提升个人能力和职业发展。本篇文章将进一步探讨软技巧中的一些重要方面,包括自我管理…...
mysql 查询
-- 多表查询select * from tb_dept,tb_emp; 内来链接 -- 内连接 -- A 查询员工的姓名 , 及所属的部门名称 (隐式内连接实现)select tb_emp.name,tb_dept.name from tb_emp,tb_dept where tb_emp.idtb_emp.id;-- 推荐使用select a.name,b.n…...
2311rust过程宏的示例
原文 Rust2018中的过程宏 在Rust2018版本中,我最喜欢的功能是过程宏.在Rust中,过程宏有着悠久而传奇的历史(并继续拥有传奇的未来!) 因为2018年版极大改善了定义和使用它们的体验. 什么是过程宏 过程宏是,在编译时用一段语法,生成新语法的函数.Rust2018中的过程宏有三个风格…...
数据分析:数据预处理流程及方法
数据预处理是数据分析过程中至关重要的一步,它涉及到清洗、转换和整理原始数据,以便更好地适应分析模型或算法。以下是一些常见的数据预处理方法和规则: 数据清洗: 处理缺失值:检测并处理数据中的缺失值,可…...
uniapp 防抖节流封装和使用
防抖(debounce):定义一个时间,延迟n秒执行,n秒内再次调用,会重新计时,计时结束后才会再次执行 主要运用场景: 输入框实时搜索:在用户输入内容的过程中,使用防抖可以减少频繁的查询…...
springcloud alibaba学习视频
阿里云登录 - 欢迎登录阿里云,安全稳定的云计算服务平台...
【MySQL】一些内置函数(时间函数、字符串函数、数学函数等,学会了有妙用)
内置函数 前言正式开始时间函数显示当前日期、时间、日期时间的日期计算相差多少天示例创建一张表,记录生日 留言表 字符串函数charsetconcatinstr(string, substring)ucase和lcaseleft(string, length)length求字符串长度replace(str, search_str, replace_str)tri…...
QtC++与QColumnView详解
介绍 在 Qt 中,QColumnView 是用于显示多列数据的控件,它提供了一种多列列表视图的方式,类似于文件资源管理器中的详细视图。QColumnView 是基于模型/视图架构的,通常与 QFileSystemModel 或自定义模型一起使用。 以下是关于 QC…...
微信小程序配置企业微信的在线客服
配置企业微信后台 代码实现 <button tap"openCustomerServiceChat">打开企业微信客服</button>methods: {openCustomerServiceChat(){wx.openCustomerServiceChat({extInfo: {url: 你刚才的客服地址},corpId: 企业微信的id,showMessageCard: true,});} …...
深入理解Java AQS:从原理到源码分析
目录 AQS的设计原理1、队列节点 Node 和 FIFO队列结构2、state 的作用3、公平锁与非公平锁 AQS 源码解析1、Node节点2、acquire(int)3、release(int)4、自旋(Spin)5、公平性与 FIFO 基于AQS实现的几种同步器1、ReentrantLock:可重入独占锁2、…...
【数据结构(四)】栈(1)
文章目录 1. 关于栈的一个实际应用2. 栈的介绍3. 栈的应用场景4. 栈的简单应用4.1. 思路分析4.2. 代码实现 5. 栈的进阶应用(实现综合计算器)5.1. 栈实现一位数计算(中缀表达式)5.1.1. 思路分析5.1.2. 代码实现 5.2. 栈实现多位数计算(中缀表达式)5.2.1. 解决思路5.2.2. 代码实…...
实验(四):指令部件实验
一、实验内容与目的 实验要求: 利用CP226实验仪上的小键盘将程序输入主存储器EM,通过指令的执行实现微程序控制器的程序控制。 实验目的: 1.掌握模型机的操作码测试过程; 2.掌握模型机微程序控制器的基本结构以及程序控制的基本原…...
告别里程焦虑!用Python+OR-Tools实战电动汽车配送路径规划(附完整代码)
告别里程焦虑!用PythonOR-Tools实战电动汽车配送路径规划(附完整代码) 当城市物流车队从燃油车转向电动车时,算法工程师的笔记本上总会多出几个头疼的问题:充电站该怎么选?电量消耗怎么预估?如何…...
Taotoken模型广场如何帮助开发者快速进行模型选型与对比
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Taotoken模型广场如何帮助开发者快速进行模型选型与对比 面对市场上众多的大语言模型,开发者常常需要花费大量时间调研…...
告别默认标题栏!手把手教你用Tauri 2.0打造高颜值自定义窗口(附完整CSS与Rust代码)
告别默认标题栏!手把手教你用Tauri 2.0打造高颜值自定义窗口(附完整CSS与Rust代码) 在桌面应用开发中,默认的系统标题栏往往成为视觉体验的"短板"。它们不仅风格陈旧,还破坏了应用设计的整体性。想象一下&a…...
基于Go的轻量级心跳监控服务:moltbook-heartbeat架构与实践
1. 项目概述:一个轻量级的心跳检测服务最近在搞一个分布式系统的监控,发现服务实例的健康状态管理是个挺头疼的事儿。手动去查日志、看进程,效率低不说,还容易漏掉关键节点。后来在GitHub上翻到了terryso/moltbook-heartbeat这个项…...
在个人服务器部署私有AI助手:基于Llama与Ollama的本地大模型实践
1. 项目概述:当开源大模型遇上个人服务器最近在折腾个人服务器的时候,发现了一个非常有意思的项目,叫getumbrel/llama-gpt。简单来说,它就是一个让你能在自己的硬件上,比如树莓派、NAS或者一台闲置的旧电脑,…...
Genshin FPS Unlock:原神帧率解锁终极指南 - 突破60FPS限制的完整解决方案
Genshin FPS Unlock:原神帧率解锁终极指南 - 突破60FPS限制的完整解决方案 【免费下载链接】genshin-fps-unlock unlocks the 60 fps cap 项目地址: https://gitcode.com/gh_mirrors/ge/genshin-fps-unlock Genshin FPS Unlock 是一个开源工具,专…...
专为软件团队打造的数据可视化开发工具|Highcharts图表
在当今软件行业,数据不仅是资产,更是产品价值的重要组成部分。Highcharts 为软件企业提供 高性能、交互丰富、可嵌入的专业图表解决方案,帮助开发者和产品团队把复杂数据直观呈现给用户。为什么选择 Highcharts?Highcharts 已经积…...
3秒获取百度网盘提取码:baidupankey智能工具终极使用指南
3秒获取百度网盘提取码:baidupankey智能工具终极使用指南 【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 还在为百度网盘提取码而烦恼吗?baidupankey作为一款专业的百度网盘提取码智能获取工具…...
智能体多模型升级调度:成本感知与审查门控的工程实践
1. 项目概述:一种面向智能体工作流的成本感知多模型调度技能在构建和运营基于大语言模型的智能体系统时,我们常常面临一个经典困境:如何在效果、成本和可控性之间找到最佳平衡点。直接调用最强大的模型(如GPT-4、Claude-3 Opus&am…...
【EAI(企业应用集成)工具】Asteria warp簡単紹介(アステリア ワープ)
目录 ■前言 ■Asteria warp簡単紹介 ■ASTERIA Warpとは ■ASTERIA Warp 命名哲学 ■ASTERIA WARPについて ■19年連続国内シェアNo.1 ■10,000社以上の企業での導入実績 ■ノーコードだから誰でも使える ■市场地位:日本市场的绝对王者 ■核心产品力&am…...
