NodeTextFileCollectorScrapeError 报警原因及解决方法
现象
prometheus 经常有告警 NodeTextFileCollectorScrapeError
查看 node-exporter 日志出现如下报错
time=2025-04-01T06:43:18.266Z level=ERROR source=textfile.go:248 msg="failed to collect textfile data" collector=textfile file=ipmitool.prom err="failed to parse textfile data from \"/host/root/var/lib/node_exporter/textfile/ipmitool.prom\": text format parsing error in line 35: invalid label value \"r\\x85r??\""
从日志来看,ipmitool.prom 文件在第 35 行存在格式错误,具体错误是 “invalid label value”,可能的原因如下:
可能的原因
1.特殊字符或乱码
r\x85r?? 可能是非 ASCII 字符或二进制数据,导致解析失败。
可能是 IPMI 工具输出的数据包含不可见字符。
2.标签格式错误
Prometheus 指标的标签必须符合:
metric_name{label="value"} number
例如:
ipmi_temperature{sensor="CPU Temp"} 42.0
label=“r\x85r??” 说明 value 部分包含了非法字符。
3.文件编码问题
ipmitool.prom 可能是 UTF-16、UTF-8 BOM 或其他非标准编码,导致解析失败。
4.IPMI 读取错误
ipmitool 可能返回了异常字符,导致 .prom 文件生成时包含错误数据。
解决方法
1.检查 ipmitool.prom 文件
cat -A /host/root/var/lib/node_exporter/textfile/ipmitool.prom | grep -n .
cat -A 显示所有特殊字符(^M、\x85 等)。
找到第 35 行的内容,看是否有乱码或特殊字符。
2.手动清理 ipmitool.prom
如果确认文件有乱码,可以手动编辑:
nano /host/root/var/lib/node_exporter/textfile/ipmitool.prom
删除第 35 行的无效字符
确保格式正确,如:
ipmi_temperature{sensor="CPU Temp"} 42.0
不要使用非 ASCII 字符(如中文、特殊符号等)。
3.自动清理文件
如果是 ipmitool 生成的问题,可用 sed 或 tr 过滤非标准字符:
sed -i 's/[^a-zA-Z0-9_{}=",.\-]//g' /host/root/var/lib/node_exporter/textfile/ipmitool.prom
或者:
tr -cd '\11\12\15\40-\176' < /host/root/var/lib/node_exporter/textfile/ipmitool.prom > /tmp/clean.prom && mv /tmp/clean.prom /host/root/var/lib/node_exporter/textfile/ipmitool.prom
这会删除所有 非 ASCII 可打印字符,避免 Prometheus 解析失败。
4.检查 ipmitool 生成的内容
如果 ipmitool 仍然生成错误数据,建议先手动运行:
ipmitool sensor
然后检查输出是否包含乱码或特殊字符。如果有问题,可以尝试:
LANG=C ipmitool sensor
或者重定向输出后检查:
ipmitool sensor > /tmp/ipmi_output.txt
cat -A /tmp/ipmi_output.txt
5.重新生成 .prom 文件
如果 ipmitool 是用脚本生成 .prom 文件的,建议在脚本里加个清理步骤:
ipmitool sensor | tr -cd '\11\12\15\40-\176' > /host/root/var/lib/node_exporter/textfile/ipmitool.prom
这样可以确保生成的 .prom 文件不会带有非法字符。
6.重新启动 node_exporter
清理后,重启 node_exporter 并检查日志:
sudo systemctl restart node_exporter
journalctl -u node_exporter --no-pager | tail -n 20
然后再访问 Prometheus /metrics 端点:
curl -s http://localhost:9100/metrics | grep textfile
如果 node_textfile_scrape_error 0,说明错误已经修复。
tr -cd ‘\11\12\15\40-\176’ 命令解释
tr -cd '\11\12\15\40-\176' 这个命令的作用是 过滤掉所有非 ASCII 可打印字符,只保留特定的字符集。
解释各个部分
tr:翻译或删除字符的命令(translate)-c:取反,即匹配不在指定字符集范围内的字符-d:删除匹配到的字符'\11\12\15\40-\176':保留的字符集:\11(Tab 键HT,ASCII 9)\12(换行符LF,ASCII 10)\15(回车CR,ASCII 13)\40-\176(范围表示法,ASCII 32 到 126,即所有可见的 ASCII 字符)
字符范围
| ASCII 范围 | 说明 |
|---|---|
\11 (9) | Tab (HT) |
\12 (10) | 换行 (LF) |
\15 (13) | 回车 (CR) |
\40 (32) | 空格 (Space) |
\176 (126) | ~(所有可打印 ASCII 字符) |
总结
这个命令 删除所有不可打印字符(比如 \x85、控制字符、二进制字符等)
- 只保留:
- 可见的 ASCII 字符(
32-126) Tab、换行、回车(用于格式化)
- 可见的 ASCII 字符(
示例
示例 1:清理包含特殊字符的文件
cat file.txt | tr -cd '\11\12\15\40-\176' > clean.txt
- 作用:从
file.txt里 删除不可打印字符,输出到clean.txt - 适用于清理
Prometheus .prom文件格式错误问题
示例 2:处理 ipmitool.prom
tr -cd '\11\12\15\40-\176' < ipmitool.prom > clean.prom
mv clean.prom ipmitool.prom
- 作用:去除
.prom文件中的乱码或非法字符,保证 Prometheus 能正确解析
这样可以确保 ipmitool.prom 不包含非标准字符,避免 NodeTextFileCollectorScrapeError
ansible 中写法
如果使用ansible 部署,tr -cd ‘\11\12\15\40-\176’ 里的 \ 需要转义(在 YAML 里 \ 是特殊字符)
示例如下
- name: Creates a cron file for prometheus monitor ipmicron:name: "{{ item.name }}"minute: "{{ item.minute }}"hour: "{{ item.hour }}"day: "{{ item.day }}"month: "{{ item.month }}"weekday: "{{ item.weekday }}"user: "{{ item.user }}"job: "{{ item.job }}"with_items:- { name: "ipmitool", minute: "*/1", hour: "*", day: "*", month: "*", weekday: "*", user: "root", job: "sudo ipmitool sensor | sudo awk -f {{ node_exporter_root_dir }}/ipmitool | tr -cd '\\11\\12\\15\\40-\\176' > {{ node_exporter_textfile_dir }}/ipmitool.prom" }
tr -cd ‘\11\12\15\40-\176’ 可以使用双引号吗
在 tr -cd ‘\11\12\15\40-\176’ 中,单引号 ‘’ 是用来确保 \11\12\15\40-\176 作为转义字符被 tr 正确解析。
如果使用 双引号 “”,bash 可能会对 \11\12\15\40-\176 进行额外的 shell 解析,可能导致错误或不符合预期的行为。
是否可以使用双引号?
单引号 ’ ’ ✅(推荐)
tr -cd '\11\12\15\40-\176'
✅ 正确,tr 直接解析 \11\12\15\40-\176 作为 ASCII 码范围。
双引号 " " ⚠️(可能错误)
tr -cd "\11\12\15\40-\176"
⚠️ 可能错误,bash 会优先解析 \,可能导致 tr 不能正确识别 ASCII 码。
相关文章:
NodeTextFileCollectorScrapeError 报警原因及解决方法
现象 prometheus 经常有告警 NodeTextFileCollectorScrapeError 查看 node-exporter 日志出现如下报错 time2025-04-01T06:43:18.266Z levelERROR sourcetextfile.go:248 msg"failed to collect textfile data" collectortextfile fileipmitool.prom err"fail…...
RapidJSON 处理 JSON(高性能 C++ 库)(四)
第四部分:RapidJSON 处理 JSON(高性能 C++ 库) 📢 快速掌握 JSON!文章 + 视频双管齐下 🚀 如果你觉得阅读文章太慢,或者更喜欢 边看边学 的方式,不妨直接观看我录制的 RapidJSON 课程视频!🎬 视频里会用更直观的方式讲解 RapidJSON 的核心概念、实战技巧,并配有…...
80. Linux内核定时器实验
一、Linux内核定时器原理 1.1、内核时间管理 1、Cortex-M内核使用systick作为系统定时器。 2、硬件定时器、软件定时器,原理是依靠系统定时器来驱动。 3、linux内核频率可以配置,图形化界面配置。 4、重点,HZ表示系统节拍率, 1.…...
Java 可变参数全解析:动态参数传递的实践指南
Java 可变参数全解析:动态参数传递的实践指南 一、可变参数:Java 方法的灵活扩展 在狂神说 Java 第 49 集课程中,我们系统学习了 Java 可变参数的核心原理。作为 Java SE 5 引入的重要特性,可变参数允许方法接受动态数量的输入&…...
C++类与对象(上):从入门到实践
目录 一、引言 二、面向过程和面向对象初步认识 2.1 面向过程编程 2.2 面向对象编程 三、类的引入 四、类的定义 4.1 定义格式 4.2 定义方式 4.3 成员变量命名规则建议 五、类的访问限定符及封装 5.1 访问限定符 5.2 封装 六、类的作用域 七、类的实例化 7.1 概念…...
Lumerical ------ Edge coupler design
Lumerical ------ Edge coupler design 引言正文无 Si Substrate 的仿真步骤有 Si Substrate 的仿真步骤引言 本文,我们将使用官方提供的 Edge coupler 设计教程,但是中间会带有作者本人的设计的感悟。 正文 无 Si Substrate 的仿真步骤 打开 Edge_Coupler_No_Substrate.l…...
大语言模型本质上还是自动化,而不是智能化
大语言模型本质上仍然是自动化或高级自动化,而非真正的智能化,原因可以从以下几个方面进行分析:1、自动化与智能化的本质区别自动化:大语言模型通过预训练和微调,基于大量数据和规则生成输出。它的行为是基于输入数据的…...
cmake 中的命令
命令描述示例capabilities报告 CMake 内置的功能,以 JSON 格式输出cmake -E capabilitiescat连接文件并将其内容打印到标准输出cmake -E cat file1.txt file2.txtchdir在指定目录中运行命令cmake -E chdir /path/to/dir commandcompare_files比较两个文件是否相同cm…...
python数据结构——链表、栈、队列
一、思维梳理: 二、双向循环链表: class Node:def __init__(self,data):self.data dataself.next Noneself.prev Noneclass DoubleLink:def __init__(self):self.size 0self.head Nonedef is_empty(self):return self.size 0def add_end(self,dat…...
centos操作系统如何更换yum镜像源
CentOS Linux 是一个免费提供的、社区支持的Linux发行版,由CentOS项目社区贡献者开发、分发和维护。2020年CentOS项目宣布将把全部投资转移到CentOS Stream,作为即将发布的 Red Hat Enterprise Linux版本的上游开发平台。因此,CentOS Linux更新和发布将在2021年至2024年期间…...
【Linux篇】自主Shell命令行解释器
📌 个人主页: 孙同学_ 🔧 文章专栏:Liunx 💡 关注我,分享经验,助你少走弯路! 文章目录 1. 获取用户名的接口2. 等待用户输入接口3. 将上述代码进行面向对象式的封装4. 命令行解析5.…...
Tomcat 部署 Jenkins.war 详细教程(含常见问题解决)
在Tomcat中部署Jenkins.war文件是一个相对简单的过程,以下是详细步骤: 1. 准备工作 确保已安装JDK:Jenkins需要Java环境,建议安装JDK 8或更高版本。 下载Jenkins.war:https://pan.quark.cn/s/c4fd7711a1b3 下载Tomc…...
我的创作纪念日-一周年
目录 机缘 收获 日常 成就 憧憬 机缘 时光荏苒,转行计算机已经是第5个年头了。从Python入门,到C入土,兜兜转转,发现自己也只是初窥门径,习得皮毛。我从6年前开始潜水CSDN,学习各路大佬的技术经验&…...
多线程代码案例 - 1
目录 单例模式 1. 饿汉模式 2. 懒汉模式 单例模式与多线程 问题1 问题2 问题3 完! 单例模式 单例模式是一种设计模式。 设计模式,是我们在编写代码时候的一种软性的规定,也就是说,我们遵守设计模式,代码的下限…...
display:none与visibility的区别
1. 是否占据空间 display: none:元素完全从文档流中移除,不占据任何布局空间。后续元素会“填补”它的位置。visibility:hidden:元素仍占据布局空间,但内容不可见(类似透明占位符)。 2.渲染与性能 displ…...
算法 | 基于蜣螂优化算法求解带时间窗的车辆路径问题(VRPTW)研究(附matlab代码)
基于蜣螂优化算法求解带时间窗的车辆路径问题(VRPTW)研究 🍏🍏🍏🍏🍏🍏🍏🍏🍏🍏🍏🍏🍏🍏🍏 摘要 带时间窗的车辆路径问题(VRPTW)是物流配送中的核心优化难题。本文提出一种基于蜣螂优化算法(Dung Beetle Optimizer, DBO)的求解方法,通过…...
开发体育赛事直播系统主播认证功能技术实现方案
该体育直播系统系统由东莞梦幻网络科技开发,使用 ThinkPHP 作为后端,Vue.js 作为 PC/H5 端框架,Java 和 Objective-C 分别用于安卓和 iOS 开发。 1、前端实现 (Vue.js) <template><div class"anchor-certification">…...
国产三维CAD「皇冠CAD」在汽车零部件领域建模教程:刹车片
本教程深度融合三维皇冠CAD(CrownCAD)的MBD(Model-Based Definition)设计理念,通过参数化建模、智能约束管理、动态装配验证等功能,实现数据驱动设计,精准解决了汽车制动系统中精密制动组件的设…...
基于指针的线程池
使用原线程池 当 push 和 pop的对象过大时,消耗时延过高,需优化线程池 采用 std::move() unique_ptr的方法,能极大的减少时延, 实际就是避免了多次拷贝,直接使用指针。 代码实现 ThreadPool…...
GitHub与Gitee各是什么?它们的区别与联系是什么?
李升伟 整理 GitHub 介绍 GitHub 是一个基于 Git 的代码托管平台,主要用于版本控制和协作开发。它支持多人协作,提供代码托管、问题跟踪、代码审查、项目管理等功能。GitHub 是全球最大的开源社区,许多知名开源项目都在此托管。 主要功能&…...
SpringMvc获取请求数据
基本参数 RequestMapping("save5") ResponseBody public User save5(String name, int age) {User user new User();user.setName(name);user.setAge(age);return user; } 在url中将name与age进行编写,通过框架可以提取url中的name与age,这…...
简述竞赛经历在考研复试中的作用
文章目录 前言拟录取情况baichuicxyAshy佬齐总结回首展望 前言 随着就业形式的不断变化,竞赛奖项在就业中能起到的作用在逐步减弱。想拿到头部大厂实习面试资格,最低要区域赛银牌起步,当然这也仅仅是面试资格。 那么,竞赛经历在…...
大语言模型开发框架——LangChain
什么是LangChain LangChain是一个开发由语言模型驱动的应用程序的框架,它提供了一套工具、组件和接口,可以简化构建高级语言模型应用程序的过程。利用LangChain可以使应用程序具备两个能力: 上下文感知 将语言模型与上下文(提示…...
Nginx 核心配置详解与性能优化最佳实践
1.什么是 Nginx? Nginx 是一个高性能的 Web 服务器和反向代理服务器。它轻量、高效,被广泛用于现代 Web 开发中。 2.为什么前端需要了解 Nginx? ★ 了解 本地开发:可以模拟生产环境 部署前端项目:作为静态文件服务器…...
机器学习的一百个概念(7)独热编码
前言 本文隶属于专栏《机器学习的一百个概念》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢! 本专栏目录结构和参考文献请见[《机器学习的一百个概念》 ima 知识库 知识库广场搜索&…...
用LLama factory时报类似Process 2504721 got signal: 1的解决方法
之前用nohup来远程跑LLama factory微调脚本,是没有问题的,但今天发现运行类似下面这个命令时, nohup llamafactory-cli train examples/train_qlora/qwen_lora.yaml 只要一关闭ssh session,就会终止训练,报类似&…...
解决 Git 通过 SSH 克隆仓库时自动转换为 HTTPS 的问题
解决 Git 通过 SSH 克隆仓库时自动转换为 HTTPS 的问题 在使用 Git 通过 SSH 协议克隆私有仓库时,如果遇到类似以下错误: fatal: unable to access https://itlab.stack.net:stack.git/: Could not resolve host: gitlab.stack这通常是因为 Git 配置错…...
从实用的角度聊聊Linux下文本编辑器VIM
本文从实用的角度聊聊Vim的常用命令。何为实用?我举个不实用的例子大家就明白了,用vim写代码。;) “vim是从 vi 发展出来的一个文本编辑器。代码补全、编译及错误跳转等方便编程的功能特别丰富,在程序员中被广泛使用,和Emacs并列成…...
多电机显示并排序
多电机显示并排序 要实现根据后端传递过来的驱动电机数据的数量来显示不同数量的数据列表,我们可以使用 Vue 的 v-for 指令来遍历 driveMotorData 数组,并为每个驱动电机生成一个数据列表。这样,无论后端传来多少个驱动电机的数据࿰…...
佳能imageRUNNER 2206N基本参数及管理员密码
基本参数: 产品类型 激光数码复合机 颜色类型 黑白 涵盖功能 复印/打印/扫描 速度类型 低速 最大原稿尺寸 A3 复印/打印方式 激光静电转印方式 感光材料 OPC 显影系统 干式单组分显影 定影…...
