当前位置: 首页 > article >正文

一次线上事故排查:200 行 ERROR 日志定位根因

如果你做过运维或者后端开发一定遇到过这种情况。线上报警ERROR 日志激增第一反应通常是系统是不是挂了于是开始排查日志。一、事故背景某天生产环境出现报警服务oa-server 报警ERROR 日志突增 时间15:05日志系统里很快出现大量异常2026-03-08 15:05:09 ERROR GlobalExceptionHandler BusinessException: 该业务功能已绑定流程接下来几秒钟2026-03-08 15:05:10 ERROR GlobalExceptionHandler 2026-03-08 15:05:11 ERROR GlobalExceptionHandler 2026-03-08 15:05:12 ERROR GlobalExceptionHandler日志数量200 行此时值班工程师要判断一件事这是事故吗二、传统排查方式大多数团队排查流程差不多。第一步打开日志系统ELK Loki Kibana第二步搜索ERROR Exception第三步开始人工阅读日志。典型流程翻日志 找异常 分析堆栈 判断影响这个过程通常需要5 ~ 10 分钟如果日志多时间更长。三、运维真正想知道的其实只有三件事其实值班工程师只关心三个问题1 是否系统故障还是只是业务异常2 是否影响用户例如是否请求失败 是否服务不可用3 要不要现在处理可能是立即处理也可能只是观察但这些结论通常要翻完日志才能判断。四、AI 自动分析日志为了减少人工翻日志的时间我做了一个开源工具Incident Community核心能力日志 → 自动生成事故报告五、AI 分析结果同样一段日志BusinessException: 该业务功能已绑定流程系统生成的事故报告 Incident Report Service: oa-server Environment: production Severity: P3 Root Cause BusinessException triggered by business rule. Impact No system failure detected. Recommendation No immediate action required.核心结论其实只有两句话结论业务异常 动作无需处理值班工程师5 秒就能判断情况。六、事故报告自动生成系统还能生成完整事故复盘报告# Incident Report ## Incident Summary Service: oa-server Environment: production ## Root Cause Business rule triggered BusinessException. ## Impact No service outage detected. ## Recommendation No action required.支持导出Markdown HTML PDF方便事故复盘 团队知识库 技术博客七、为什么做这个工具在很多团队里运维每天都在做重复的事情翻日志 找异常 写事故报告如果这些事情可以自动化排查效率会提高很多这也是我做这个项目的原因。八、开源项目项目地址https://github.com/LukeGitHub-xd/incident-community核心功能日志上传分析支持日志文件 文本日志自动异常识别识别Exception Error Timeout Database errors自动生成事故报告报告包含事故概述 根因分析 影响范围 修复建议多格式导出支持Markdown HTML PDF九、总结很多线上事故排查的时间其实都花在翻日志如果日志可以自动生成结论排查效率会提升很多如果你也遇到过凌晨报警 翻几百行日志 不知道问题严不严重可以看看这个项目https://github.com/LukeGitHub-xd/incident-community如果觉得有帮助欢迎给一个 ⭐ Star。

相关文章:

一次线上事故排查:200 行 ERROR 日志定位根因

如果你做过运维或者后端开发,一定遇到过这种情况。 线上报警: ERROR 日志激增第一反应通常是: 系统是不是挂了?于是开始排查日志。 一、事故背景 某天生产环境出现报警: 服务:oa-server 报警&#xff…...

深耕智慧供热 铸就行业口碑|河北唐仪室温采集器市场地位与实力解析

随着智慧供热全面升级、供暖精细化管理成为行业发展主流,室温采集器作为热源调控、能耗优化、用户服务的核心终端设备,市场需求持续增长。河北唐仪自控设备有限公司深耕供热自动化领域多年,专注室温采集设备研发、生产与系统集成,…...

测试文档3.12

测试文档3.12...

手搓51单片机+ADC0808电压表:从焊板子到显示数值全攻略

51单片机和ADC0808数字电压表,包括程序源码和protues仿真,pcb等,程序源码注释详细,适合单片机开发人员和新手。最近在工作室翻出几片落灰的ADC0808,这老伙计可是当年做课程设计的标配。今天带大家用STC89C52做个真能用…...

OpenClaw Skill 编写规范 与示例

OpenClaw Skill 编写规范 与示例 完整的 Skill 开发指南&#xff0c;从基础结构到高级实践 &#x1f4c1; 一、目录结构 标准结构 ~/.openclaw/workspace/skills/<skill-name>/ ├── SKILL.md # 必需&#xff1a;技能定义文件 ├── scripts/ …...

【前沿解析】2026年3月12日:AWE 2026开启AI家电规模化落地革命,CATS Net概念抽象与对角蒸馏技术重塑智能未来

摘要:2026年3月12日,全球三大家电展之一的AWE(中国家电及消费电子博览会)在上海盛大开幕,标志着AI家电从"尝鲜"到"刚需"的关键转折。本文深入解析AWE 2026展出的AI前沿技术,涵盖全屋智能生态、AI智能体落地应用,并结合同期发布的两大突破性研究——…...

开源剪映小助手(capcut-mate)v3.0.26发布

项目简介 CapCut Mate API 是一款完全开源免费、基于 FastAPI构建的剪映草稿自动化助手&#xff0c;支持独立部署。本项目专注于为大模型赋能基础视频编辑能力&#xff0c;提供开箱即用的视频剪辑 Skills&#xff0c;已将剪映核心功能全流程自动化。可直接对接大模型实现多样化…...

Qt Small Business 的版权雷区

最近很多人刷到&#xff1a; “Qt 小微企业计划&#xff0c;年收入 ≤ 100 万欧元&#xff08;约 793 万人民币&#xff09;&#xff0c;最多 3 个开发者&#xff0c;就能享受官方折扣授权&#xff01;” 听起来是不是很香&#xff1f;正版授权 跨平台开发 便宜&#xff01; …...

训练环境决定 AI Agent 天花板:Harness 如何塑造 RL 训练循环

最近 Cursor 发布 Composer 1.5 的消息刷屏了。他们的 RL 训练规模直接扩大了 20 倍&#xff0c;后训练计算量甚至超过了预训练阶段。更关键的是&#xff0c;所有训练都发生在和生产环境完全一致的沙箱里——同样的代码编辑器、同样的语义搜索、同样的终端命令。 这让我突然意识…...

Maxwell Optislang的谐响应与多物理场计算在永磁电机多目标优化参数化建模及电磁振...

maxwell &#xff0c;optislang 谐响应&#xff0c;&#xff0c;多物理场计算永磁电机多目标优化参数化建模电磁振动噪声仿真永磁电机的多物理场优化就像在玩一场精密的多维拼图游戏。当电磁性能、振动噪声和热特性这几个看似矛盾的指标需要同时满足时&#xff0c;传统单学科优…...

焊接机器人破局船舶制造难题

​​在船舶制造领域&#xff0c;大型复杂船体因尺寸大、结构复杂、空间狭小等特点&#xff0c;传统手工焊接质量波动大、一致性差&#xff0c;成为制约行业升级的关键瓶颈。如今&#xff0c;洲翔龙门和悬臂式焊接机器人凭借"手、眼、脑"协同的智能系统&#xff0c;正…...

AIGC时代下SEO的变革:从关键词堆砌到智能内容生成

引言&#xff1a;当SEO遇见AIGC&#xff0c;是颠覆还是赋能&#xff1f; 搜索引擎优化&#xff08;SEO&#xff09;领域正经历着一场由人工智能生成内容&#xff08;AIGC&#xff09;驱动的深刻变革。从早期的关键词堆砌到如今的内容为王&#xff0c;SEO的核心始终围绕着“理解…...

MySQL国产化替代:数据类型适配与迁移成本优化实战

很多企业做数据库国产化替代时&#xff0c;最核心的焦虑莫过于&#xff1a;“用了这么多年MySQL&#xff0c;换国产库是不是要重写所有SQL&#xff1f;改表结构&#xff1f;调应用代码&#xff1f;停机好几天&#xff1f;” 其实答案可以很简单&#xff1a;只要选对具备深度MyS…...

土壤热通量变送器怎么选?优质厂商推荐及选型指南来了!

在生态环境监测、岩土工程建设、气象研究及农业精细化发展的当下&#xff0c;土壤热通量作为反映土壤能量平衡、热传导特性的核心指标&#xff0c;其精准监测对科研探索、工程安全与生产优化具有重要意义。土壤热通量变送器作为捕捉这一指标的关键设备&#xff0c;其测量精度、…...

YOLOv12全网首发:CVPR2026 Transformer注意力 | BinaryAttention 1-bit注意力,推理提速100%,超越FlashAttention2

💡💡💡问题点:Transformer 已取得广泛而显著的成功,但其注意力模块的计算复杂性仍然是视觉任务的主要瓶颈。现有方法主要采用 8-bit 或 4-bit 量化来平衡效率与精度 💡💡💡措施:我们通过理论论证指出,注意力的二值化保留了基本的相似性关系,并提出了 BinaryAt…...

智能安防感知方案:从被动响应到主动关怀 | Smart Security Sensing Solutions: From Passive Response to Active Care

引言&#xff1a;安防感知的演进与核心痛点 | Introduction: The Evolution and Core Challenges of Security Sensing传统的安防系统&#xff0c;如摄像头和门窗传感器&#xff0c;主要扮演“事后记录”或“边界报警”的角色。它们往往在事件发生后才发出警报&#xff0c;缺乏…...

910b A100 GPU - IDC行业服务器托管与租用

现在IDC圈里聊到高性能计算&#xff0c;昇腾910b和NVIDIA A100这两款GPU绝对是绕不开的话题。特别是随着大模型训练、科学计算这类业务越来越普及&#xff0c;企业对高性能算力的需求已经不再是“有就行”&#xff0c;而是要求稳定、高效、可扩展。 先说说A100&#xff0c;这是…...

PTA 串的算法设计 4 求某链串的子串算法

作者 张鏖烽单位 湖南工程学院设计一个算法求链串s的子串&#xff1a;Sub_LinkStr(LinkString *s,int i, int j);函数接口定义&#xff1a;LinkString * Sub_LinkStr(LinkString *s,int i, int j);//求链串s的子串&#xff0c;子串存在则输出子串&#xff0c;否则输出空串其中i…...

如何执行Install-Package

pwoershell执行[Net.ServicePointManager]::SecurityProtocol [Net.ServicePointManager]::SecurityProtocol -bor [Net.SecurityProtocolType]::Tls12Get-PackageProvider -ListAvailableInstall-PackageProvider -Name NuGet -MinimumVersion 2.8.5.201 -ForceInstall-Packa…...

模块化编程下的FOC工程源码解析:获取ABZ编码器初始电角度差的方法及其在工业量产中的应用

编码器foc工程源码 编码器为1000线ABZ编码器 源码中含有foc初始电角度差的获取方法 模块化编程 非常适合工业量产和移植最近在搞一个FOC&#xff08;Field Oriented Control&#xff0c;磁场定向控制&#xff09;项目&#xff0c;用的是1000线的ABZ编码器。这个编码器精度高&…...

智能楼道灯控制器(有完整资料)

资料查找方式&#xff1a;特纳斯电子&#xff08;电子校园网&#xff09;&#xff1a;搜索下面编号即可编号&#xff1a;HJJ-32-2022-020设计简介&#xff1a;本设计是基于单片机的智能楼道灯控制器&#xff0c;主要实现以下功能&#xff1a;1.能通过蓝牙远程控制led照明灯&…...

英伟达“龙虾”乐园开张在即:硅谷现场装配AI助手引燃AI热潮!

本周&#xff0c;全球AI算力巨头英伟达&#xff08;NVIDIA&#xff09;将在加州圣何塞掀起一场别开生面的科技盛宴——英伟达年度旗舰盛会GTC&#xff08;GPU技术大会&#xff09;即将开幕&#xff0c;而今年的GTC则被业界戏称为“龙虾大会”。据36氪独家报道&#xff0c;除了发…...

AI面试系统选型指南:为什么企业级安全是不可妥协的底线

AI面试系统正在成为现代招聘流程中不可缺少的组成部分。它不仅能够显著压缩面试周期、降低HR的重复性工作负担&#xff0c;更重要的是&#xff0c;通过标准化的评估框架&#xff0c;有效减少人为偏见对招聘决策的影响。然而&#xff0c;当越来越多的企业开始将AI面试纳入正式招…...

电商品牌数字化获客工具排行榜适配精准需求

电商品牌数字化获客工具排行榜适配精准需求一、行业背景与排行依据据《2026中小企业数字化获客白皮书》数据显示&#xff0c;当前国内83%的电商品牌面临获客成本攀升、用户精准度不足的问题&#xff0c;人工运营效率仅为自动化工具的17%&#xff0c;数字化获客已成为企业增长的…...

esp网络时钟

配件ESP32 30P CP2102 Type-C 开发板 0.96寸 OLED 屏幕 (I2C接口) 接线#四针oled接线 SDA -> ESP32 的 G21 SCL -> ESP32 的 G22 VCC -> ESP32 的 3V3 GND -> ESP32 的 GNDIDE&#xff1a;Arduino IDE安装U8g2lib字体库#include <WiFi.h> #include <U8g2l…...

2026年期货量化软件多品种支持排名_全市场覆盖对比

免责声明&#xff1a;本文基于个人使用体验&#xff0c;与任何厂商无商业关系。内容仅供技术交流参考&#xff0c;不构成投资建议。 一、前言 期货量化策略往往需要覆盖多个品种、多周期。不同期货量化软件在品种覆盖、周期支持、多合约并发等方面差异明显。做了多年期货量化&…...

Pixelium Design 更新:首版表格上线,完善表单、导航、反馈及视觉组件

前言 最近在维护我的像素风组件库 Pixelium Design&#xff0c;它迎来了一波不小的更新。 这次更新不仅带来了功能完善的像素风表格组件&#xff0c;还新增了不少输入组件、导航组件和反馈组件&#xff0c;补全了基础能力。此外&#xff0c;这次的改动&#xff0c;还带来了一…...

招聘系统如何扛住“校招/大促”流量峰值?——高并发下不宕机,保障万人级招聘季稳定

博主介绍&#xff1a; 所有项目都配有从入门到精通的安装教程&#xff0c;可二开&#xff0c;提供核心代码讲解&#xff0c;项目指导。 项目配有对应开发文档、解析等 项目都录了发布和功能操作演示视频&#xff1b;项目的界面和功能都可以定制&#xff0c;包安装运行&#xff…...

期货程序化交易日志分析_问题定位与优化

免责声明&#xff1a;本文基于个人使用体验&#xff0c;与任何厂商无商业关系。内容仅供技术交流参考&#xff0c;不构成投资建议。 一、前言 程序化交易运行中会产生大量日志&#xff0c;合理的日志设计和分析能快速定位问题、优化策略。做了二十年期货交易&#xff0c;我积累…...

【ASP.NET CORE】 8. 集成 JWT 认证授权

本系列专栏基于杨中科老师的《ASP.NET Core技术内幕与项目 实战》&#xff0c;本人记录梳理的学习笔记&#xff0c;有部分的增补和省略。更全面系统的讲解&#xff0c;请看杨老师的视频课&#xff1a;【.NET教程&#xff0c;.Net Core视频教程&#xff0c;杨中科主讲】。 一、…...