基于 Filebeat 的日志收集

在现代分布式系统中,日志数据作为关键的监控与故障排查依据,越来越受到重视。本文将深入探讨 Filebeat 的技术原理、配置方法及在 ELK(Elasticsearch、Logstash、Kibana)生态系统中的应用,帮助开发者构建高效、稳定的日志收集方案。
1. Filebeat 概述
Filebeat 是 Elastic 公司推出的一款轻量级日志采集工具,专门设计用于从本地文件中读取日志数据,并将日志数据转发到下游的 Logstash 或 Elasticsearch 中。它的优势在于:
轻量级:资源占用低,适合在大量服务器上部署。
可靠性:内置断点续传功能,避免数据丢失。
灵活性:支持多种数据输入格式和高级功能,如多行日志解析、事件去重等。
2. Filebeat 工作原理
Filebeat 主要通过以下几个模块完成日志采集任务:
输入(Inputs):定义需要采集的日志文件路径、采集方式及相关选项。Filebeat 通过监控文件系统变更来捕获新增数据。
模块(Modules):预定义的日志解析配置,针对特定的应用场景(如 Nginx、System 等)进行优化配置,简化部署过程。
输出(Outputs):将采集到的日志数据发送到目标系统,如 Elasticsearch、Logstash 或其他第三方服务。
处理器(Processors):在日志数据发送前进行过滤、增强、解析等处理,如添加元数据、字段重命名等。
3.配置教程
1. 下载地址
filebeat下载地址

下载和ES对应的版本,防止出错
2.官方配置教程
官方配置教程
3.我的配置
我的电脑是ubuntu24.04的版本
curl -L -O https://artifacts.elastic.co/downloads/beats/filebeat/filebeat-7.12.1-linux-x86_64.tar.gz
tar xzvf filebeat-7.12.1-linux-x86_64.tar.gz
修改 filebeat.yml的配置

注释kibana的配置, 将数据直接传输到ES中

seccomp:default_action: allowsyscalls:- action: allownames:- rseq
配置ES的地址

如果启动的时候出现了报错(runtime/cgo: pthread_create failed: Operation not permitted),需要增加这个配置
# 查看filebeat 模块
./filebeat modules list
# 启用模块
./filebeat modules enable system
# 禁用模块
./filebeat modules disable redis
# 测试配置是否正确
./filebeat test config
# 启动filebeat
./filebeat -e
执行上面命令之后,面板没有报错表示已经成功启动,但是配置文件中并没有配置收集任何的日志,所有ES中日志为空。
4. 收集系统的日志
# 启用system模块
./filebeat modules enable system
# 在安装目录打开
vim modules.d/system.yml
# system.yml修改配置
# Module: system
# Docs: https://www.elastic.co/guide/en/beats/filebeat/7.x/filebeat-module-system.html- module: system# Syslogsyslog:enabled: true# Set custom paths for the log files. If left empty,# Filebeat will choose the paths depending on your OS.var.paths: ["/var/log/syslog*"]# Authorization logsauth:enabled: true# Set custom paths for the log files. If left empty,# Filebeat will choose the paths depending on your OS.var.paths: ["/var/log/auth.log*"]
~# 启动filebeat
./filebeat -e

ES中正常显示日志
5. 总结
Filebeat 作为 Elastic Stack 中的重要组成部分,通过轻量级、灵活且高效的日志采集机制,帮助企业构建稳定可靠的日志收集与处理方案。在实际应用中,根据业务场景合理配置多行日志、数据处理器以及输出目标,能够大大提升系统的日志处理能力和数据分析效率。未来,随着微服务与云原生架构的不断发展,Filebeat 将在日志管理与监控领域扮演越来越重要的角色。
相关文章:
基于 Filebeat 的日志收集
在现代分布式系统中,日志数据作为关键的监控与故障排查依据,越来越受到重视。本文将深入探讨 Filebeat 的技术原理、配置方法及在 ELK(Elasticsearch、Logstash、Kibana)生态系统中的应用,帮助开发者构建高效、稳定的日…...
Next.js 15【实用教程】2025最新版
官网 https://nextjs.org/docs/app/getting-started Next.js 简介 Next.js 由 Vercel 开发和维护,旨在解决单页应用(SPA)和多页应用(MPA)在性能和 SEO 上的不足。 核心特性 服务端渲染(SSR)--…...
vue学习10
1.GPT和Copilot Copilot Tab接受 删除键,不接受 ctrlenter更多方案 更适合的是修改方向 const submitForm async () > {//等待校验结果await formRef.value.validate()//提交修改await userUpdateInfoService(form.value)//通知user模块,进行数据更…...
redis 缓存击穿问题与解决方案
前言1. 什么是缓存击穿?2. 如何解决缓存击穿?怎么做?方案1: 定时刷新方案2: 自动续期方案3: 定时续期 如何选? 前言 当我们使用redis做缓存的时候,查询流程一般是先查询redis,如果redis未命中,再查询MySQL,将MySQL查询的数据同步到redis(回源),最后返回数据 流程图 为什…...
【Vue3 入门到实战】16. Vue3 非兼容性改变
目录 1. 全局 API 的变化 2. 模板指令的变化 2.1 组件v-model用法 2.2 template v-for用法 2.3 v-if 和v-for 优先级变化 2.4 v-bind"object" 顺序敏感 2.5 v-on:event.native 被移除 3. 组件的变化 3.1 功能组件只能使用普通函数创建 3.2 SFC弃用功能属性…...
20250214 随笔 Elasticsearch(ES)索引数据 vs. 业务数据库冗余双写
Elasticsearch(ES)索引数据 vs. 业务数据库冗余双写的区别、优缺点分析 在高并发数据查询场景下,Elasticsearch(ES) 和 业务数据库冗余双写 都是常见的数据同步方案。它们主要区别在于数据存储方式、查询性能、数据一…...
c# textbox 设置不获取光标
[DllImport("user32",EntryPoint "HideCaret")] private static extern bool HideCaret(IntPtr hWnd); //需引入命名空间using System.Runtime.InteropServices; private void Txt_RecInfo_MouseDown(object sender, MouseEventArgs e) { …...
中望CAD c#二次开发 ——VS环境配置
新建类库项目:下一步 下一步 下一步: 或直接: 改为: <Project Sdk"Microsoft.NET.Sdk"> <PropertyGroup> <TargetFramework>NET48</TargetFramework> <LangVersion>pr…...
anolis os 8.9安装jenkins
一、系统版本 # cat /etc/anolis-release Anolis OS release 8.9 二、安装 # dnf install -y epel-release # wget -O /etc/yum.repos.d/jenkins.repo https://pkg.jenkins.io/redhat-stable/jenkins.repo # rpm --import https://pkg.jenkins.io/redhat-stable/jenkins.…...
HtmlRAG:RAG系统中,HTML比纯文本效果更好
HtmlRAG 方法通过使用 HTML 而不是纯文本来增强 RAG 系统中的知识表示能力。通过 HTML 清洗和两步块树修剪方法,在保持关键信息的同时缩短了 HTML 文档的长度。这种方法优于现有基于纯文本的RAG的性能。 方法 其实主要看下围绕html提纯思路,将提纯后的…...
TypeScript 中的 reduce计算统计之和
1、计算字符串数组中最大的一项,比如数组:list ["家长会,柘城,喝士大夫","模压,手动阀,阿斯蒂"],求出list中字符串长度之和最大的那项: // 初始化变量来存储字数之和最多的项及其字数之和let maxWord ;let…...
HTTP/2 由来及特性
HTTP/2 的由来 HTTP/1.x 的局限性 性能瓶颈 队头阻塞问题:在HTTP/1.x中,一个TCP连接在同一时间只能处理一个请求,后续请求必须等待前面的请求处理完成并收到响应后才能被处理。例如,当一个页面有多个资源(如图片、脚…...
android 安装第三方apk自动赋予运行时权限
摘要:行业机使用场景点击运行时权限很麻烦,而随着android的演进,对于权限的管控越发严格。故本文通过对系统的修改实现第三方app在运行时直接获取全部权限。 通过属性ro.perms.force_grant控制功能开关。 Index: frameworks/base/services/…...
PyTorch Lightning LightningDataModule 介绍
LightningDataModule 是 PyTorch Lightning 提供的数据模块,用于统一管理数据加载流程(包括数据准备、预处理、拆分、批量加载等)。它的核心作用是将数据处理逻辑与模型解耦,提高代码的可复用性和可读性。 1. LightningDataModule 的作用 ✅ 封装数据预处理:数据下载、清…...
windows平台上 oracle简单操作手册
一 环境描述 Oracle 11g单机环境 二 基本操作 2.1 数据库的启动与停止 启动: C:\Users\Administrator>sqlplus / as sysdba SQL*Plus: Release 11.2.0.4.0 Production on 星期五 7月 31 12:19:51 2020 Copyright (c) 1982, 2013, Oracle. All rights reserved. 连接到:…...
【网络安全 | 漏洞挖掘】价值3133美元的Google IDOR
未经许可,不得转载。 文章目录 正文正文 目标URL:REDACTED.google.com。 为了深入了解其功能,我查阅了 developer.google.com 上的相关文档,并开始进行测试。 在测试过程中,我发现了一个 XSS 漏洞,但它触发的域名是经过正确沙盒化的 *.googleusercontent.com,这符合 …...
LabVIEW太阳能制冷监控系统
在全球能源需求日益增长的背景下,太阳能作为一种无限再生能源,被广泛应用于各种能源系统中。本基于LabVIEW软件和STM32F105控制器的太阳能制冷监控系统的设计与实现,提供一个高效、经济的太阳能利用方案,以应对能源消耗的挑战。 项…...
10.2 Git 内部原理 - Git 对象
Git 对象 Git 是一个内容寻址文件系统,听起来很酷。但这是什么意思呢? 这意味着,Git 的核心部分是一个简单的键值对数据库(key-value data store)。 你可以向 Git 仓库中插入任意类型的内容,它会返回一个唯…...
作业。。。。。
顺序表按元素删除 参数:删除元素,顺序表 1.调用元素查找的函数 4.根据下表删除 delete_sub(list,sub); //删除元素 void delete_element(int element, Sqlist *list) …...
android 的抓包工具
charles 抓包工具 官网地址 nullCharles Web Debugging Proxy - Official Sitehttps://www.charlesproxy.com/使用手册一定记得看官网 SSL Certificates • Charles Web Debugging Proxy http请求: 1.启动代理: 2.设置设备端口 3.手机连接当前代理 …...
从实验室到工作站:手把手配置Ubuntu 20.04+CUDA 11.1开发环境,兼顾V100与3090混搭显卡
异构GPU集群实战:Ubuntu 20.04下V100与3090的CUDA 11.1协同配置指南 当实验室的计算节点同时搭载NVIDIA V100和RTX 3090显卡时,驱动安装会面临Volta与Ampere架构的版本兼容挑战。去年我们在部署某AI训练平台时,就遇到过驱动版本冲突导致3090无…...
Arm GICv5架构解析:虚拟化与低延迟中断处理
1. Arm GICv5架构概述中断控制器是现代计算系统中至关重要的基础设施组件,作为处理器核心与外围设备之间的通信枢纽,它负责高效管理和分发各类异步事件。Arm Generic Interrupt Controller (GIC)架构经过多年迭代演进,GICv5版本在原有基础上进…...
3秒解锁百度网盘资源:baidupankey智能提取码获取终极指南
3秒解锁百度网盘资源:baidupankey智能提取码获取终极指南 【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 还在为百度网盘分享链接的提取码而烦恼吗?每次遇到需要密码的资源,你是否也在各大论…...
基于MCP协议构建Statcast棒球数据AI智能体:从原理到实践
1. 项目概述:当棒球数据遇上AI智能体如果你是一个棒球数据分析师、体育科技开发者,或者只是一个对棒球数据科学充满好奇的爱好者,那么你很可能已经对Statcast这个数据宝库垂涎已久。Statcast系统通过遍布球场的雷达和摄像头,捕捉了…...
【限时24h】奇点智能大会完整PPT+逐页批注版:标注19处技术话术陷阱、7个可复用架构模板、4个已验证避坑checklist
更多请点击: https://intelliparadigm.com 第一章:奇点智能大会PPT回放:SITS2026精彩回顾 SITS2026(Singularity Intelligence Technology Summit)于2026年4月在上海张江科学会堂圆满落幕,大会聚焦大模型推…...
Autogrind:基于CI/CD的自动化代码审查工具实践指南
1. 项目概述:自动化代码审查的“磨刀石”如果你是一名开发者,尤其是经历过团队协作或维护过大型项目,那么对代码审查(Code Review)一定不会陌生。它既是保证代码质量、统一团队规范的关键环节,也常常是开发…...
基于树莓派Zero W的电子宠物开源硬件项目:从硬件到软件的完整实现
1. 项目概述:当树莓派遇上“电子宠物”,一个开源硬件项目的诞生 如果你和我一样,对树莓派这类小巧的卡片电脑充满热情,同时又对复古的“电子宠物”文化有一份怀念,那么 turmyshevd/openclawgotchi 这个项目绝对会让你…...
RecallForge:基于语义检索的本地化智能代码复用引擎设计与实践
1. 项目概述:一个面向开发者的智能代码记忆与复用引擎 最近在和一些资深的后端朋友聊天时,大家不约而同地提到了一个痛点:随着项目越做越大,技术栈越来越杂,我们的大脑似乎变成了一个“内存不足”的缓存系统。上周还在…...
视频VAE与3D建模融合:VIST3A技术解析
1. 项目概述:当视频理解遇上3D建模去年在开发一个AR项目时,我遇到一个棘手问题:如何快速将客户提供的产品视频转化为可交互的3D模型?传统摄影测量方法对设备要求高,而纯AI方案又难以保持细节精度。正是这个痛点催生了V…...
ClawSpark:简化Apache Spark开发的增强工具库实战解析
1. 项目概述:一个为数据处理而生的Spark利器最近在折腾一个数据清洗的活儿,源数据格式五花八门,有JSON、CSV,还有些半结构化的日志文本,处理逻辑里又夹杂着不少需要自定义的过滤和转换规则。用原生的Apache Spark写&am…...
