当前位置：首页 > news >正文

ELK日志分析--Logstash

news 2026/5/27 10:47:11

Logstash简介
Logstash安装
测试运行
配置输入和输出
使用Geoip过滤器插件增强数据编辑
配置接收 Beats 的输入

1.Logstash简介

Logstash管道具有两个必需元素input和output，以及一个可选元素filter。输入插件使用来自源的数据，过滤器插件根据你的指定修改数据，输出插件将数据写入目标。

2.Logstash安装

参考官方网站：https://www.elastic.co/guide/en/logstash/current/index.html

# curl -OL https://artifacts.elastic.co/downloads/logstash/logstash-7.13.2-linux-x86_64.tar.gz

# tar -xf logstash-7.13.2-linux-x86_64.tar.gz -C /usr/local/

# mv /usr/local/logstash-7.13.2/ /usr/local/logstash

3.测试运行

运行最基本的Logstash管道来测试Logstash安装。

进入 Logstash 的安装主目录下执行：

/usr/local/logstash/bin/logstash -e ''

-e 选项用于设置 Logstash 处理数据的输入和输出

-e ''  等同于 -e input { stdin { type => stdin } } output { stdout { codec => rubydebug } }

input { stdin { type => stdin } }

        表示 Logstash 需要处理的数据来源来自于标准输入设备

output { stdout { codec => rubydebug } }

        表示 Logstash 把处理好的数据输出到标准输出设备

稍等片刻，当看到屏幕上输出如下字样，即可尝试使用键盘输入 hello 字样

message 字段对应的值是 Logstash 接收到的一行完整的数据

@version 是版本信息，可以用于建立索引使用

@timestamp 处理此数据的时间戳，可以用于建立索引和搜索

type 就是之前 input 中设置的值，这个值可以任意修改，但是，type 是内置的变量，不能修改，用于建立索引和条件判断等

hosts 表示从那个主机过来的数据

修改 type 的值为 nginx 的示例：

./bin/logstash -e "input { stdin { type => nginx } } output { stdout { codec => rubydebug } }"

4.配置输入和输出

4.1 概述

生产中，Logstash管道要复杂一些：它通常具有一个或多个输入，过滤器和输出插件。

本部分中，将创建一个Logstash管道，该管道使用标准输入来获取Apache Web日志作为输入，解析这些日志以从日志中创建特定的命名字段，然后将解析的数据输出到标准输出（屏幕上）。并且这次无需在命令行上定义管道配置，而是在配置文件中定义管道。

4.2 创建并编写配置文件

创建任意一个文件，并写入如下内容，作为 Logstash 的管道配置文件

# vim /usr/local/logstash/config/first-pipeline.conf

input {
stdin { }
}
output {
stdout {}
}

配置文件语法测试：

bin/logstash -f config/first-pipeline.conf --config.test_and_exit

-f 用于指定管道配置文件。

4.3 启动并测试

运行如下命令启动 Logstash：

bin/logstash -f config/first-pipeline.conf

启动后复制如下内容到命令行中，并按下回车键：

83.149.9.216 - - [04/Jan/2015:05:13:42 +0000] "GET /presentations/logstash-monitorama-2013/imageskibana-search.png HTTP/1.1" 200 203023 "http://semicomplete.com/presentations/logstash-monitorama-2013/" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1700.77 Safari/537.36"

4.4 使用Grok过滤器插件解析Web日志

（一）概述

现在有了一个工作管道，但是日志消息的格式不是理想的。你想解析日志消息,以便能从日志中创建特定的命名字段。为此，应该使用grok 过滤器插件。

使用grok过滤器插件，可以将非结构化日志数据解析为结构化和可查询的内容。

grok 会根据你感兴趣的内容分配字段名称，并把这些内容和对应的字段名称进行绑定。

grok 如何知道哪些内容是你感兴趣的呢？它是通过自己预定义的模式来识别感兴趣的字段的。这个可以通过给其配置不同的模式来实现。

这里使用的模式是 %{COMBINEDAPACHELOG}

{COMBINEDAPACHELOG} 使用以下模式从Apache日志中构造行：

原信息对应新的字段名称
IP 地址 clientip
用户 ID ident
用户认证信息 auth
时间戳 timestamp
HTTP 请求方法 verb
请求的 URL request
HTTP 版本 httpversion
响应码 response
响应体大小 bytes
跳转来源 referrer
客户端代理（浏览器） agent
关于 grok 更多的用法请参考:

https://www.elastic.co/guide/en/logstash/7.10/plugins-filters-grok.html

原信息	对应新的字段名称
IP 地址	clientip
用户 ID	ident
用户认证信息	auth
时间戳	timestamp
HTTP 请求方法	verb
请求的 URL	request
HTTP 版本	httpversion
响应码	response
响应体大小	bytes
跳转来源	referrer
客户端代理（浏览器）	agent

（二）修改配置文件之后自动加载日志文件

并且这里要想实现修改配置文件之后自动加载它，不能配置 input 为 stdin。所以，这里使用了 file ，创建示例日志文件：

# vim /var/log/httpd.log

83.149.9.216 - - [04/Jan/2015:05:13:42 +0000] "GET /presentations/logstash-monitorama-2013/imageskibana-search.png HTTP/1.1" 200 203023 "http://semicomplete.com/presentations/logstash-monitorama-2013/" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1700.77 Safari/537.36"

4.5 确保没有缓存数据

[root@logstash file]# pwd
/usr/local/logstash/data/plugins/inputs/file
[root@logstash file]# ls -a
. .. .sincedb_aff270f7990dabcdbd0044eac08398ef
[root@logstash file]# rm -rf .sincedb_aff270f7990dabcdbd0044eac08398ef

4.6 修改好的管道配置文件如下：

# vim /usr/local/logstash/config/first-pipeline.conf

#注释方法#####
input {
file {
path => ["/var/log/httpd.log"]
start_position => "beginning"
}
}

filter {
grok { # 对 web 日志进行过滤处理，输出结构化的数据
# 在 message 字段对应的值中查询匹配上 COMBINEDAPACHELOG
match => { "message" => "%{COMBINEDAPACHELOG}" } }
}

output {
stdout {}
}

match => { "message" => "%{COMBINEDAPACHELOG}"} 的意思是：

当匹配到 "message" 字段时，用户模式 "{COMBINEDAPACHELOG}" 进行字段映射。

配置完成后，再次进行验证：

# /usr/local/logstash/bin/logstash -f config/first-pipeline.conf

发现原来的非结构化数据，变为结构化的数据了。

原来的 message 字段仍然存在，假如你不需要它，可以使用 grok 中提供的常用选项之一： remove_filed 来移除这个字段。

（一）remove_field 可以移除任意的字段

remove_field 可以移除任意的字段，它可以接收的值是一个数组。

rename可以重新命名字段

修改后管道配置文件如下：

input {
file {
path => ["/var/log/httpd.log"]
start_position => "beginning"
}
}

filter {
grok {
match => { "message" => "%{COMBINEDAPACHELOG}" } }
mutate {
#重写字段
rename => {
"clientip" => "cip"
}
}
mutate {
#去掉没用字段
remove_field => ["message","input_type","@version","fields"]
}
}

output {
stdout {}
}

再次测试并观察：

发现 message 不见了,而且clientip重命名成了cip

5.使用Geoip过滤器插件增强数据编辑

5.1 概述

除解析日志数据以进行更好的搜索外，筛选器插件还可以从现有数据中获取补充信息。例如，geoip 插件可以通过查找到IP地址，并从自己自带的数据库中找到地址对应的地理位置信息，然后将该位置信息添加到日志中。

该geoip插件配置要求您指定包含IP地址来查找源字段的名称。在此示例中，该clientip字段包含IP地址。

geoip {
source => "clientip"
}

由于过滤器是按顺序求值的，因此请确保该geoip部分位于grok配置文件的该部分之后，并且grok和geoip部分都嵌套在该filter部分中。

5.2 配置文件并测试观察

完成后的管道配置文件如下：

input {
file {
path => ["/var/log/httpd.log"]
start_position => "beginning"
}
}

filter {
grok {
match => { "message" => "%{COMBINEDAPACHELOG }" }
}
geoip { source => "clientip" }
}

output {
stdout {}
}

再次输入之前的日志内容，就会看到如下输出----"country_code3" => "RU"：

详情请参考：

https://www.elastic.co/guide/en/logstash/7.10/plugins-filters-grok.html

https://www.elastic.co/guide/en/logstash/7.10/plugins-filters-geoip.html

6.配置filebeat + logstash

6.1 配置接收 Beats 的输入

# vim /usr/local/logstash/config/pipeline-1.conf

# 监听 5044 端口，接收 filebeat 的输入
input {
beats {
port => 5044
}
}

filter {
grok {
match => { "message" => "%{COMBINEDAPACHELOG }" }
}
# geoip { source => "clientip" }
}

output {
stdout {}
}

运行logstash之后修改filebeat的yml文件输出目标如下：

output.logstash:
# The Logstash hosts
hosts: ["192.168.19.3:5044"]

filebeat机器清除缓存目录：

# rm -rf /usr/local/filebeat/data/

运行filebeat：

# ./filebeat

观察logstash接收到的filebeat的消息如下：

ELK日志分析--Logstash

Logstash简介 Logstash安装测试运行配置输入和输出使用Geoip过滤器插件增强数据编辑配置接收 Beats 的输入 1.Logstash简介 Logstash管道具有两个必需元素input和output，以及一个可选元素filter。输入插件使用来自源的数据，过滤器插件根据你的…...

编程日记 2023/2/23 20:28:23

Mysql插入数据从指定选项中随机选择、插入时间从指定范围随机生成、Navicat使用存储过程模拟插入测试数据

场景 Navicat通过存储过程批量插入mysql数据： Navicat通过存储过程批量插入mysql数据_霸道流氓气质的博客-CSDN博客上面使用过Navicat借助存储过程批量插入数据。但是插入数据是固定的 insert语句，如果在本地开发时需要模拟插入一些随机数据(从指定…...

编程日记 2023/2/23 20:27:12

【基础算法】关于高精度计算的问题【很高位数数据的加减乘除(相关代码用C++实现)】

文章目录前言1.高精度加法2.高精度减法3.高精度乘法4.高精度除法写在最后前言当我们在利用计算机进行一些计算时，可能会遇到这类问题 ： 有些计算要求精度高，希望计算的数的位数可达几十位甚至几百位，虽然计算机的计算精度也算较…...

编程日记 2023/2/23 20:26:03

事理知识图谱

事理知识图谱能够有力第建模各类事件之间的演化关联关系为事理逻辑推理提供更好的数据基础。事理图谱定义事理知识图谱可以将文本中对事件以及事件之间的关系抽取并抽象出来，构建成一个有向图形式的事理知识库。在结构上，事理知识图谱是一个有向有环…...

编程日记 2023/2/23 20:24:57

多綫程之python爬蟲構建

目录多綫程定義簡介原理优点缺点优势代碼框架實現導包打印類爬蟲類構造方法獲取代理設置headers獲取新session獲取源代碼解析網頁解析子頁面保存數據綫程任務得到url啓動多綫程爬蟲總結多綫程以下定義來自百度百科，看看就好沒仔細寫定義多线程（mul…...

编程日记 2023/2/23 20:23:47

【干货】Redis在Java开发中的基本使用和巧妙用法

Redis是一款高性能的内存数据结构存储系统，能够支持多种数据结构类型，如字符串、哈希、列表、集合、有序集合等，也能够支持高级功能，如事务、发布/订阅、Lua脚本等，具有高可用性、高并发性和可扩展性的优点。在Java开发…...

编程日记 2023/2/23 20:22:35

历时半年，我终于阿里上岸了，附面经和Java非科班学习心得

个人经历本科双非化学，跨考了电子硕士，研究生依然双非。无互联网实习，无比赛无论文。（研究生研究方向是车辆电子和楼宇自动化，有自动化和高校实训讲师相关的实习经历） 21年11开始学Java准备秋招。阿里上…...

编程日记 2023/2/23 20:21:29

ArkUI实战，自定义饼状图组件PieChart

本节笔者带领读者实现一个饼状图 PieChart 组件，该组件是根据笔者之前封装的 MiniCanvas 实现的， PieChart 的最终演示效果如下图所示： 饼状图实现的拆分根据上图的样式效果，实现一个饼状图，实质就是绘制一个个的实…...

编程日记 2023/2/23 20:20:24

工作实战之系统交互api调用认证设计

目录前言一、黄金段位接口交互二、钻石段位接口交互设计 1.接口文档定义 2.工具类以及demo提供 a.调用方部分代码 b.被调用方三.星耀段位接口访问设计 1.在钻石段位的基础上，进行sdk的封装 a.maven引入 b.sdk包含工具类四.王者段位接口访问设计 1.开发详情 2.…...

编程日记 2023/2/23 20:19:14

学习系统编程No.5【虚拟地址空间】

引言: 北京时间：2023/2/22，离补考期末考试还有5天，不慌，刚午觉睡醒，闹钟2点20，拖到2点50，是近以来，唯一一次有一种睡不醒的感觉，但是现在却没有精神，因为听了…...

编程日记 2023/2/23 20:18:07

Linux常用指令（未完待续。。。）

* basename：只留下路径的“最后一部分” X、文件夹&目录操作复制 ：cp /xxx /xxx - a 该选项通常在拷贝目录时使用。它保留链接、文件属性，并递归地拷贝目录，其作用等于dpR选项的组合； - d 拷贝时保留链接&#…...

编程日记 2023/2/23 20:16:59

用D写裸机

原文用D编写裸机RISC-V应用这篇文章展示,如何用D编写,目标为RISC-VQEMU模拟器的程序裸机"你好".项目为什么是D? 我最近一直在用C编写裸机代码,我有点对C缺乏特征感到沮丧.D引入了叫betterC的模式(基本上禁止了D运行时的所有语言功能).使得D裸机编程大致与C一…...

编程日记 2023/2/23 20:15:50

(二十五)、实现评论功能（5）【uniapp+uinicloud多用户社区博客实战项目(完整开发文档-从零到完整项目)】

1，实现二级回复的入库操作 1.1 两个子组件（comment-item和comment-frame）与父组件reply之间的属性传值 comment-item： props: {item: {type: Object,default () {return {}}}},comment-frame： props: {commentObj: {…...

编程日记 2023/2/23 20:14:44

【概念辨析】二维数组传参的几种可能性

一、二维数组传参竟然不是用二级指针进行接收？ 今天进行再一次的二级指针学习时，发现了一条以前没怎么注意过的知识点：二维数组进行传参只能用二维数组（不能省略列）进行接收或者是数组指针。问题复现代码如下&#xf…...

编程日记 2023/2/23 20:13:37

python和C++代码实现图片九宫格切图程序（附VS2015配置Opencv教程）

1、python代码实现图片分割成九宫格需要包含的库，没有下载安装的，需要自己安装哦。实现原理很简单，就是用PIL库不断画小区域，切下来存储成新的小图片。假设每一个格子的宽和高分别是w、h，那么第row行&#xff08…...

编程日记 2023/2/23 20:12:31

【深度学习】优化器

1.什么是优化器优化器是在深度学习的反向传播过程中，指引损失函数（目标函数）的各个参数往正确的方向更新合适的大小，使得更新后的各个参数让目标函数不断逼近全局最小点。 2.优化器 2-1 BGD 批量梯度下降法，是梯度下…...

编程日记 2023/2/23 20:11:24

SpringBoot使用validator进行参数校验

Validated、Valid和BindingResultBean Validation是Java定义的一套基于注解的数据校验规范，比如Null、NotNull、Pattern等，它们位于 javax.validation.constraints这个包下。hibernate validator是对这个规范的实现，并增加了一些其他校验注解…...

编程日记 2023/2/23 20:10:17

论文复现：风电、光伏与抽水蓄能电站互补调度运行（MATLAB-Yalmip全代码）

论文复现：风电、光伏与抽水蓄能电站互补调度运行（MATLAB-Yalmip全代码）针对风电、光伏与抽水蓄能站互补运行的问题，已有大量通过启发式算法寻优的案例，但工程上更注重实用性和普适性。Yalmip工具箱则是一种基于MATLAB平台的优化软件工具箱,被广泛应用于工程界优化问题和…...

编程日记 2023/2/23 20:09:12

FastCGI sent in stderr: ＂PHP message: PHP Fatal error

服务器php7.2卸载安装7.4之后,打开网站一直无法访问,查看nginx错误日志发现一直报这个错误:2023/02/23 11:12:55 [error] 4735#0: *21 FastCGI sent in stderr: ＂PHP message: PHP Fatal error: Uncaught ReflectionException: Class translator does not exist in …...

编程日记 2023/2/23 20:08:06

【数字IC基础】跨时钟域（CDC，Clock Domain Crossing）

文章目录一、什么是跨时钟域？二、跨时钟域传输的问题？2、1 亚稳态（单bit：两级D触发器（双DFF））2、2 数据收敛（多bit亚稳态）（格雷码编码、握手协议、异步FIFO、DMUX）2、3 多路扇出：（先同步后扇出）2、4 数据丢失（延长输入数据信号）：类似脉冲展宽2、5 异步复位（…...

编程日记 2023/2/23 20:07:00

AI智能体到底强在哪？为什么大家开始从“养龙虾”转向“养马”

那么AI智能体的核心能力是什么？ 1、理解需求它能分析你的真实意图，而不是只看表面的文字，比如让它整理这个月的消费情况，它明白之后，会读取账单，做分类统计，生成总结，最后输出图表。…...

编程新知 2026/5/26 2:55:48

echarts中heatmap鼠标滚动禁用缩放，向下滚动

配置如下效果如下...

编程新知 2026/5/26 1:33:08

独立站内容分层：一层给 SEO，一层给 GEO

你的内容在喂两个完全不同的"阅读者" 你的博客文章，从来都不只有一个读者。传统认知里，独立站内容的读者只有两类：真人访客和搜索引擎爬虫。SEO 优化的一切工作，本质上都是在讨好后者，顺带服务前者。但…...

编程新知 2026/5/25 23:41:43

2026长沙智能家居品牌实测，这些本地老牌值得选

2026年，长沙的智能家居市场已经从“概念热”转向“落地战”。我走访了长沙多个本地服务商，实测了不同品牌在别墅、酒店、大平层等场景的真实表现。今天，结合数据与案例，分享几个值得关注的本地品牌，尤其是深耕8年以上的…...

编程新知 2026/5/25 23:23:01

为什么鸿蒙 App 最终都会走向状态驱动？

子玥酱 （掘金 / 知乎 / CSDN / 简书同名） 大家好，我是子玥酱，一名长期深耕在一线的前端程序媛 👩‍💻。曾就职于多家知名互联网大厂，目前在某国企负责前端软件研发相关工作，主要聚…...

编程新知 2026/5/25 23:08:49

Web渗透测试能力成长地图：从工具使用到漏洞认知跃迁

1. 这不是工具清单，而是一张Web渗透测试的“能力成长地图”你刚点开这篇文章，大概率正站在两个路口之间：一边是网上铺天盖地的“十大免费扫描器推荐”，点进去全是截图下载链接一句“一键扫漏洞”，结果装完跑两下&#…...

编程新知 2026/5/25 23:06:49

LangGraph状态机工程：构建复杂AI工作流的完整指南

传统RAG（检索增强生成）在处理简单的"单跳"问题时表现良好——“文章里提到了什么” “这个概念是什么意思”——但当问题涉及多个实体之间的关系、需要跨多个文档推理时，传统RAG就显得力不从心。GraphRAG（Graph-based R…...

编程新知 2026/5/25 22:40:34

机器学习驱动储氢材料发现：从特征工程到DFT/MD验证的完整指南

1. 项目概述与核心思路氢能被视为未来清洁能源体系的关键一环，但如何安全、高效、经济地储存氢气，一直是制约其大规模应用的瓶颈。在众多储氢技术路线中，固态储氢，特别是基于金属氢化物的储氢材料，因其高体积储氢密度和…...

编程新知 2026/5/25 22:34:33

DIY四路自动音频源切换器：从信号检测到继电器隔离的完整设计

1. 项目概述与核心需求解析作为一个喜欢在工作室里捣鼓各种音频设备的玩家，我经常遇到一个挺烦人的问题：我的功放只有一组输入，但我想接的设备却有好几个——台式电脑、平板、蓝牙接收模块，还有一台树莓派。每次想切换音源&#x…...

编程新知 2026/5/25 20:59:15

yuzu模拟器完整指南：在电脑上畅玩Switch游戏的终极解决方案

yuzu模拟器完整指南：在电脑上畅玩Switch游戏的终极解决方案【免费下载链接】yuzu 任天堂 Switch 模拟器项目地址: https://gitcode.com/GitHub_Trending/yu/yuzu 想在电脑上体验任天堂Switch游戏的魅力吗？yuzu模拟器正是你寻找的完美答案。作为…...

编程新知 2026/5/25 20:16:02

Logstash简介

Logstash安装

测试运行

配置输入和输出

使用Geoip过滤器插件增强数据编辑

配置接收 Beats 的输入