当前位置：首页 > news >正文

kafka-splunk数据通路实践

news 2025/11/10 16:13:06

目的：鉴于目前网络上没有完整的kafka数据投递至splunk教程，通过本文操作步骤，您将实现kafka数据投递至splunk日志系统
在这里插入图片描述
实现思路：

创建kafka集群
部署splunk，设置HTTP事件收集器
部署connector服务
创建connector任务，将kafka主题消息通过connector投递到splunk

测试环境：

测试使用的操作系统为centos7.5_x86_64
文章提供了两种部署方式，分别是单机部署和容器化部署
单机部署使用的主机来自腾讯云-cvm产品（腾讯云CVM），1台4c8g（如果条件允许，建议使用3台2c4g主机，分别部署kafka、connector、splunk，钱包有限，这里只是教程，不讲究这些）
上述云主机，已安装JDK8及以上版本
容器化部署使用的k8s集群来自腾讯云TKE，可以一键部署k8s集群，欢迎体验～

一、部署splunk

●splunk是一款收费软件，如果每天的数据量少于500M，可以使用Splunk提供的免费License，但不能用安全，分布式等高级功能。
部署步骤如下：

部署方式1：容器部署：

安装并启动docker（k8s集群节点可免除此步骤）：

yum install docker -y
systemctl start docker

获取splunk镜像：

# https://hub.docker.com/r/splunk/splunk/tags
docker pull splunk/splunk

【非必须，3和4选一个】启动splunk容器，设置为自动接受lic，设置密码：

docker run -d -p 8000:8000 -e "SPLUNK_START_ARGS=--accept-license" -e "SPLUNK_PASSWORD=你的密码"  -p 8088:8088 --name splunk splunk/splunk:latest

【非必须，3和4选一个】在k8s中以工作负载方式部署splunk，这将为你创建一个splunk-ns命名空间，并创建deployment类型的工作负载部署splunk，以及一个LB类型的service，请根据你的需要修改命名空间、镜像、密码、端口：

vi splunk-deployment.yaml

apiVersion: v1
kind: Namespace
metadata:name: splunk-ns---apiVersion: apps/v1
kind: Deployment
metadata:name: splunknamespace: splunk-ns
spec:replicas: 1selector:matchLabels:app: splunktemplate:metadata:labels:app: splunkspec:containers:- name: splunkimage: splunk/splunk:latestports:- containerPort: 8000- containerPort: 8088env:- name: SPLUNK_START_ARGSvalue: "--accept-license"- name: SPLUNK_PASSWORDvalue: "你的密码"volumeMounts:- name: splunk-datamountPath: /opt/splunk/varvolumes:- name: splunk-dataemptyDir: {}---apiVersion: v1
kind: Service
metadata:name: splunknamespace: splunk-ns
spec:selector:app: splunkports:- name: httpport: 8000targetPort: 8000- name: mgmtport: 8088targetPort: 8088type: LoadBalancer

打开浏览器，访问splunk的地址:8000，预期可以看到splunk的页面。用户名/密码：admin/你的密码

部署方式2：单机部署：

注册账号并获取splunk下载链接：https://www.splunk.com/en_us/download/splunk-enterprise.html ⚠️
解压缩

# 解压到/opt
tar -zxvf splunk-8.0.8-xxzx-Linux-x86_64.tgz -C /opt

启动splunk，接受许可

cd /opt/splunk/bin/
./splunk start --accept-license  //启动，并自动接收许可

输入自定义用户名、密码

其他命令参考：

./splunk start   //启动splunk
./splunk restart   //重启splunk
./splunk status    //查看splunk状态
./splunk version   //查看splunk版
#卸载
./splunk disable boot-start //关闭自启动
./splunk stop //停止splunk
/opt/splunk/bin/rm–rf/opt/splunk //移除splunk安装目录

splunk安装之后，默认开启Splunk Web端口8000。我们访问8000端口
●ps：Splunkd端口8089为管理端口

在这里插入图片描述
至此，splunk部署成功

二、配置Splunk HTTP 事件收集器

在splunk中配置HTTP 事件收集器：
a. 进入splunk web页面，点击右上角【设置】-【数据输入】

b. 选择HTTP事件收集器，点击【全局设置】，启用标记，HTTP端口为8088，点击【保存】

c. 点击右上角【新建标记】，新建HTTP事件收集器，填写：

填写名称：splunk_kafka_connect_token，点击【下一步】；
新建来源类型“splunk_kafka_data”，新建索引“splunk_kafka_index”，点击【检查】；
提交；
随后，在设置-数据输入-HTTP事件收集器页面，将得到一个token，记录此token

三、启动kafka并生产消息

启动kafka实例
a. 安装jdk

yum install java -y

b. 下载kafka：https://kafka.apache.org/downloads，以2.12版本为例
在这里插入图片描述

c.解压

tar -zxvf kafka_2.12-3.6.1.tgz

d.启动zookeeper

cd kafka_2.12-3.6.1/
./bin/zookeeper-server-start.sh -daemon config/zookeeper.properties

e.启动kafka

./bin/kafka-server-start.sh config/server.properties &

在这里插入图片描述

f.创建topic，假设叫topic0

./bin/kafka-topics.sh --create --bootstrap-server localhost:9092 --replication-factor 1 --partitions 1 --topic topic0

在这里插入图片描述

g.使用生产者发送若干条消息

./bin/kafka-console-producer.sh --broker-list localhost:9092 --topic topic0

在这里插入图片描述

h.消费

./bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --from-beginning --topic topic0

在这里插入图片描述
至此，kafka启动成功

三、使用splunk for kafka connector实现splunk与kafka数据通路

github上下载splunk for kafka connector的latest jar，下载地址：https://github.com/splunk/kafka-connect-splunk，在执行以下操作前请仔细阅读github上的redame，因为随着版本更新，配置或许会改变
配置splunk for kafka connector
a.此步骤将完成kafka connector服务。返回带有kafka sdk的主机（注意，这里我只有一台测试机，但是如果你是多台主机分别部署kafka、connector的背景下，这里返回的不是kafka集群主机，我们要创建connector服务，kafka sdk是带有connector的配置的），编辑kafka_2.12-3.6.1/config/connect-distributed.properties
参数说明：
注意：rest.advertised.host.name和rest.advertised.port在不同的kafka版本中参数名不同，以connect-distributed.properties原文档参数为准;StringConverter表示日志格式为string，若日志为其他格式，请参考官方文档

# 将10.0.0.0:19000替换为你的kafka地址
bootstrap.servers=10.0.0.0:19000
group.id=test-splunk-kafka-connector
# 假设消息是string类型，格式不对splunk就不能解析日志
key.converter=org.apache.kafka.connect.storage.StringConverter
value.converter=org.apache.kafka.connect.storage.StringConverter
key.converter.schemas.enable=false
value.converter.schemas.enable=false
# 换为connector的地址
rest.advertised.host.name=10.1.1.1
rest.advertised.port=8083
#指定splunk-kafka-connector.jar所在目录
plugin.path=/usr/local/bin/

启动conncetor：

cd kafka_2.12-3.6.1/
./bin/connect-distributed.sh config/connect-distributed.properties

验证splunk connector：

# curl http://「connector ip」:8083/connector-plugins
curl http://10.1.1.1:8083/connector-plugins

预期出现这个字段，表示splunk connector已经启动了：{“class”:“com.splunk.kafka.connect.SplunkSinkConnector”,“type”:“sink”,“version”:“v2.2.0”}
在这里插入图片描述

创建connector任务，替换10.1.1.1为您的kafka connector地址10.0.0.0为您的splunk地址，token为splunk事件收集器的token，topics替换为您的kafka topic

curl 10.1.1.1:8083/connectors -X POST -H "Content-Type: application/json" -d'{"name": "splunk-kafka-connect-task","config": {"connector.class": "com.splunk.kafka.connect.SplunkSinkConnector","tasks.max": "3","topics": "topic0","splunk.indexes": "splunk_kafka_index","splunk.hec.uri":"https://10.0.0.0:8088","splunk.hec.token": "b4594xxxxxx","splunk.hec.ack.enabled" : "false","splunk.hec.raw" : "false","splunk.hec.json.event.enrichment" : "org=fin,bu=south-east-us","splunk.hec.ssl.validate.certs": "false","splunk.hec.track.data" : "true"}
}'

预期返回：
在这里插入图片描述

进入splunk 主页-search&reporting
在搜索栏填写：index="splunk_kafka_index"验证index中的数据，预期能查看到我们生产的消息

至此，kafka-splunk已打通

kafka-splunk数据通路实践

目的： 鉴于目前网络上没有完整的kafka数据投递至splunk教程，通过本文操作步骤，您将实现kafka数据投递至splunk日志系统实现思路： 创建kafka集群部署splunk，设置HTTP事件收集器部署connector服务创建connector任务&a…...

编程日记 2024/2/6 18:41:22

C语言第十九弹---指针(三)

✨个人主页： 熬夜学编程的小林 💗系列专栏： 【C语言详解】【数据结构详解】指针 1、数组名的理解 2、使用指针访问数组 3、⼀维数组传参的本质 4、冒泡排序 5、二级指针 6、指针数组 7、指针数组模拟二维数组总结 1、数组名的理解…...

编程日记 2024/2/6 18:31:13

TCP/IP LWIP FPGA 笔记

参考资料： 正点原子 LwIP 之网络接口 netif（ethernetif.c、netif.c）-CSDN博客 IPv4/IPv6、DHCP、网关、路由_ipv6有网关的概念吗-CSDN博客 TCP/IP TCP/IP 协议中文名为传输控制协议/因特网互联协议，又名网络通讯协议&#xf…...

编程日记 2024/2/6 18:30:12

2024年海外优青项目申报指南

国家自然科学基金优秀青年科学基金（海外）项目（简称“海外优青项目”），一直备受海外优秀青年学者（包括博士后研究人员）关注，被看作是回国发展最为重要的资助项目之一。知识人网小编现…...

编程日记 2024/2/6 18:26:08

threejs之常用贴图

在三维图形和游戏开发中，高光贴图、凹凸贴图、法线贴图和环境光遮蔽贴图是常用的技术，用于增加虚拟物体表面的细节和真实感，而无需增加更多的几何体。这些技术可以帮助开发者和艺术家创造出既详细又性能高效的场景。高光贴图（Sp…...

编程日记 2024/2/6 18:25:07

Unity类银河恶魔城学习记录3-1 EnemyStateMachine源代码 P47

Alex教程每一P的教程原代码加上我自己的理解初步理解写的注释，可供学习Alex教程的人参考此代码仅为较上一P有所改变的代码【Unity教程】从0编程制作类银河恶魔城游戏_哔哩哔哩_bilibili Enemy.cs using System.Collections; using System.Collections.Generic;…...

编程日记 2024/2/6 18:24:06

使用webstorm调试vue 2 项目

学习目标： 使用webstorm调试vue 2 项目笔者环境： npm 6.14.12 webstorm 2023.1 vue 2 学习内容： 例如： 正常启动npm 项目配置javaScruot dubug 配置你的项目地址就好使用dubug运行你配置的调式页问题如果进入了js页无…...

编程日记 2024/2/6 18:23:05

深度学习缝模块怎么描述创新点？(附写作模板+涨点论文)

深度学习缝了别的模块怎么描述创新点、怎么讲故事写成一篇优质论文？ 简单框架：描述自己这个领域，该领域出现了什么问题，你用了什么方法解决，你的方法有了多大的性能提升。其中，重点讲清楚这两点&#xf…...

编程日记 2024/2/6 18:21:03

html,css,js速成

准备：vscode配好c，python，vue环境，并下载live server插件。 1. html hypertext markup language(超文本标记语言) 1. 基础语法一个html元素由开始标签，填充文本，结束标签构成。常见标签说明<b>…...

编程日记 2024/2/6 18:16:59

《Docker极简教程》--Docker基础--基础知识（一）

在这篇文章中我们先大致的了解以下Docker的基本概念，在后续的文章中我们会详细的讲解这些概念以及使用。一、容器(Container) 1.1 容器的定义和特点容器的定义容器是一种轻量级、可移植的软件打包技术，用于打包应用及其依赖项和运行环境&#xff0c…...

编程日记 2024/2/6 18:13:56

Web html和css

目录 1 前言2 HTML2.1 元素(Element)2.1.1 块级元素和内联(行级)元素2.1.2 空元素 2.2 html页面的文档结构2.3 常见标签使用2.3.1 注释2.3.2 标题2.3.3 段落2.3.4 列表2.3.5 超链接2.3.6 图片2.3.7 内联(行级)标签2.3.8 换行 2.4 属性2.4.1 布尔属性 2.5 实体引用2.6 空格2.7 D…...

编程日记 2024/2/6 18:12:55

Three.js学习6：透视相机和正交相机

一、相机相机 camera，可以理解为摄像机。在拍影视剧的时候，最终用户看到的画面都是相机拍出来的内容。 Three.js 里，相机 camera 里的内容就是用户能看到的内容。从这个角度来看，相机其实就是用户的视野，就像用户的眼…...

编程日记 2024/2/6 18:04:46

❤ React18 环境搭建项目与运行（地址已经放Gitee开源）

❤ React项目搭建与运行环境介绍 node v20.11.0 react 18.2 react-dom 18.2.0一、React环境搭建第一种普通cra搭建 1、检查本地环境 node版本 18.17.0 检查node和npm环境 node -v npm -v 2、安装yarn npm install -g yarn yarn --version 3、创建一个新的React项目…...

编程日记 2024/2/6 18:02:45

2024 RTE行业（实时互动行业）人才发展学习总结

解决方案人才画像开发者人才素质要求： 具备多个领域的技术知识注重团队合作，具备协作能力以用户为导向的用户体验意识具备创新思维和解决问题的能力需快速响应行业变化和持续的学习能力具备项目管理能力学习和吸收新知识的渠道 RTE人才分类...

编程日记 2024/2/6 18:01:43

92.网游逆向分析与插件开发-游戏窗口化助手-显示游戏数据到小助手UI

内容参考于：易道云信息技术研究院VIP课上一个内容：游戏窗口化助手的UI设计-CSDN博客码云地址（游戏窗口化助手分支）：https://gitee.com/dye_your_fingers/sro_-ex.git 码云版本号：e8116af3a7b0186adba…...

编程日记 2024/2/6 17:59:41

Stable Diffusion 模型下载：majicMIX fantasy 麦橘幻想

文章目录模型介绍生成案例案例一案例二案例三案例四案例五案例六案例七案例八案例九案例十下载地址模型介绍非常推荐的一个非常绚丽、充满幻想的大模型，由国人“Merjic”发布，下载量颇高。这个模型风格炸裂，远距离脸部需要inpaint以达成…...

编程日记 2024/2/6 17:56:38

docker compose安装minio

要使docker-compose管理的容器（如MinIO）在系统启动时自动启动，你需要使用Docker的重启策略。在你的docker-compose.yml文件中为MinIO服务添加restart策略即可实现这一目标。restart: always指令确保了在容器退出时总是重新启动容器&#xff0…...

编程日记 2024/2/6 17:54:34

二、SSM 整合配置实战

本章概要依赖整合和添加控制层配置编写(SpringMVC 整合)业务配置编写(AOP/TX 整合)持久层配置编写(MyBatis 整合)容器初始化配置类整合测试 2.1 依赖整合和添加数据库准备数据库脚本 CREATE DATABASE mybatis-example;USE mybatis-example;CREATE TABLE t_emp(emp_id INT…...

编程日记 2024/2/6 17:53:34

『运维备忘录』之 Yum 命令详解

运维人员不仅要熟悉操作系统、服务器、网络等只是，甚至对于开发相关的也要有所了解。很多运维工作者可能一时半会记不住那么多命令、代码、方法、原理或者用法等等。这里我将结合自身工作，持续给大家更新运维工作所需要接触到的知识点，希望大…...

编程日记 2024/2/6 17:49:30

CSS中可继承与不可继承属性有哪些

一、无继承性的属性 1.display：规定元素应该生成的框的类型属性值作用none元素不显示，并且会从文档流中移除。block块类型。默认宽度为父元素宽度，可设置宽高，换行显示。inline行内元素类型。默认宽度为内容宽度，不…...

编程日记 2024/2/6 17:48:29

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向深度学习与微纳光子学的结合主要集中在以下几个方向： 逆向设计通过神经网络快速预测微纳结构的光学响应，替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。特征提取与优化从复杂的光学数据中自…...

编程新知 2025/11/8 12:28:27

多模态2025：技术路线“神仙打架”，视频生成冲上云霄

文｜魏琳华编｜王一粟一场大会，聚集了中国多模态大模型的“半壁江山”。智源大会2025为期两天的论坛中，汇集了学界、创业公司和大厂等三方的热门选手，关于多模态的集中讨论达到了前所未有的热度。其中，…...

编程新知 2025/11/10 3:59:31

Linux 文件类型，目录与路径，文件与目录管理

文件类型后面的字符表示文件类型标志普通文件：-（纯文本文件，二进制文件，数据格式文件） 如文本文件、图片、程序文件等。目录文件：d（directory） 用来存放其他文件或子目录。设备…...

编程新知 2025/11/7 10:17:55

FastAPI 教程：从入门到实践

FastAPI 是一个现代、快速（高性能）的 Web 框架，用于构建 API，支持 Python 3.6。它基于标准 Python 类型提示，易于学习且功能强大。以下是一个完整的 FastAPI 入门教程，涵盖从环境搭建到创建并运行一个简单的…...

编程新知 2025/10/16 7:51:26

基于当前项目通过npm包形式暴露公共组件

1.package.sjon文件配置其中xh-flowable就是暴露出去的npm包名 2.创建tpyes文件夹，并新增内容 3.创建package文件夹...

编程新知 2025/11/8 3:51:02

基础测试工具使用经验

背景 vtune，perf, nsight system等基础测试工具，都是用过的，但是没有记录，都逐渐忘了。所以写这篇博客总结记录一下，只要以后发现新的用法，就记得来编辑补充一下 perf 比较基础的用法： 先改这…...

编程新知 2025/9/18 15:40:29

Python 包管理器 uv 介绍

Python 包管理器 uv 全面介绍 uv 是由 Astral（热门工具 Ruff 的开发者）推出的下一代高性能 Python 包管理器和构建工具，用 Rust 编写。它旨在解决传统工具（如 pip、virtualenv、pip-tools）的性能瓶颈，同时…...

编程新知 2025/8/16 15:34:02

论文笔记——相干体技术在裂缝预测中的应用研究

目录相关地震知识补充地震数据的认识地震几何属性相干体算法定义基本原理第一代相干体技术：基于互相关的相干体技术（Correlation）第二代相干体技术：基于相似的相干体技术（Semblance）基于多道相似的相干体…...

编程新知 2025/11/7 21:05:30

基于TurtleBot3在Gazebo地图实现机器人远程控制

1. TurtleBot3环境配置 # 下载TurtleBot3核心包 mkdir -p ~/catkin_ws/src cd ~/catkin_ws/src git clone -b noetic-devel https://github.com/ROBOTIS-GIT/turtlebot3.git git clone -b noetic https://github.com/ROBOTIS-GIT/turtlebot3_msgs.git git clone -b noetic-dev…...

编程新知 2025/11/7 21:07:33

【C++特殊工具与技术】优化内存分配(一)：C++中的内存分配

目录一、C 内存的基本概念 1.1 内存的物理与逻辑结构 1.2 C 程序的内存区域划分二、栈内存分配 2.1 栈内存的特点 2.2 栈内存分配示例三、堆内存分配 3.1 new和delete操作符 4.2 内存泄漏与悬空指针问题 4.3 new和delete的重载四、智能指针…...

编程新知 2025/11/8 5:25:23

一、部署splunk

部署方式1：容器部署：

部署方式2：单机部署：

二、配置Splunk HTTP 事件收集器

三、启动kafka并生产消息

三、使用splunk for kafka connector实现splunk与kafka数据通路

相关文章：