当前位置：首页 > news >正文

搭建分布式Kafka集群

news 2026/5/17 8:28:44

title: 搭建分布式Kafka集群
date: 2024-12-1 14:00:00
categories: 
- 服务器
tags:
- Kafka
- 大数据

搭建分布式Kafka集群

在主节点上安装Kafka；

Kafka使用Zookeeper服务器来存储元数据信息

本次实验环境：Centos 7-2009、Hadoop-3.1.4、JDK 8、Zookeeper-3.6.3、Kafka(2.11-2.3.1)

前提

在Kafka-2.8.0版本以前，运行Kafka需要预先安装Zookeeper
在Kafka 2.8.0版本以后，引入了Kraft（Kafka Raft）模式，可以使Kafka在不依赖外部Zookeeper的前提下运行
除此之外Kafka由Scala语言编写，而Scala语言是由JAVA语言发展而来，所以需要JVM的运行环境

功能规划

Master	Slave1	Slave2
主节点	代理服务器	代理服务器
192.168.66.6	192.168.66.7	192.168.66.21

开始安装

1. 上传Kafka服务器

首先上传/下载Kafka的文件到服务器上，或直接进行以下的下载行为

# 使用wget命令下载Kafka文件(二选一)
wget -P /tmp/ -c 'https://repo.huaweicloud.com/artifactory/apache-local/kafka/2.3.1/kafka_2.11-2.3.1.tgz'# 使用curl命令下载Kafka文件(二选一)
curl -C - 'https://repo.huaweicloud.com/artifactory/apache-local/spark/spark-3.2.1/spark-3.2.1-bin-hadoop2.7.tgz' -O /tmp/# 解压文件到指定目录
tar -zxvf /tmp/kafka_2.11-2.3.1.tgz -C /opt/module/#  重命名文件夹
mv /opt/module/kafka_2.11-2.3.1/ /opt/module/kafka

2. 配置用户环境变量

cat >>  ~/.bashrc << "EOF"# ------------------- Kafka 配置--------------------
# 设置Kafka环境变量，指向Kafka安装目录
export KAFKA_HOME=/opt/module/kafka# 将Kafka的bin目录添加到PATH环境变量
export PATH=$PATH:$KAFKA_HOME/bin
# -------------------------------------------------
EOF

-----------------------------------------------------------说明举例   export PATH=$Kafka_HOME/bin:$PATH英文冒号代表分隔这段代码表示
1. 当你输入一个命令时，shell会首先在"KAFKA_HOME"这个变量的"bin"子目录中查找，
2. 最后，若找不到，则在"PATH"的指定目录中查找-------------------------------------------------------------

3. 修改配置文件

# 创建Kafka日志目录
mkdir /opt/module/kafka/logs# 备份kafka配置文件
cp /opt/module/kafka/config/server.properties /opt/module/kafka/config/server.properties.bak# 修改Kafka的日志存储目录
sed -i 's|log.dirs=/tmp/kafka-logs|log.dirs=/opt/module/kafka/logs|' /opt/module/kafka/config/server.properties# 配置Kafka依靠指定ZooKeeper服务器进行集群管理和元数据存储
sed -i 's|zookeeper.connect=localhost:2181|zookeeper.connect=master:2181,slave1:2181,slave2:2181|' /opt/module/kafka/config/server.properties----------------------------------------------说明1. 可以使用IP地址或使用主机名，前提是配置好hosts/DNS解析
2. 根据自己的配置，修改连接的主机的信息
-----------------------------------------------

4. 同步文件

# 同步到slave1机器
scp -r /opt/module/kafka/ slave1:/opt/module/
scp  ~/.bashrc root@slave1:/root# 同步到slave2机器
scp -r /opt/module/kafka/ slave2:/opt/module/
scp  ~/.bashrc root@slave2:/root

5. 修改从节点配置

# 修改Slave1的broker-ID值
ssh slave1 "sed -i 's|broker.id=0|broker.id=1|' /opt/module/kafka/config/server.properties"# 修改Slave2的broker-ID值
ssh slave2 "sed -i 's|broker.id=0|broker.id=2|' /opt/module/kafka/config/server.properties"

6. 环境变量生效

# master节点环境变量生效
source  ~/.bashrc# slave1节点环境变量生效
ssh slave1 'source  ~/.bashrc'# slave2节点环境变量生效
ssh slave2 'source  ~/.bashrc'

安装结束

7. 前台启动一台Kafka服务器

在当前控制台前台启动Kafka，使用Ctrl``C停止kafka

# 在master节点上执行
kafka-server-start.sh $KAFKA_HOME/config/server.properties

8. 后台启动Kafka服务器集群

# 在master节点上执行
nohup $KAFKA_HOME/bin/kafka-server-start.sh $KAFKA_HOME/config/server.properties > $KAFKA_HOME/logs/nohup.out 2>&1 &# 在slave1节点上执行
ssh slave1
nohup $KAFKA_HOME/bin/kafka-server-start.sh $KAFKA_HOME/config/server.properties > $KAFKA_HOME/logs/nohup.out 2>&1 & 
exit# 在slave2节点上执行
ssh slave2 
nohup $KAFKA_HOME/bin/kafka-server-start.sh $KAFKA_HOME/config/server.properties > $KAFKA_HOME/logs/nohup.out 2>&1 & 
exit

9.查看kafka进程

master会有Kafka的进程
slave1会有Kafka的进程
slave2会有Kafka的进程

# 命令
jps

10. 停止Kafka

# 停止master节点的Kafka服务
kafka-server-stop.sh# 停止slave1节点的Kafka服务
ssh slave1 kafka-server-stop.sh# 停止slave2节点的Kafka服务
ssh slave2 kafka-server-stop.sh

参考文档

Linux 搭建 Kafka 环境 - 详细教程_linux安装kafka-CSDN博客
kafka-2.3.1版本的安装_kafka2.3.1下载-CSDN博客
JVM-合理配置堆内存_xms和xmx设置多少合适-CSDN博客
Kafka的分布式安装及基本操作-刘宇_头歌kafka安装-CSDN博客

搭建分布式Kafka集群

title: 搭建分布式Kafka集群 date: 2024-12-1 14:00:00 categories: - 服务器 tags: - Kafka - 大数据搭建分布式Kafka集群在主节点上安装Kafka； Kafka使用Zookeeper服务器来存储元数据信息本次实验环境：Centos 7-2009、Hadoop-3.1.4、JDK 8、Zookeep…...

编程日记 2024/12/20 10:44:29

【后端面试总结】深入解析进程和线程的区别

在操作系统和并发编程中，进程和线程是两个核心概念。它们各自承担着不同的职责，并在多任务处理中发挥着关键作用。本文将从定义、特性、应用场景以及优缺点等多个方面对进程和线程进行详细对比，帮助读者深入理解它们之间的区别。一、进程和…...

编程日记 2024/12/20 10:42:27

java版电子招投标采购|投标|评标|竞标|邀标|评审招投标系统源码

招投标管理系统是一款适用于招标代理、政府采购、企业采购和工程交易等领域的企业级应用平台。该平台以项目为主线，从项目立项到项目归档，实现了全流程的高效沟通和协作。通过该平台，用户可以实时共享项目数据信息，实现规范化管理…...

编程日记 2024/12/20 10:41:26

SSM 赋能 Vue 助力：新锐台球厅管理系统的设计与实现的辉煌之路

2相关技术 2.1 MYSQL数据库 MySQL是一个真正的多用户、多线程SQL数据库服务器。是基于SQL的客户/服务器模式的关系数据库管理系统，它的有点有有功能强大、使用简单、管理方便、安全可靠性高、运行速度快、多线程、跨平台性、完全网络化、稳定性等，非常适…...

编程日记 2024/12/20 10:39:24

C++ 并发专题 - C++线程同步的几种方法

一：概述线程同步是多线程编程中的一个重要概念，它用于控制多个线程之间对共享资源的访问，避免竞态条件（race condition）和数据不一致的问题。线程同步确保在多线程环境中，多个线程访问共享数据时能够按照某…...

编程日记 2024/12/20 10:38:21

使用Python脚本进行编写批量根据源IP进行查询的语句用于态势感知攻击行为的搜索

使用Python脚本进行编写批量根据源IP进行查询的语句以下根据ip-list集里面的IP地址（可以自行扩充），然后采用srcaddress "{ip}" or 的形式进行打印并存储在路径为：桌面的IOC结果.txt --------------------------代码如…...

编程日记 2024/12/20 10:37:19

Python中的zip/unzip：像拉拉链一样组合数据的艺术

今天让我们一起探讨Python中一个优雅而强大的内置功能： zip 和 unzip 。听名字就知道，它就像我们衣服上的拉链一样，能把两边的数据完美地咬合在一起。从一个有趣的例子开始想象你正在开发一个班级管理系统。每个学生都有名字、成绩和评语…...

编程日记 2024/12/20 10:35:17

数电课设·简易数字钟（Quartus Ⅱ）

忽如一夜春风来，千树万树梨花开 —— 《白雪歌诵武判官归京》岑参【唐】目录简易数字钟要点剖析： 逐步分析： 端口说明： 代码展示： 分部解释： 代码编译结果： 提醒 ： …...

编程日记 2024/12/20 10:34:16

大模型中RAG模型的检索过程是如何实现的？（附最佳实践资料）

RAG模型的检索过程主要涉及以下几个步骤： 向量化（Embedding）：首先，需要将外部知识库中的文档转换为计算机能够理解的向量形式。这一步骤通常使用预训练的嵌入模型（如BERT、GPT等）将文本转换为高…...

编程日记 2024/12/20 10:33:13

python：用 sklearn.metrics 评价 K-Means 聚类模型

sklearn 的 metrics 模块提供的聚类模型评价指标如下： ARI 评价法（兰德系数）: adjusted_rand_score AMI 评价法（相互信息）: adjusted_mutual_info_score V-measure 评分 : completeness_score FMI 评价法 : fowlkes_m…...

编程日记 2024/12/20 10:30:10

Spring依赖注入不同类型的数据

目录前言回顾注入集合 List与set集合 Map集合前言前面学习依赖注入时注入的都是对象，这里记录注入的值为集合的情况回顾在注入的时候，如果要注入的属性的值为字符串或基本数据类型，用value即可；如果要注入一个对象的…...

编程日记 2024/12/20 10:23:01

Linux大杂烩！！！

Linux 命令大全 https://www.runoob.com/linux/linux-command-manual.html Linux下打印ASCII字符 ASCII码对照表及转换器 [rootuntifa_80 ~]# printf "\x30\n" 0 [rootuntifa_80 ~]# echo -e "\u0030" 0tar、gzip 打包解压命令参考文章：ta…...

编程日记 2024/12/20 10:22:00

12.19问答解析

概述某中小型企业有四个部门，分别是市场部、行政部、研发部和工程部，请合理规划IP地址和VLAN，实现企业内部能够互联互通，同时要求市场部、行政部和工程部能够访问外网环境(要求使用OSPF协议)，研发部不能访问外网环境…...

编程日记 2024/12/20 10:08:46

C语言——实现杨氏矩阵

什么是杨氏矩阵？ 概念： 有一个数字矩阵，矩阵的每行从左到右是递增的，矩阵从上到下是递增的 eg： 1 2 3 4 5 6 7 8 9 题目： 请编写程序在这样的矩阵中查找某个数字是否存在。要求：时间复…...

编程日记 2024/12/20 10:03:40

授权模型PAM

PAM（Privileged Access Management）是一种授权模型，用于管理和控制特权用户的访问权限。PAM的目标是确保特权用户只能在需要时获得所需的特权，并且他们的活动得到适当的监控和审计。 PAM的核心思想是将特权访问权限视为一种受限的…...

编程日记 2024/12/20 10:02:39

【Leecode】子集⭐⭐

子集 [78]子集I 题目描述给你一个整数数组 nums ，数组中的元素互不相同。返回该数组所有可能的子集（幂集）。解集不能包含重复的子集。你可以按任意顺序返回解集。示例输入示例 1： 输入：nums [1, 2, 3…...

编程日记 2024/12/20 10:00:36

Linux高性能服务器编程 | 读书笔记 | 12. 多线程编程

12. 多线程编程注：博客中有书中没有的内容，均是来自黑马06-线程概念_哔哩哔哩_bilibili 早期Linux不支持线程，直到1996年，Xavier Leroy等人开发出第一个基本符合POSIX标准的线程库LinuxThreads，但LinuxThreads效率…...

编程日记 2024/12/20 9:57:32

源代码： from Crypto.Util.number import bytes_to_long, getPrime from gmpy2 import * from secret import flag m bytes_to_long(flag) p getPrime(128) q getPrime(128) n p * q e 65537 c pow(m,e,n) print(n,c) # 62193160459999883112594854240161159…...

编程日记 2024/12/20 9:55:30

解析Java中的Stream API：函数式编程与性能优化

自Java 8以来，Java语言引入了Stream API，为开发者提供了一种全新的数据处理方式。Stream API支持函数式编程风格，使得对集合、数组、IO流等数据源的操作更加简洁、直观且具有高效的性能优势。通过Stream API，我们可以在不修改原有…...

编程日记 2024/12/20 9:54:28

java简单题目练习

大家好，今天我们不学习新的内容，今天给大家分享一些简单的java算法题供大家练练手，那么我们下面就来看看。那么大家下去练习一下，我们明天继续讲解类和对象的相关知识，谢谢大家！！！...

编程日记 2024/12/20 9:52:26

nnU-Net v2实战：从零开始配置环境与训练自定义医学影像数据集

1. 环境配置：搭建nnU-Net v2的基础舞台第一次接触nnU-Net时，我踩过的最大坑就是环境配置。当时为了赶项目进度，直接用了现有的Python 3.8环境，结果在安装时各种报错，浪费了大半天时间。后来才发现，nnU-Net…...

编程新知 2026/5/17 8:28:09

解放你的游戏时间：三月七小助手——星穹铁道自动化终极指南

解放你的游戏时间：三月七小助手——星穹铁道自动化终极指南【免费下载链接】March7thAssistant 崩坏：星穹铁道全自动三月七小助手项目地址: https://gitcode.com/gh_mirrors/ma/March7thAssistant 还在为《崩坏：星穹铁道》中重复的…...

编程新知 2026/5/17 8:13:07

LC正弦波振荡器原理、设计与调试：从巴克豪森判据到电路实战

1. 从直流到交流：正弦波振荡器的核心价值与分类在电子电路的世界里，我们常常需要将稳定的直流电源，转换成特定频率和幅度的交流信号。这个看似“无中生有”的过程，正是正弦波振荡器的核心使命。无论是你手机里的无线通信模块、收音…...

编程新知 2026/5/17 5:15:22

【2026年阿里巴巴集团暑期实习- 5月16日-算法岗-第一题- 分组计数】（题目+思路+JavaC++Python解析+在线测试)

题目内容给定 nnn 个人的权值序列 a1,a2,…,ana_1,a_2,\dots,a_na...

编程新知 2026/5/17 5:02:17

告别命令行启动！在Ubuntu 20.04上为Clion创建桌面快捷方式的保姆级教程

告别命令行启动！在Ubuntu 20.04上为Clion创建桌面快捷方式的保姆级教程每次打开Clion都要在终端输入./clion.sh？作为从Windows转战Linux的开发者，这种操作简直让人抓狂。本文将彻底解决这个痛点，手把手教你用.desktop文件创建专业…...

编程新知 2026/5/17 3:10:54

基于Node.js的Markdown文档自动化转换工具：从原理到CI/CD集成实战

1. 项目概述：一个被低估的文档转换利器如果你和我一样，日常工作中需要处理大量不同格式的文档，比如把Markdown写的技术文档转成Word给产品经理看，或者把项目README转成PDF存档，那你肯定也经历过格式错乱、样式丢失的烦…...

编程新知 2026/5/17 2:47:43

基于Trinket M0与伺服电机的宠物激光护目镜DIY全攻略

1. 项目概述与核心思路给自家毛孩子做个赛博朋克风的万圣节装备，这个想法在我脑子里盘桓很久了。市面上那些宠物装饰要么千篇一律，要么就是简单的布料缝制，总感觉少了点“硬核”的趣味。直到我看到伺服电机和激光二极管这两个小玩意儿&#x…...

编程新知 2026/5/17 2:23:50

005 DevEco Studio OHPM同步404报错解决文档

[cs]005 DevEco Studio OHPM同步404报错解决文档文档简介本文解决鸿蒙开发中新建空白项目自动触发ohpm install时报错：ohos/hypium、ohos/hamock包404找不到、拉取依赖失败问题。核心原则：不修改项目任何自带文件、不删除系统生成依赖、不改动业务代…...

编程新知 2026/5/17 1:44:51

Visual Paradigm 17.0 新特性解析：团队协作与项目管理效率跃升

1. Visual Paradigm 17.0 团队协作功能全面升级 Visual Paradigm 17.0 版本带来了多项针对团队协作的实用改进，让分布式团队的建模工作变得更加高效。作为一个长期使用该工具的老用户，我发现这次更新特别注重解决实际协作中的痛点问题。首先说说模型搜索…...

编程新知 2026/5/16 23:30:54

3D打印螺纹强度提升实战指南：Fusion 360 FDM螺纹优化完整方案

3D打印螺纹强度提升实战指南：Fusion 360 FDM螺纹优化完整方案【免费下载链接】Fusion-360-FDM-threads 项目地址: https://gitcode.com/gh_mirrors/fu/Fusion-360-FDM-threads 你是否在3D打印螺纹连接件时经常遇到螺纹断裂、装配困难或打印失败的问题&…...

编程新知 2026/5/16 21:32:56

搭建分布式Kafka集群

前提

功能规划

开始安装

1. 上传Kafka服务器

2. 配置用户环境变量

3. 修改配置文件

4. 同步文件

5. 修改从节点配置

6. 环境变量生效

安装结束

7. 前台启动一台Kafka服务器

8. 后台启动Kafka服务器集群

9.查看kafka进程

10. 停止Kafka

参考文档

相关文章：