当前位置：首页 > news >正文

盘点下常见 HDFS JournalNode 异常的问题原因和修复方法

news 2026/2/9 3:25:00

盘点下常见 HDFS JournalNode 异常的问题原因和修复方法

最近在多个客户现场以及公司内部环境，都遇到了因为 JournalNode 异常导致 HDFS 服务不可用的问题，在此总结下相关知识。

1 HDFS HA 高可用和 JournalNode 概述

HDFS namenode 有 SPOF 单点故障，因为对客户端提供元数据读写服务的是单一的一个 NameNode，Secondary NameNode 仅仅提供了 HDFS 故障时的可恢复性，而没有提供整个HDFS服务的高可用性；
之所以说 Secondary NameNode 仅仅提供了 HDFS 故障时的可恢复性而不是高可用性，是因为 HDFS 发生故障时，Secondary NameNode 并不会自动晋升为 nameNode, 运维管理员需要介入进行手动处理后才能恢复 HDFS 对外服务；
在底层，Secondary NameNode 提供了 fsimage 和 editLog 的合并功能（old fsimage + edit logs = new fsimage），这一过程称为 checkpoint，是基于参数 dfs.namenode.checkpoint.period 和 dfs.namenode.checkpoint.txns，按照时间和事件共同触发的;
为解决 HDFS NAMENODE 的 SPOF，可以配置启用 HDFS 的 HA 高可用，此时其架构如下，可以看到包括 active 与 standby 两个namenode 互为主备，包括奇数个 zkfc 基于zk 提供 nn 的故障检测和自动转移，包括奇数个 JournalNode 提供两个 nn 之间共享 editLogs;
Active Namenode 与 StandBy Namenode 为了同步 editLog 状态数据，会通过一组称作 JournalNodes 的独立进程进行相互通信: 当 active 状态的 NameNode 的命名空间有任何修改时，Active Namenode 会向 JournalNodes 中写 editlog 数据, 而 StandBy Namenode 会一直监控 JournalNodes 中 editLog 的变化，并把变化应用于自己的命名空间，从而确保两者命名空间状态的同步和一致，当 Active Namenode 故障出错时，standby Namenode 就可以不丢失数据地实时晋升为 Active Namenode 对外提供服务；
HDFS HA 的详细架构图如下：
HDFS NN 存储元数据信息的本地文件系统目录结构和关键文件如下：
HDFS JN 存储元数据信息的本地文件系统目录结构和关键文件如下：

- When the NameNode starts up, it reads the FsImage and EditLog from disk, applies all the transactions from the EditLog to the in-memory representation of the FsImage, and flushes out this new version into a new FsImage on disk. It can then truncate the old EditLog because its transactions have been applied to the persistent FsImage. This process is called a checkpoint;
- The secondary NameNode merges the fsimage and the edits log files periodically and keeps edits log size within a limit. It is usually run on a different machine than the primary NameNode since its memory requirements are on the same order as the primary NameNode.
- In a typical HA cluster, two or more separate machines are configured as NameNodes. At any point in time, exactly one of the NameNodes is in an Active state, and the others are in a Standby state. The Active NameNode is responsible for all client operations in the cluster, while the Standbys are simply acting as workers, maintaining enough state to provide a fast failover if necessary. 
- In order for the Standby node to keep its state synchronized with the Active node, both nodes communicate with a group of separate daemons called “JournalNodes” (JNs). When any namespace modification is performed by the Active node, it durably logs a record of the modification to a majority of these JNs. The Standby node is capable of reading the edits from the JNs, and is constantly watching them for changes to the edit log. As the Standby Node sees the edits, it applies them to its own namespace. In the event of a failover, the Standby will ensure that it has read all of the edits from the JournalNodes before promoting itself to the Active state. This ensures that the namespace state is fully synchronized before a failover occurs.
- In order to provide a fast failover, it is also necessary that the Standby node have up-to-date information regarding the location of blocks in the cluster. In order to achieve this, the DataNodes are configured with the location of all NameNodes, and send block location information and heartbeats to all.- It is vital for the correct operation of an HA cluster that only one of the NameNodes be Active at a time. Otherwise, the namespace state would quickly diverge between the two, risking data loss or other incorrect results. In order to ensure this property and prevent the so-called “split-brain scenario,” the JournalNodes will only ever allow a single NameNode to be a writer at a time. During a failover, the NameNode which is to become active will simply take over the role of writing to the JournalNodes, which will effectively prevent the other NameNode from continuing in the Active state, allowing the new Active to safely proceed with failover.
- There must be at least 3 JournalNode daemons, since edit log modifications must be written to a majority of JNs. This will allow the system to tolerate the failure of a single machine. You may also run more than 3 JournalNodes, but in order to actually increase the number of failures the system can tolerate, you should run an odd number of JNs, (i.e. 3, 5, 7, etc.). Note that when running with N JournalNodes, the system can tolerate at most (N - 1) / 2 failures and continue to function normally.

2 HDFS JournalNode 异常的常见原因

从上述分析可知，HDFS HA 的正常工作依赖于 JournalNode 的正常工作，当集群中半数以上的 JournalNode 节点发生异常后，HDFS HA 就无法正常工作了；
由于 JournalNode 如此重要，绝大部分的大数据集群管理软件如 ClouderaManager/Ambari等，都会监控 JournalNode 并在其异常时发送告警通知；
如下即是 ClouderaManager 对 JN 同步状态和磁盘空间常见的的监控报警信息：

- The health test result for JOURNAL_NODE_SYNC_STATUS has become bad: The active NameNode is out of sync with this JournalNode.
- This role's JournalNode Edits Directory is on a filesystem with less than 10.0 GiB of its space free. /dfs/jn (free: 4.0 GiB (2.68%), capacity: 149.9 GiB)

造成 HDFS JournalNode 异常的常见原因有：
- JournalNode 节点的本地磁盘故障或磁盘满，导致写入的 editLog 数据异常；
- JournalNode 节点异常并重装了操作系统；
- 出于扩展集群的需求，新增了JournalNode 节点；

3 HDFS JournalNode 异常的常规修复方法

HDFS JournalNode 异常，大体应该遵循如下逻辑进行修复：

准备工作：确定当前可以正常工作的 JournalNode 节点，其 editLog 文件的存放位置(即参数dfs.journalnode.edits.dir的值),以及当前最新的 editLog 文件（各个节点各个 editLog 文件的文件名中都包含了递增的 sequence number 序列号，比如历史 editLog 文件 edits_0000000000056586378-0000000000056586407 和当前 editLog 文件 edits_inprogress_0000000000056586408，序列号最大的即是最新的 editLog 文件）；
停止 HDFS 集群;
删除 editLog 脏数据：如果是 JournalNode 节点的本地磁盘故障或磁盘满，则修复/更换磁盘或清理磁盘空间，并删除已经写入的异常的 editLog 文件（也可以删除 dfs.journalnode.edits.dir目录下的所有子目录和文件，包括 VERSION 文件, edits 文件等；删除前建议先备份）；
恢复 editLog 数据：从当前可以正常工作的 JournalNode 节点，拷贝其正常的 editLog 数据文件，可以拷贝 dfs.journalnode.edits.dir目录下的所有子目录和文件，包括 VERSION 文件, edits 文件等（事实上只拷贝 VERSION 文件和最新的 editLog 文件也可以，此时后续启动 JournalNode 后，会自动拷贝其它历史 editLog）；
确保拷贝过来的所有文件的用户和用户组是HDFS：chown -R hdfs:hdfs ./*;
启动 HDFS 服务，查看日志，确保恢复正常;

问题 journalnode 节点修复重启后，自动同步和滚动 editLog 的部分日志如下：

2023-11-08 14:19:03,112 INFO org.apache.hadoop.hdfs.qjournal.server.JournalNodeSyncer: Downloaded file edits_0000000000056292183-0000000000056292202 of size 2367 bytes.
2023-11-08 14:19:03,113 INFO org.apache.hadoop.hdfs.qjournal.server.JournalNodeSyncer: Downloading missing Edit Log from http://uf30-2:8480/getJournal?jid=ns1&segmentTxId=56292203&storageInfo=-64%3A1693184092%3A1603367087970%3Acluster12&inProgressOk=false to /dfs/jn/ns1
2023-11-08 14:19:03,159 INFO org.apache.hadoop.hdfs.server.common.Util: Combined time for file download and fsync to all disks took 0.00s. The file download took 0.00s at 4000.00 KB/s. Synchronous (fsync) write to disk of /dfs/jn/ns1/edits.sync/edits_0000000000056292203-0000000000056292232 took 0.00s.
2023-11-08 16:02:32,313 INFO org.apache.hadoop.hdfs.qjournal.server.JournalNodeSyncer: Syncing Journal /192.168.71.70:8485 with uf30-2/192.168.71.71:8485, journal id: ns1
2023-11-08 16:03:18,694 INFO org.apache.hadoop.hdfs.server.namenode.FileJournalManager: Finalizing edits file /dfs/jn/ns1/current/edits_inprogress_0000000000056587366 -> /dfs/jn/ns1/current/edits_0000000000056587366-0000000000056587395
2023-11-08 16:03:18,856 INFO org.apache.hadoop.hdfs.server.namenode.TransferFsImage: Sending fileName: /dfs/jn/ns1/current/edits_0000000000056587366-0000000000056587395, fileSize: 4142. Sent total: 4142 bytes. Size of last segment intended to send: -1 bytes.

4 HDFS JournalNode 异常修复时遇到的常见问题

JournalNotFormattedException：即 Journal 未格式化异常，这种错误经常出现在重装 Journal 节点操作系统时，或添加新 Journal 节点时，修复方法为从其它正常 Journal 节点拷贝 VERSION 文件即可，详细报错如下:

org.apache.hadoop.hdfs.qjournal.protocol.JournalNotFormattedException: journal storage directory /dfs/jn/nameservice1 not formatted

editLog 过期损坏异常：这种错误经常出现在某个 Journal节点因磁盘异常或其它原因，长期没有跟其它 Journal 节点同步 editLog 数据，导致其最新的 editLog 文件（即edits_inprogressxxx 文件）过期异常，修复方法为按照上述步骤，删除其异常的 edits_inprogressxxx 文件或全部的 editLog文件，然后重启 Journal 角色即可（重启后会自动从其它正常 Journal 节点拷贝 editLog 文件）,详细报错如下:

FSImage	Caught exception after scanning through 0 ops from /dfs/jn/ns1/current/edits_inprogress_0000000000055367073 while determining its valid length. Position was 229376
java.io.IOException: Can't scan a pre-transactional edit log.at org.apache.hadoop.hdfs.server.namenode.FSEditLogOp$LegacyReader.scanOp(FSEditLogOp.java:5264)at org.apache.hadoop.hdfs.server.namenode.EditLogFileInputStream.scanNextOp(EditLogFileInputStream.java:243)at org.apache.hadoop.hdfs.server.namenode.FSEditLogLoader.scanEditLog(FSEditLogLoader.java:1248)at org.apache.hadoop.hdfs.server.namenode.EditLogFileInputStream.scanEditLog(EditLogFileInputStream.java:327)at org.apache.hadoop.hdfs.server.namenode.FileJournalManager$EditLogFile.scanLog(FileJournalManager.java:566)at org.apache.hadoop.hdfs.qjournal.server.Journal.scanStorageForLatestEdits(Journal.java:210)at org.apache.hadoop.hdfs.qjournal.server.Journal.<init>(Journal.java:162)at org.apache.hadoop.hdfs.qjournal.server.JournalNode.getOrCreateJournal(JournalNode.java:99)at org.apache.hadoop.hdfs.qjournal.server.JournalNode.getOrCreateJournal(JournalNode.java:145)at org.apache.hadoop.hdfs.qjournal.server.JournalNodeRpcServer.getEditLogManifest(JournalNodeRpcServer.java:216)at org.apache.hadoop.hdfs.qjournal.protocolPB.QJournalProtocolServerSideTranslatorPB.getEditLogManifest(QJournalProtocolServerSideTranslatorPB.java:228)at org.apache.hadoop.hdfs.qjournal.protocol.QJournalProtocolProtos$QJournalProtocolService$2.callBlockingMethod(QJournalProtocolProtos.java:27411)at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:523)at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:991)at org.apache.hadoop.ipc.Server$RpcCall.run(Server.java:869)at org.apache.hadoop.ipc.Server$RpcCall.run(Server.java:815)at java.security.AccessController.doPrivileged(Native Method)at javax.security.auth.Subject.doAs(Subject.java:422)at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1875)at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2675)

/dfs/jn/ns1/in_use.lock 文件锁异常：这种错误经常出现在目录 /dfs/jn 或其子目录和文件的 owner/group 不是 JournalNode 进程的启动用户（一般是HDFS:HDFS）,或者异常启动了多个 JournalNode 进程，修复方法为更改 /dfs/jn 目录及其子目录和文件的 owner/group 为 JournalNode 进程的启动用户，（chown -R hdfs:hdfs /dfs/jn）并重启 JournalNode 服务进程，详细报错如下:

It appears that another node  165959@uf30-1 has already locked the storage directory: /dfs/jn/ns1
java.nio.channels.OverlappingFileLockExceptionat sun.nio.ch.SharedFileLockTable.checkList(FileLockTable.java:255)at sun.nio.ch.SharedFileLockTable.add(FileLockTable.java:152)at sun.nio.ch.FileChannelImpl.tryLock(FileChannelImpl.java:1107)at java.nio.channels.FileChannel.tryLock(FileChannel.java:1155)at org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.tryLock(Storage.java:841)at org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.lock(Storage.java:809)at org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.analyzeStorage(Storage.java:622)at org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.analyzeStorage(Storage.java:573)at org.apache.hadoop.hdfs.qjournal.server.JNStorage.analyzeAndRecoverStorage(JNStorage.java:253)at org.apache.hadoop.hdfs.qjournal.server.JNStorage.<init>(JNStorage.java:77)at org.apache.hadoop.hdfs.qjournal.server.Journal.<init>(Journal.java:153)at org.apache.hadoop.hdfs.qjournal.server.JournalNode.getOrCreateJournal(JournalNode.java:99)at org.apache.hadoop.hdfs.qjournal.server.JournalNode.getOrCreateJournal(JournalNode.java:145)at org.apache.hadoop.hdfs.qjournal.server.JournalNodeRpcServer.getEditLogManifest(JournalNodeRpcServer.java:216)at org.apache.hadoop.hdfs.qjournal.protocolPB.QJournalProtocolServerSideTranslatorPB.getEditLogManifest(QJournalProtocolServerSideTranslatorPB.java:228)at org.apache.hadoop.hdfs.qjournal.protocol.QJournalProtocolProtos$QJournalProtocolService$2.callBlockingMethod(QJournalProtocolProtos.java:27411)at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:523)at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:991)at org.apache.hadoop.ipc.Server$RpcCall.run(Server.java:869)at org.apache.hadoop.ipc.Server$RpcCall.run(Server.java:815)at java.security.AccessController.doPrivileged(Native Method)at javax.security.auth.Subject.doAs(Subject.java:422)at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1875)at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2675)
xxx 
IPC Server handler 4 on 8485, call Call#4204 Retry#0 org.apache.hadoop.hdfs.qjournal.protocol.QJournalProtocol.getEditLogManifest from 192.168.71.71:35892
java.io.IOException: Cannot lock storage /dfs/jn/ns1. The directory is already lockedat org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.lock(Storage.java:814)at org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.analyzeStorage(Storage.java:622)at org.apache.hadoop.hdfs.server.common.Storage$StorageDirectory.analyzeStorage(Storage.java:573)at org.apache.hadoop.hdfs.qjournal.server.JNStorage.analyzeAndRecoverStorage(JNStorage.java:253)at org.apache.hadoop.hdfs.qjournal.server.JNStorage.<init>(JNStorage.java:77)at org.apache.hadoop.hdfs.qjournal.server.Journal.<init>(Journal.java:153)at org.apache.hadoop.hdfs.qjournal.server.JournalNode.getOrCreateJournal(JournalNode.java:99)at org.apache.hadoop.hdfs.qjournal.server.JournalNode.getOrCreateJournal(JournalNode.java:145)at org.apache.hadoop.hdfs.qjournal.server.JournalNodeRpcServer.getEditLogManifest(JournalNodeRpcServer.java:216)at org.apache.hadoop.hdfs.qjournal.protocolPB.QJournalProtocolServerSideTranslatorPB.getEditLogManifest(QJournalProtocolServerSideTranslatorPB.java:228)at org.apache.hadoop.hdfs.qjournal.protocol.QJournalProtocolProtos$QJournalProtocolService$2.callBlockingMethod(QJournalProtocolProtos.java:27411)at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:523)at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:991)at org.apache.hadoop.ipc.Server$RpcCall.run(Server.java:869)at org.apache.hadoop.ipc.Server$RpcCall.run(Server.java:815)at java.security.AccessController.doPrivileged(Native Method)at javax.security.auth.Subject.doAs(Subject.java:422)at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1875)at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2675)

盘点下常见 HDFS JournalNode 异常的问题原因和修复方法

盘点下常见 HDFS JournalNode 异常的问题原因和修复方法最近在多个客户现场以及公司内部环境，都遇到了因为 JournalNode 异常导致 HDFS 服务不可用的问题，在此总结下相关知识。 1 HDFS HA 高可用和 JournalNode 概述 HDFS namenode 有 SPOF 单点故障…...

编程日记 2024/6/20 12:04:40

深入了解python生成器（generator）

生成器生成器是 Python 中一种特殊类型的迭代器。生成器允许你定义一个函数来动态产生值，而不是一次性生成所有值并将它们存储在内存中。生成器使用 yield 关键字来逐个返回值。每次调用生成器函数时，函数会在 yield 语句暂停，并记住当前的…...

编程日记 2024/6/20 12:03:39

【Linux】Xshell和Xftp简介_安装_VMware虚拟机使用

1、简介 Xshell简介 Xshell是一款强大的安全终端模拟软件支持SSH1、SSH2以及Microsoft Windows平台的TELNET协议。该软件通过互联网实现到远程主机的安全连接，并通过其创新性的设计和特色帮助用户在复杂的网络环境中高效工作。Xshell可以在Windows界面下访问远端不…...

编程日记 2024/6/20 12:01:36

【轮询负载均衡规则算法设计题】

一、题目描述给定n台主机（编号1~n）和某批数据包，数据包格式为（抵达主机时刻，负载量）。这里数据每个时刻最多只有1条数据到达。负载量表示该主机处理此数据包总耗时。请计算轮询负载均衡规则下&#xff0c…...

编程日记 2024/6/20 11:57:31

张一鸣的产品哲学：与巨头共舞，低调中寻求突破

一、引言在当今互联网竞争激烈的格局下，与巨头企业打交道是每个新兴科技企业都需面对的挑战。字节跳动创始人张一鸣在多次访谈中分享了他与巨头企业打交道的经验：保持低调、补齐技术、产品和市场各方面的能力。本文将探讨这一策略背后的产品哲学&#…...

编程日记 2024/6/20 11:56:29

【面试干货】throw 和 throws 的区别

【面试干货】throw 和 throws 的区别 1、throw1.1 示例 2、throws2.1 示例 3、总结 💖The Begin💖点点关注，收藏不迷路💖 在Java中，throw和throws都与异常处理紧密相关，但它们在使用和含义上有明显的区别。…...

编程日记 2024/6/20 11:55:28

安卓手机删除的照片怎么恢复？3个方法，小技巧大作用

你是否曾经不小心删除了手机里的珍贵照片，却不知道怎么恢复？别担心，今天我们就来分享几个简单的小技巧，帮助你轻松找回那些丢失的照片。这些技巧虽然简单，但却能发挥大作用，让你不再为丢失照片而烦恼。手机…...

编程日记 2024/6/20 11:54:26

Unity制作背包的格子

1.新建一个面板 2.点击面板并添加这个组件 3.点击UI创建一个原始图像，这样我们就会发现图像出现在了面板的左上角。 4.多复制几个并改变 Grid Layout Group的参数就可以实现下面的效果了...

编程日记 2024/6/20 11:51:22

道可云元宇宙每日资讯｜厦门：运用元宇宙技术助力直播电商发展

道可云元宇宙每日简报（2024年6月20日）讯，今日元宇宙新鲜事有： 厦门：运用元宇宙技术助力直播电商发展近日，厦门市商务局印发《厦门市促进直播电商高质量发展若干措施（2024年-2026年&#xff0…...

编程日记 2024/6/20 11:50:21

电脑怎么卸载软件？多个方法合集（2024年新版）

在电脑的日常使用中，我们经常需要安装各种软件来满足不同的需求，但随着时间的推移，可能会出现一些软件不再需要或需要更换的情况。此时，及时从电脑上卸载这些不必要的软件是非常重要的。它不仅可以释放硬盘空间，还可以…...

编程日记 2024/6/20 11:49:20

【深度学习基础】详解Pytorch搭建CNN卷积神经网络LeNet-5实现手写数字识别

目录写在开头一、CNN的原理 1. 概述 2. 卷积层内参数（卷积核本身） 外参数（填充和步幅） 输入与输出的尺寸关系 3. 多通道问题多通道输入多通道输出 4. 池化层平均汇聚最大值汇聚二、手写数字识别 1. 任务…...

编程日记 2024/6/20 11:48:18

面试技巧：正确回答JavaScript中Map和Object的选择问题

在JavaScript的面试中，对于何时使用Map和Object的选择问题，是一个常见的考察点。这两个数据结构都能存储键值对，但它们各有优势和适用场景。本文将深入探讨两者的区别，并通过实际代码示例来指导您如何选择。基本概念 Map&#…...

编程日记 2024/6/20 11:47:15

sd StableDiffusion库学习笔记

目录 DeepSpeed realesrgan BasicSR超分辨率，去噪，去模糊，去 JPEG 压缩噪声 segment_anything mmengine controlnet_aux accelerate transfersformer pytorch_fid einops compel transfersformer 文本嵌入调整库报错&#xff1a…...

编程日记 2024/6/20 11:46:14

【单片机毕业设计选题24017】-基于STM32的禽舍环境监测控制系统（蓝牙版）

系统功能: 系统分为主机端和从机端，主机端主动向从机端发送信息和命令，从机端收到主机端的信息后回复温湿度氨气浓度和光照强度等信息。主要功能模块原理图: 电源时钟烧录接口: 单片机和按键输入电路: 主机部分电路: 从机部分电路: 资料获取地址主…...

编程日记 2024/6/20 11:45:12

每天一个数据分析题（三百七十八）- 系统聚类

在系统聚类方法中，哪种系统聚类是直接利用了组内的离差平方和？ A. 最长距离法 B. 重心法 C. Ward法 D. 类平均法数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python&#…...

编程日记 2024/6/20 11:43:10

守护系统稳定性的关键技术之看门狗

目录一、独立看门狗二、窗口看门狗三、总结看门狗定时器（Watchdog Timer，WDT）是嵌入式系统中至关重要的组件，用于监控和维护系统的稳定性。主要是用来监测单片机运行状态和解决程序引起的故障的模块。在由单片机构成的微型…...

编程日记 2024/6/20 11:42:09

【Linux】进程间通信上（1.5万字详解）

目录一.进程间通信介绍 1.1进程间通信的目的 1.2初步认识进程间通信 1.3进程间通信的种类二.匿名管道 2.1何为管道 2.1实现原理 2.3进一步探寻匿名管道 2.4编码实现匿名管道通信 2.5管道读写特点 2.6基于管道的进程池设计三.命名管道 3.1实现原理 3.2代码实现四.…...

编程日记 2024/6/20 11:38:04

测试用例设计：提升测试覆盖率的策略与方法

测试用例设计：提升测试覆盖率的策略与方法前言测试用例设计的原则提高测试覆盖率的方法测试类型的分析测试用例设计的基本方法等价类划分边界值分析正交法判定表法因果图法方法与策略方法策略如何评价测试用例结论前言在软件开发过程中，测试用例设…...

编程日记 2024/6/20 11:37:02

【微服务】什么是Hystrix？一文带你入门Hystrix

文章目录强烈推荐引言主要功能实现容错应用场景1. 远程服务调用2. 防止级联故障3. 网络延迟和超时管理4. 资源隔离5. 高并发场景6. 熔断与自动恢复7. 故障检测与监控示例应用场景使用实例1. 引入依赖2. 创建 Hystrix 命令类3. 使用 Hystrix 命令4. 配置 Hystrix5. 实时监控集…...

编程日记 2024/6/20 11:36:01

AI学习指南机器学习篇-支持向量机超参数调优

AI学习指南机器学习篇-支持向量机超参数调优在机器学习领域中，支持向量机（Support Vector Machines，SVM）是一种非常常用的监督学习模型。它通过寻找一个最优的超平面来进行分类和回归任务。然而，在实际应用中&#x…...

编程日记 2024/6/20 11:35:00

RestClient

什么是RestClient RestClient 是 Elasticsearch 官方提供的 Java 低级 REST 客户端，它允许HTTP与Elasticsearch 集群通信，而无需处理 JSON 序列化/反序列化等底层细节。它是 Elasticsearch Java API 客户端的基础。 RestClient 主要特点轻量级&#xff…...

编程新知 2025/11/30 15:33:36

Python｜GIF 解析与构建（5）：手搓截屏和帧率控制

目录 Python｜GIF 解析与构建（5）：手搓截屏和帧率控制一、引言二、技术实现：手搓截屏模块 2.1 核心原理 2.2 代码解析：ScreenshotData类 2.2.1 截图函数：capture_screen 三、技术实现&…...

编程新知 2025/11/14 3:06:30

idea大量爆红问题解决

问题描述在学习和工作中，idea是程序员不可缺少的一个工具，但是突然在有些时候就会出现大量爆红的问题，发现无法跳转，无论是关机重启或者是替换root都无法解决就是如上所展示的问题，但是程序依然可以启动。问题解决…...

编程新知 2026/2/8 6:37:38

【ROS】Nav2源码之nav2_behavior_tree-行为树节点列表

1、行为树节点分类在 Nav2（Navigation2）的行为树框架中，行为树节点插件按照功能分为 Action（动作节点）、Condition（条件节点）、Control（控制节点）和 Decorator（装饰节点）四类。 1.1 动作节点 Action 执行具体的机器人操作或任务，直接与硬件、传感器或外部系统…...

编程新知 2026/2/7 8:45:41

NSURLAuthenticationMethodServerTrust 只是 authenticationMethod 的冰山一角要理解 NSURLAuthenticationMethodServerTrust, 首先要明白它只是 authenticationMethod 的选项之一, 并非唯一 1 先厘清概念点说明authenticationMethodURLAuthenticationChallenge.protectionS…...

编程新知 2026/1/29 5:29:57

C++.OpenGL （10/64）基础光照（Basic Lighting）

基础光照（Basic Lighting）冯氏光照模型（Phong Lighting Model） #mermaid-svg-GLdskXwWINxNGHso {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-GLdskXwWINxNGHso .error-icon{fill:#552222;}#mermaid-svg-GLd…...

编程新知 2026/1/20 2:37:04

涂鸦T5AI手搓语音、emoji、otto机器人从入门到实战

“🤖手搓TuyaAI语音指令 😍秒变表情包大师，让萌系Otto机器人🔥玩出智能新花样！开整！” 🤖 Otto机器人 → 直接点明主体手搓TuyaAI语音 → 强调自主编程/自定义语音控制（TuyaAI…...

编程新知 2026/1/30 16:09:53

浅谈不同二分算法的查找情况

二分算法原理比较简单，但是实际的算法模板却有很多，这一切都源于二分查找问题中的复杂情况和二分算法的边界处理，以下是博主对一些二分算法查找的情况分析。需要说明的是，以下二分算法都是基于有序序列为升序有序的情况&#xf…...

编程新知 2025/9/14 7:37:32

【开发技术】.Net使用FFmpeg视频特定帧上绘制内容

目录一、目的二、解决方案 2.1 什么是FFmpeg 2.2 FFmpeg主要功能 2.3 使用Xabe.FFmpeg调用FFmpeg功能 2.4 使用 FFmpeg 的 drawbox 滤镜来绘制 ROI 三、总结一、目的当前市场上有很多目标检测智能识别的相关算法，当前调用一个医疗行业的AI识别算法后返回…...

编程新知 2026/1/20 22:45:38

蓝桥杯冶炼金属

原题目链接 🔧 冶炼金属转换率推测题解 📜 原题描述小蓝有一个神奇的炉子用于将普通金属 O O O 冶炼成为一种特殊金属 X X X。这个炉子有一个属性叫转换率 V V V，是一个正整数，表示每 V V V 个普通金属 O O O 可以冶炼出 …...

编程新知 2026/2/4 10:54:26

盘点下常见 HDFS JournalNode 异常的问题原因和修复方法

盘点下常见 HDFS JournalNode 异常的问题原因和修复方法

1 HDFS HA 高可用和 JournalNode 概述

2 HDFS JournalNode 异常的常见原因

3 HDFS JournalNode 异常的常规修复方法

4 HDFS JournalNode 异常修复时遇到的常见问题

相关文章：

盘点下常见 HDFS JournalNode 异常的问题原因和修复方法

深入了解python生成器（generator）

【Linux】Xshell和Xftp简介_安装_VMware虚拟机使用

【轮询负载均衡规则算法设计题】

张一鸣的产品哲学：与巨头共舞，低调中寻求突破

【面试干货】throw 和 throws 的区别

安卓手机删除的照片怎么恢复？3个方法，小技巧大作用

Unity制作背包的格子

道可云元宇宙每日资讯｜厦门：运用元宇宙技术助力直播电商发展

电脑怎么卸载软件？多个方法合集（2024年新版）

【深度学习基础】详解Pytorch搭建CNN卷积神经网络LeNet-5实现手写数字识别

面试技巧：正确回答JavaScript中Map和Object的选择问题

sd StableDiffusion库学习笔记

【单片机毕业设计选题24017】-基于STM32的禽舍环境监测控制系统（蓝牙版）

每天一个数据分析题（三百七十八）- 系统聚类

守护系统稳定性的关键技术之看门狗

【Linux】进程间通信上（1.5万字详解）

测试用例设计：提升测试覆盖率的策略与方法

【微服务】什么是Hystrix？一文带你入门Hystrix

AI学习指南机器学习篇-支持向量机超参数调优

RestClient

Python｜GIF 解析与构建（5）：手搓截屏和帧率控制

idea大量爆红问题解决

【ROS】Nav2源码之nav2_behavior_tree-行为树节点列表

ServerTrust 并非唯一

C++.OpenGL （10/64）基础光照（Basic Lighting）

涂鸦T5AI手搓语音、emoji、otto机器人从入门到实战

浅谈不同二分算法的查找情况

【开发技术】.Net使用FFmpeg视频特定帧上绘制内容

蓝桥杯冶炼金属