当前位置: 首页 > news >正文

DataLight(V1.4.5) 版本更新,新增 Ranger、Solr

DataLight(V1.4.5) 版本更新,新增 Ranger、Solr

DataLight 迎来了重大的版本更新,现已发布 V1.4.5 版本。本次更新对平台进行了较多的功能拓展和优化,新增了对 Ranger 和 Solr 服务组件的支持,同时对多项已有功能进行了改进,旨在提升更好的使用体验。

一. 更新日志

  • 新增 SOLR 服务:

    • 支持 Solr 服务的部署与维护,为用户提供强大的全文搜索和索引功能,方便对大数据集进行高效检索。
  • 新增 RANGER 服务:

    • 支持 RangerAdmin、RangerUserSync、RangerTagSync 的部署与管理,实现集中的权限控制和安全审计。

新增 RANGER 插件:

  • RANGER-HDFS 插件:
    • 支持文件和目录级别的权限控制。
    • 提供详细的访问审计日志,满足合规性要求。
  • RANGER-YARN 插件:
    • 管理作业提交和队列级别的访问权限。
    • 防止资源滥用,确保资源的公平分配和安全性。
  • RANGER-HBASE 插件:
    • 实现表、列族、列级别的权限管理。
    • 保障数据的读写安全,防止未经授权的操作。
  • RANGER-KAFKA 插件:
    • 设置主题和消费组的访问权限。
    • 保护消息的生产和消费环节,确保数据传输安全。
  • RANGER-HIVE 插件:
    • 提供行、列、单元格级别的访问控制。
    • 具备数据脱敏功能,保护敏感信息。
  • RANGER-SOLR 插件:
    • 控制查询和索引的访问权限。
    • 防止未经授权的搜索和数据泄露。
  • 优化日志管理的滚动效果:

    新增用户身份判定机制,解决了除 root 用户外其他普通用户无法登录的问题,提升了系统的安全性和用户友好性。

  • 优化配置文件联动机制:

    当 Ranger 服务部署或发生变动时,系统将自动联动修改相关服务的配置文件,减少手动操作的繁琐,降低错误发生的可能性。

  • 新增脚本耗时显示:

    在执行 datalight.sh 操作 Master 和 Worker 进程时,增加了耗时打印功能,方便用户了解操作执行时间,优化性能调试流程。

二. 部分更新内容预览

2.1 新增 Ranger、Solr 服务

2.2 RangerAdmin

提供友好的 Web 界面,可以方便地创建、修改和查看权限策略。

2.3 RangerUserSync

支持从 LDAP、Active Directory 或本地 Unix 系统同步用户和组信息,确保权限管理的准确性和同步性。

2.4 SolrServer

支持 Solr 集群部署,提供容错和负载均衡能力,且支持全文检索、模糊查询、范围查询等多种查询方式,满足多样化的业务需求。

2.5 一键启用、禁用 Ranger 插件

在 DataLight 平台上,可以一键启用或禁用各服务的 Ranger 插件,灵活控制权限管理功能。

2.6 Ranger 插件审计

详细记录各服务的访问和操作日志,帮助管理员监控用户行为,防范安全风险。

2.7 Ranger 插件状态

在平台上查看各 Ranger 插件的运行状态,及时发现和处理异常情况,保障系统稳定运行。

2.8 优化脚本耗时显示

增加了 datalight.sh 脚本操作过程的耗时打印,帮助用户分析和优化系统性能,提升运维效率。

三. 如何增量更新到 1.4.5 版本

我们提供了详细的升级指南,帮助您顺利将现有的 DataLight 平台更新到最新版本。

3.1 停止 Master/Worker进程

进入主节点,在所有服役的节点上,执行以下命令,停止并删除所有节点上的 Master、Worker 进程:

# 停止 Master 进程
/opt/datalight/bin/datalight.sh stop master# 停止 Worker 进程
/opt/datalight/bin/datalight.sh stop worker# 删除原有的 Master、Worker Jar 包
rm -rf /opt/datalight/app/*.jar

注:Master 进程所在节点称之为主节点,下同

3.2 更新主包

前往百度网盘,下载如下内容,获取最新的主程序包。

下载完成后,将新包覆盖至 /opt/datalight 目录下,替换原有文件。

3.3 更新插件包

前往百度网盘,下载如下插件包内容,将其覆盖更新至 /opt/datalight/plugins 目录下的相应位置,确保插件版本与主程序一致。

3.4 手动分发到所有节点

将更新后的 DataLight 目录从 主节点 推送至所有 从节点。可以使用 scp 或其他同步命令进行分发。例如,将更新内容推送至节点 node02

# 以推送至 node02 节点为例
scp -r /opt/datalight node02:/opt

3.6 重新启动 Master 进程

进入主节点,通过以下命令启动 Master 进程,Master 进程重启后,稍等片刻,Master 将自动拉起所有节点上的 Worker 进程。

/opt/datalight/bin/datalight.sh start master 8001

四. Ranger 的功能与场景

DataLight 平台现已支持与 Ranger 深度集成,实现对各大数据组件的统一权限管理和安全审计。

  • 4.1 Ranger 与 HDFS

    使用场景:数据分层存储

    在一个企业数据湖中,不同部门需要访问不同的数据集。Ranger 可以为每个部门设置特定的文件夹权限:

    • 场景: 财务部门需要访问财务报告,但不应该访问研发数据。
    • 解决方案: 使用 Ranger 创建规则,只允许财务部门的用户组访问 /data/finance 目录,而 /data/research 只能由研发部门访问。
    • 好处: 确保数据隔离,防止敏感信息泄露。

    4.2 Ranger 与 YARN

    使用场景:资源公平调度

    在共享计算资源的环境中,确保不同用户的公平使用:

    • 场景: 数据科学团队和营销团队共享一个 YARN 集群。
    • 解决方案: 通过 Ranger 限制每个团队提交的作业数量和资源使用量。
    • 好处: 防止某一团队过度占用资源,提升整体资源利用率。

    4.3 Ranger 与 HBase

    使用场景:客户数据保护

    公司需要存储和处理敏感的客户信息,确保数据安全:

    • 场景: 客户服务团队需要访问客户联系信息,但不应查看财务数据。
    • 解决方案: 使用 Ranger 在 HBase 中设置列级权限,允许访问 contact_info 列族,而限制 financial_data
    • 好处: 保护敏感数据,符合隐私法规要求。

    4.4 Ranger 与 Hive

    使用场景:敏感数据分析

    在执行大规模数据分析时,保护敏感数据:

    • 场景: 分析师需要访问销售数据进行趋势分析,但不应查看具体客户信息。
    • 解决方案: 在 Hive 中设置列级权限,允许访问销售数据列,但限制客户信息列。
    • 好处: 保证分析的同时,保护个人隐私。

    4.5 Ranger 与 Kafka

    使用场景:日志数据流管理

    管理跨部门的日志数据流:

    • 场景: 安全团队和开发团队需要访问不同的日志数据。
    • 解决方案: 使用 Ranger 设置 Kafka 主题权限,安全团队可以访问 security_logs 主题,而开发团队访问 app_logs
    • 好处: 确保数据流的安全性和隐私性。

    4.6 Ranger 与 Solr

    使用场景:搜索查询控制

    在企业搜索平台中,管理不同用户的查询权限:

    • 场景: 员工可以搜索公共文档,但只有人力资源可以搜索员工记录。
    • 解决方案: 使用 Ranger 控制 Solr 查询权限,限制员工只能搜索公共索引。
    • 好处: 防止敏感信息泄露,确保合规性。

关注我们,获取更多最新资讯。

一起见证数据世界的无限可能!

相关文章:

DataLight(V1.4.5) 版本更新,新增 Ranger、Solr

DataLight(V1.4.5) 版本更新,新增 Ranger、Solr DataLight 迎来了重大的版本更新,现已发布 V1.4.5 版本。本次更新对平台进行了较多的功能拓展和优化,新增了对 Ranger 和 Solr 服务组件的支持,同时对多项已…...

深度解析:Python蓝桥杯青少组精英赛道与高端题型概览

目录 一、蓝桥杯青少组简介二、赛项组别与年龄范围三、比赛内容与题型1. 基础知识范围2. 题型设置2.1 选择题2.2 编程题 3. 考试时长 四、奖项设置与激励措施五、总结 一、蓝桥杯青少组简介 蓝桥杯全国软件和信息技术专业人才大赛(简称“蓝桥杯”)是由工…...

如何使用SCCMSecrets识别SCCM策略中潜在的安全问题

关于SCCMSecrets SCCMSecrets是一款针对SCCM策略的安全扫描与检测工具,该工具旨在提供一种有关 SCCM 策略的全面安全检测方法。 该工具可以从各种权限级别执行,并将尝试发现与策略分发相关的潜在错误配置。除了分发点上托管的包脚本外,它还将…...

Qt 信号重载问题--使用lambda表达式--解决方法

在connect()中&#xff0c;使用lambda表达式时遇到信号重载&#xff0c;无法识别使用哪个参数时&#xff0c;可通过以下方法处理&#xff1a; 1. 使用QOverload: Qt5.7才有 connect(comboBox,QOverload<int>::of(&QComboBox::currentIndexChanged), [](int index)…...

并行编程实战——TBB框架的应用之一Supra的基础

一、TBB的应用 在前面分析了TBB框架的各种基本知识和相关的基础应用。这些基础的应用很容易通过学习文档或相关的代码来较为轻松的掌握。为了能够更好的理解TBB框架的优势&#xff0c;这里从一个开源的应用程序来分析一下TBB在其中的更高一层的抽象应用&#xff0c;以方便开发…...

std::vector

std::vector是C标准库中一个非常强大的容器类&#xff0c;它提供了动态数组的功能。std::vector可以自动调整大小&#xff0c;提供了随机访问的能力&#xff0c;同时还支持在序列的尾部高效地添加和删除元素。 当创建一个空的std::vector对象时&#xff0c;它不分配任何内存&a…...

Java Web 之 Cookie 详解

在 JavaWeb 开发中&#xff0c;Cookie 就像网站给浏览器贴的小纸条&#xff0c;用于记录一些用户信息或状态&#xff0c;方便下次访问时识别用户身份或进行个性化服务。 也可以这么理解&#xff1a; 场景一&#xff1a;想象一下&#xff0c;你去一家咖啡店&#xff0c;店员认…...

linux系统下让.py文件开机自启动

一 创建服务文件 1、打开终端 2、切换到root用户 sudo su3、创建一个新的systemd服务文件 nano /etc/systemd/system/total_test0619.service 4、在服务文件中添加以下内容 [Unit] DescriptionRun total_test0619.py at startup[Service] Typesimple ExecStart/usr/bin/n…...

linux远程桌面:xrdp 安装失败

window 如何远程 Linux 桌面 安装xrdp yum install xrdpsystemctl start xrdp 如果找不到软件包&#xff0c;就安装epel源&#xff0c;最好改成国内镜像的 在 /etc/yum.repos.d/ 下创建epel.repo,内容如下 [epel] nameExtra Packages for Enterprise Linux 7 - $basearch …...

9.30Python基础-元组(补充)、字典、集合

Python元组&#xff08;tuple&#xff09;补充 1、元组的不可变性 元组&#xff08;tuple&#xff09;是Python中的一种内置数据类型&#xff0c;用于存储不可变的序列。虽然元组本身不可变&#xff0c;但元组内的元素如果是可变对象&#xff08;如列表&#xff09;&#xff…...

桥接模式和NET模式的区别

桥接模式和NET模式的区别 NAT模式&#xff1a; NAT&#xff1a;网络地址转换&#xff08;模式&#xff09;&#xff1a;借助宿主机来上网&#xff0c;没桥接那么麻烦&#xff0c;只用配置DNS即可。 缺点&#xff1a;扎根于宿主机&#xff0c;不能和局域网内其它真实的主机进行…...

Pigar:Python 项目的依赖管理利器

&#x1f31f; 引言 在Python项目开发过程中&#xff0c;依赖管理是一个不可忽视的环节。一个精确且易于维护的requirements.txt文件对于项目的部署和协作至关重要。今天&#xff0c;我们将介绍一款名为Pigar的自动生成requirements.txt文件的依赖管理工具&#xff0c;它通过一…...

泰勒图 ——基于相关性与标准差的多模型评价指标可视化比较-XGBoost、sklearn

1、基于相关性与标准差的多模型评价指标可视化比较 # 数据读取并分割 import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split plt.rcParams[font.family] = Times New Roman plt.rcParams[axes.unic…...

记录|Modbus-TCP产品使用记录【摩通传动】

目录 前言一、摩通传动实验图1.1 配置软件 IO_Studio1.2 测试软件Modbus Poll1.2.1 读写设置测试1.2.2 AI信号的读取 1.3 对应的C#连接Modbus的测试代码如下【自制&#xff0c;仅供参考】1.4 最终实验图 更新时间 前言 参考文章&#xff1a; 自己需要了解和对比某些产品的Modbu…...

工业交换机的RMON

工业交换机在现代网络中扮演着至关重要的角色&#xff0c;它不仅负责数据的高效传输&#xff0c;还具备强大的监控和管理能力。其中&#xff0c;RMON&#xff08;远程监控&#xff09;功能使得交换机的性能得以进一步提升&#xff0c;成为网络管理的重要工具。RMON提供了一种先…...

生态遥感数据下载分享

中国土壤湿度/土壤水分数据集&#xff08;2000-2020&#xff09; 下载网站&#xff1a;https://poles.tpdc.ac.cn/zh-hans/data/49b22de9-5d85-44f2-a7d5-a1ccd17086d2/#:~:text%E6%88%91%E4%BB%AC%E6%8F%90%E4%BE%9B%E4%BA%86%E4%B8%AD%E5%9B%BD%E8%8C%83 note: The data can …...

ECharts 快速使用

最终效果 使用介绍 echarts图表的绘制&#xff0c;大体分为三步&#xff1a; 根据 DOM实例&#xff0c;通过 echarts.init方法&#xff0c;生成 echarts实例构建 options配置对象&#xff0c;整个echarts的样式&#xff0c;皆有该对象决定最后通过实例.setOption方法&#xf…...

进程--消息队列和共享内存

目录 消息队列 创建消息队列 删除消息队列 发送消息和接收 消息队列 消息队列就是一个消息的列表&#xff0c;进程可以在消息队列中添加消息和的读取消息 消息队列具有FIFO的特性&#xff0c;具有无名管道与有名管道各自的优势&#xff0c;可以支持任意两个进程的进程间通讯…...

useCallback()

官网直达&#xff1a;https://zh-hans.react.dev/reference/react/useCallback 点击按钮&#xff0c;子组件会重新渲染 import { memo, useState, useCallback } from react;const Child (props) > {console.log(我是子组件&#xff01;我在渲染呢&#xff01;&#xff0…...

Python面试题精选及解析--第二篇

在Python的面试中&#xff0c;除了基础语法和常用库的知识外&#xff0c;面试官往往还会通过一系列的问题来考察应聘者的逻辑思维、问题解决能力以及项目经验。以下是一些精心挑选的Python面试题及其详细答案&#xff0c;旨在帮助求职者更好地准备面试。 面试题一&#xff1a;…...

Rust异步运行时rustclaw:高性能任务调度与并发编程实践

1. 项目概述与核心价值最近在折腾一个需要处理大量网络请求和并发任务的后台服务&#xff0c;性能瓶颈卡得我有点难受。传统的异步框架用起来总觉得不够“爽利”&#xff0c;要么是内存占用高&#xff0c;要么是并发模型复杂&#xff0c;调试起来像在走迷宫。就在我四处翻找有没…...

在株洲如何根据个人需求选择合适的床垫?

如何根据个人需求选择合适的床垫&#xff1f;在快节奏的现代生活中&#xff0c;一张舒适的床垫对于保证良好的睡眠质量至关重要。然而&#xff0c;面对市场上琳琅满目的床垫产品&#xff0c;如何根据个人需求选择一款合适的床垫呢&#xff1f;本文将从多个维度出发&#xff0c;…...

为OpenClaw智能体工作流配置持久化的大模型服务支持

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 为OpenClaw智能体工作流配置持久化的大模型服务支持 在构建基于OpenClaw的智能体工作流时&#xff0c;一个稳定、可靠的后端大模型…...

轴承剩余寿命预测 | 基于BP神经网络的轴承剩余寿命预测MATLAB实现!

研究背景 该代码基于IEEE PHM 2012数据挑战赛的轴承全寿命加速退化实验数据&#xff0c;旨在利用数据驱动方法预测滚动轴承的剩余使用寿命&#xff08;RUL&#xff09;。实验中轴承在恒定负载下持续运行至失效&#xff0c;期间通过水平/竖直加速度传感器以25.6 kHz采样频率每隔…...

中小企业技术团队的生存法则:用巧劲对抗资源不足

一、夹缝中求存的中小企业测试团队在软件行业的生态版图里&#xff0c;中小企业技术团队始终处于一种特殊的位置。它们没有行业巨头动辄数百人的测试大军&#xff0c;没有动辄千万级的测试预算&#xff0c;也无法像大厂那样依靠成熟的流程体系和工具矩阵实现自动化、规模化的测…...

【2026社工】初级社会工作者历年真题及答案PDF电子版(2010-2025年)

2026年初级社会工作者职业水平考试安排 考试时间&#xff1a; 2026年5月23日 考试科目与形式 科目名称考试形式社会工作实务闭卷笔试社会工作综合能力闭卷笔试 备考资源说明 提供2010-2025年完整历年真题及解析&#xff0c;覆盖全部考试科目&#xff0c;具体功能如下&#…...

软银携手DeltaX建储能基地,2027年量产应对AI算力电力挑战

软银与DeltaX合作&#xff1a;储能系统建设的新布局品玩5月12日消息&#xff0c;据The Elec报道&#xff0c;软银集团选定韩国初创公司DeltaX&#xff0c;负责在日本大阪建设数据中心储能系统&#xff08;ESS&#xff09;的开发与制造。双方计划于今年下半年在大阪堺市原夏普工…...

告别CubeMX代码洁癖:教你如何把main()函数挪到自己的.c文件里(STM32F4实战)

重构STM32工程的艺术&#xff1a;将main()迁移到自定义文件的实战指南 每次打开CubeMX生成的工程&#xff0c;看到那个被各种初始化代码塞满的main.c文件&#xff0c;你是否也感到一丝不适&#xff1f;作为一名有追求的嵌入式开发者&#xff0c;我们渴望对项目结构拥有绝对掌控…...

为VS Code集成GPT-4V视觉能力:VisualChatGPTStudio实战指南

1. 项目概述&#xff1a;当ChatGPT“睁开双眼”如果你和我一样&#xff0c;是个重度依赖ChatGPT进行编程、文档撰写和头脑风暴的开发者&#xff0c;那你一定体验过它的强大与局限。它能写出漂亮的代码片段&#xff0c;解释复杂的概念&#xff0c;但当你指着屏幕上的一个错误说“…...

AI原生多任务学习效能跃迁路径(SITS 2026工业级调参手册)

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;AI原生多任务学习&#xff1a;SITS 2026多目标优化实战技巧 在 SITS 2026 挑战赛中&#xff0c;AI 原生多任务学习&#xff08;MTL&#xff09;不再仅是共享底层表征的工程权衡&#xff0c;而是以任务语…...