DataLight(V1.4.5) 版本更新,新增 Ranger、Solr
DataLight(V1.4.5) 版本更新,新增 Ranger、Solr
DataLight 迎来了重大的版本更新,现已发布 V1.4.5 版本。本次更新对平台进行了较多的功能拓展和优化,新增了对 Ranger 和 Solr 服务组件的支持,同时对多项已有功能进行了改进,旨在提升更好的使用体验。
一. 更新日志
-
新增 SOLR 服务:
- 支持 Solr 服务的部署与维护,为用户提供强大的全文搜索和索引功能,方便对大数据集进行高效检索。
-
新增 RANGER 服务:
- 支持 RangerAdmin、RangerUserSync、RangerTagSync 的部署与管理,实现集中的权限控制和安全审计。
新增 RANGER 插件:
- RANGER-HDFS 插件:
- 支持文件和目录级别的权限控制。
- 提供详细的访问审计日志,满足合规性要求。
- RANGER-YARN 插件:
- 管理作业提交和队列级别的访问权限。
- 防止资源滥用,确保资源的公平分配和安全性。
- RANGER-HBASE 插件:
- 实现表、列族、列级别的权限管理。
- 保障数据的读写安全,防止未经授权的操作。
- RANGER-KAFKA 插件:
- 设置主题和消费组的访问权限。
- 保护消息的生产和消费环节,确保数据传输安全。
- RANGER-HIVE 插件:
- 提供行、列、单元格级别的访问控制。
- 具备数据脱敏功能,保护敏感信息。
- RANGER-SOLR 插件:
- 控制查询和索引的访问权限。
- 防止未经授权的搜索和数据泄露。
-
优化日志管理的滚动效果:
新增用户身份判定机制,解决了除
root用户外其他普通用户无法登录的问题,提升了系统的安全性和用户友好性。 -
优化配置文件联动机制:
当 Ranger 服务部署或发生变动时,系统将自动联动修改相关服务的配置文件,减少手动操作的繁琐,降低错误发生的可能性。
-
新增脚本耗时显示:
在执行
datalight.sh操作 Master 和 Worker 进程时,增加了耗时打印功能,方便用户了解操作执行时间,优化性能调试流程。
二. 部分更新内容预览
2.1 新增 Ranger、Solr 服务

2.2 RangerAdmin
提供友好的 Web 界面,可以方便地创建、修改和查看权限策略。

2.3 RangerUserSync
支持从 LDAP、Active Directory 或本地 Unix 系统同步用户和组信息,确保权限管理的准确性和同步性。

2.4 SolrServer
支持 Solr 集群部署,提供容错和负载均衡能力,且支持全文检索、模糊查询、范围查询等多种查询方式,满足多样化的业务需求。

2.5 一键启用、禁用 Ranger 插件
在 DataLight 平台上,可以一键启用或禁用各服务的 Ranger 插件,灵活控制权限管理功能。

2.6 Ranger 插件审计
详细记录各服务的访问和操作日志,帮助管理员监控用户行为,防范安全风险。

2.7 Ranger 插件状态
在平台上查看各 Ranger 插件的运行状态,及时发现和处理异常情况,保障系统稳定运行。

2.8 优化脚本耗时显示
增加了 datalight.sh 脚本操作过程的耗时打印,帮助用户分析和优化系统性能,提升运维效率。

三. 如何增量更新到 1.4.5 版本
我们提供了详细的升级指南,帮助您顺利将现有的 DataLight 平台更新到最新版本。
3.1 停止 Master/Worker进程
进入主节点,在所有服役的节点上,执行以下命令,停止并删除所有节点上的 Master、Worker 进程:
# 停止 Master 进程
/opt/datalight/bin/datalight.sh stop master# 停止 Worker 进程
/opt/datalight/bin/datalight.sh stop worker# 删除原有的 Master、Worker Jar 包
rm -rf /opt/datalight/app/*.jar
注:Master 进程所在节点称之为主节点,下同
3.2 更新主包
前往百度网盘,下载如下内容,获取最新的主程序包。
下载完成后,将新包覆盖至 /opt/datalight 目录下,替换原有文件。

3.3 更新插件包
前往百度网盘,下载如下插件包内容,将其覆盖更新至 /opt/datalight/plugins 目录下的相应位置,确保插件版本与主程序一致。


3.4 手动分发到所有节点
将更新后的 DataLight 目录从 主节点 推送至所有 从节点。可以使用 scp 或其他同步命令进行分发。例如,将更新内容推送至节点 node02:
# 以推送至 node02 节点为例
scp -r /opt/datalight node02:/opt
3.6 重新启动 Master 进程
进入主节点,通过以下命令启动 Master 进程,Master 进程重启后,稍等片刻,Master 将自动拉起所有节点上的 Worker 进程。
/opt/datalight/bin/datalight.sh start master 8001
四. Ranger 的功能与场景
DataLight 平台现已支持与 Ranger 深度集成,实现对各大数据组件的统一权限管理和安全审计。
-
4.1 Ranger 与 HDFS
使用场景:数据分层存储
在一个企业数据湖中,不同部门需要访问不同的数据集。Ranger 可以为每个部门设置特定的文件夹权限:
- 场景: 财务部门需要访问财务报告,但不应该访问研发数据。
- 解决方案: 使用 Ranger 创建规则,只允许财务部门的用户组访问
/data/finance目录,而/data/research只能由研发部门访问。 - 好处: 确保数据隔离,防止敏感信息泄露。
4.2 Ranger 与 YARN
使用场景:资源公平调度
在共享计算资源的环境中,确保不同用户的公平使用:
- 场景: 数据科学团队和营销团队共享一个 YARN 集群。
- 解决方案: 通过 Ranger 限制每个团队提交的作业数量和资源使用量。
- 好处: 防止某一团队过度占用资源,提升整体资源利用率。
4.3 Ranger 与 HBase
使用场景:客户数据保护
公司需要存储和处理敏感的客户信息,确保数据安全:
- 场景: 客户服务团队需要访问客户联系信息,但不应查看财务数据。
- 解决方案: 使用 Ranger 在 HBase 中设置列级权限,允许访问
contact_info列族,而限制financial_data。 - 好处: 保护敏感数据,符合隐私法规要求。
4.4 Ranger 与 Hive
使用场景:敏感数据分析
在执行大规模数据分析时,保护敏感数据:
- 场景: 分析师需要访问销售数据进行趋势分析,但不应查看具体客户信息。
- 解决方案: 在 Hive 中设置列级权限,允许访问销售数据列,但限制客户信息列。
- 好处: 保证分析的同时,保护个人隐私。
4.5 Ranger 与 Kafka
使用场景:日志数据流管理
管理跨部门的日志数据流:
- 场景: 安全团队和开发团队需要访问不同的日志数据。
- 解决方案: 使用 Ranger 设置 Kafka 主题权限,安全团队可以访问
security_logs主题,而开发团队访问app_logs。 - 好处: 确保数据流的安全性和隐私性。
4.6 Ranger 与 Solr
使用场景:搜索查询控制
在企业搜索平台中,管理不同用户的查询权限:
- 场景: 员工可以搜索公共文档,但只有人力资源可以搜索员工记录。
- 解决方案: 使用 Ranger 控制 Solr 查询权限,限制员工只能搜索公共索引。
- 好处: 防止敏感信息泄露,确保合规性。
关注我们,获取更多最新资讯。
一起见证数据世界的无限可能!
相关文章:
DataLight(V1.4.5) 版本更新,新增 Ranger、Solr
DataLight(V1.4.5) 版本更新,新增 Ranger、Solr DataLight 迎来了重大的版本更新,现已发布 V1.4.5 版本。本次更新对平台进行了较多的功能拓展和优化,新增了对 Ranger 和 Solr 服务组件的支持,同时对多项已…...
深度解析:Python蓝桥杯青少组精英赛道与高端题型概览
目录 一、蓝桥杯青少组简介二、赛项组别与年龄范围三、比赛内容与题型1. 基础知识范围2. 题型设置2.1 选择题2.2 编程题 3. 考试时长 四、奖项设置与激励措施五、总结 一、蓝桥杯青少组简介 蓝桥杯全国软件和信息技术专业人才大赛(简称“蓝桥杯”)是由工…...
如何使用SCCMSecrets识别SCCM策略中潜在的安全问题
关于SCCMSecrets SCCMSecrets是一款针对SCCM策略的安全扫描与检测工具,该工具旨在提供一种有关 SCCM 策略的全面安全检测方法。 该工具可以从各种权限级别执行,并将尝试发现与策略分发相关的潜在错误配置。除了分发点上托管的包脚本外,它还将…...
Qt 信号重载问题--使用lambda表达式--解决方法
在connect()中,使用lambda表达式时遇到信号重载,无法识别使用哪个参数时,可通过以下方法处理: 1. 使用QOverload: Qt5.7才有 connect(comboBox,QOverload<int>::of(&QComboBox::currentIndexChanged), [](int index)…...
并行编程实战——TBB框架的应用之一Supra的基础
一、TBB的应用 在前面分析了TBB框架的各种基本知识和相关的基础应用。这些基础的应用很容易通过学习文档或相关的代码来较为轻松的掌握。为了能够更好的理解TBB框架的优势,这里从一个开源的应用程序来分析一下TBB在其中的更高一层的抽象应用,以方便开发…...
std::vector
std::vector是C标准库中一个非常强大的容器类,它提供了动态数组的功能。std::vector可以自动调整大小,提供了随机访问的能力,同时还支持在序列的尾部高效地添加和删除元素。 当创建一个空的std::vector对象时,它不分配任何内存&a…...
Java Web 之 Cookie 详解
在 JavaWeb 开发中,Cookie 就像网站给浏览器贴的小纸条,用于记录一些用户信息或状态,方便下次访问时识别用户身份或进行个性化服务。 也可以这么理解: 场景一:想象一下,你去一家咖啡店,店员认…...
linux系统下让.py文件开机自启动
一 创建服务文件 1、打开终端 2、切换到root用户 sudo su3、创建一个新的systemd服务文件 nano /etc/systemd/system/total_test0619.service 4、在服务文件中添加以下内容 [Unit] DescriptionRun total_test0619.py at startup[Service] Typesimple ExecStart/usr/bin/n…...
linux远程桌面:xrdp 安装失败
window 如何远程 Linux 桌面 安装xrdp yum install xrdpsystemctl start xrdp 如果找不到软件包,就安装epel源,最好改成国内镜像的 在 /etc/yum.repos.d/ 下创建epel.repo,内容如下 [epel] nameExtra Packages for Enterprise Linux 7 - $basearch …...
9.30Python基础-元组(补充)、字典、集合
Python元组(tuple)补充 1、元组的不可变性 元组(tuple)是Python中的一种内置数据类型,用于存储不可变的序列。虽然元组本身不可变,但元组内的元素如果是可变对象(如列表)ÿ…...
桥接模式和NET模式的区别
桥接模式和NET模式的区别 NAT模式: NAT:网络地址转换(模式):借助宿主机来上网,没桥接那么麻烦,只用配置DNS即可。 缺点:扎根于宿主机,不能和局域网内其它真实的主机进行…...
Pigar:Python 项目的依赖管理利器
🌟 引言 在Python项目开发过程中,依赖管理是一个不可忽视的环节。一个精确且易于维护的requirements.txt文件对于项目的部署和协作至关重要。今天,我们将介绍一款名为Pigar的自动生成requirements.txt文件的依赖管理工具,它通过一…...
泰勒图 ——基于相关性与标准差的多模型评价指标可视化比较-XGBoost、sklearn
1、基于相关性与标准差的多模型评价指标可视化比较 # 数据读取并分割 import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split plt.rcParams[font.family] = Times New Roman plt.rcParams[axes.unic…...
记录|Modbus-TCP产品使用记录【摩通传动】
目录 前言一、摩通传动实验图1.1 配置软件 IO_Studio1.2 测试软件Modbus Poll1.2.1 读写设置测试1.2.2 AI信号的读取 1.3 对应的C#连接Modbus的测试代码如下【自制,仅供参考】1.4 最终实验图 更新时间 前言 参考文章: 自己需要了解和对比某些产品的Modbu…...
工业交换机的RMON
工业交换机在现代网络中扮演着至关重要的角色,它不仅负责数据的高效传输,还具备强大的监控和管理能力。其中,RMON(远程监控)功能使得交换机的性能得以进一步提升,成为网络管理的重要工具。RMON提供了一种先…...
生态遥感数据下载分享
中国土壤湿度/土壤水分数据集(2000-2020) 下载网站:https://poles.tpdc.ac.cn/zh-hans/data/49b22de9-5d85-44f2-a7d5-a1ccd17086d2/#:~:text%E6%88%91%E4%BB%AC%E6%8F%90%E4%BE%9B%E4%BA%86%E4%B8%AD%E5%9B%BD%E8%8C%83 note: The data can …...
ECharts 快速使用
最终效果 使用介绍 echarts图表的绘制,大体分为三步: 根据 DOM实例,通过 echarts.init方法,生成 echarts实例构建 options配置对象,整个echarts的样式,皆有该对象决定最后通过实例.setOption方法…...
进程--消息队列和共享内存
目录 消息队列 创建消息队列 删除消息队列 发送消息和接收 消息队列 消息队列就是一个消息的列表,进程可以在消息队列中添加消息和的读取消息 消息队列具有FIFO的特性,具有无名管道与有名管道各自的优势,可以支持任意两个进程的进程间通讯…...
useCallback()
官网直达:https://zh-hans.react.dev/reference/react/useCallback 点击按钮,子组件会重新渲染 import { memo, useState, useCallback } from react;const Child (props) > {console.log(我是子组件!我在渲染呢!࿰…...
Python面试题精选及解析--第二篇
在Python的面试中,除了基础语法和常用库的知识外,面试官往往还会通过一系列的问题来考察应聘者的逻辑思维、问题解决能力以及项目经验。以下是一些精心挑选的Python面试题及其详细答案,旨在帮助求职者更好地准备面试。 面试题一:…...
网络六边形受到攻击
大家读完觉得有帮助记得关注和点赞!!! 抽象 现代智能交通系统 (ITS) 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 (…...
【Java学习笔记】Arrays类
Arrays 类 1. 导入包:import java.util.Arrays 2. 常用方法一览表 方法描述Arrays.toString()返回数组的字符串形式Arrays.sort()排序(自然排序和定制排序)Arrays.binarySearch()通过二分搜索法进行查找(前提:数组是…...
Module Federation 和 Native Federation 的比较
前言 Module Federation 是 Webpack 5 引入的微前端架构方案,允许不同独立构建的应用在运行时动态共享模块。 Native Federation 是 Angular 官方基于 Module Federation 理念实现的专为 Angular 优化的微前端方案。 概念解析 Module Federation (模块联邦) Modul…...
QT: `long long` 类型转换为 `QString` 2025.6.5
在 Qt 中,将 long long 类型转换为 QString 可以通过以下两种常用方法实现: 方法 1:使用 QString::number() 直接调用 QString 的静态方法 number(),将数值转换为字符串: long long value 1234567890123456789LL; …...
OpenLayers 分屏对比(地图联动)
注:当前使用的是 ol 5.3.0 版本,天地图使用的key请到天地图官网申请,并替换为自己的key 地图分屏对比在WebGIS开发中是很常见的功能,和卷帘图层不一样的是,分屏对比是在各个地图中添加相同或者不同的图层进行对比查看。…...
Unity | AmplifyShaderEditor插件基础(第七集:平面波动shader)
目录 一、👋🏻前言 二、😈sinx波动的基本原理 三、😈波动起来 1.sinx节点介绍 2.vertexPosition 3.集成Vector3 a.节点Append b.连起来 4.波动起来 a.波动的原理 b.时间节点 c.sinx的处理 四、🌊波动优化…...
Web 架构之 CDN 加速原理与落地实践
文章目录 一、思维导图二、正文内容(一)CDN 基础概念1. 定义2. 组成部分 (二)CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 (三)CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 …...
在Ubuntu24上采用Wine打开SourceInsight
1. 安装wine sudo apt install wine 2. 安装32位库支持,SourceInsight是32位程序 sudo dpkg --add-architecture i386 sudo apt update sudo apt install wine32:i386 3. 验证安装 wine --version 4. 安装必要的字体和库(解决显示问题) sudo apt install fonts-wqy…...
初探Service服务发现机制
1.Service简介 Service是将运行在一组Pod上的应用程序发布为网络服务的抽象方法。 主要功能:服务发现和负载均衡。 Service类型的包括ClusterIP类型、NodePort类型、LoadBalancer类型、ExternalName类型 2.Endpoints简介 Endpoints是一种Kubernetes资源…...
iOS性能调优实战:借助克魔(KeyMob)与常用工具深度洞察App瓶颈
在日常iOS开发过程中,性能问题往往是最令人头疼的一类Bug。尤其是在App上线前的压测阶段或是处理用户反馈的高发期,开发者往往需要面对卡顿、崩溃、能耗异常、日志混乱等一系列问题。这些问题表面上看似偶发,但背后往往隐藏着系统资源调度不当…...
