当前位置: 首页 > news >正文

国产化ETL产品必备的特性(非开源包装)

ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行抽取、清洗(净化)、转换、装载、标准、集成(汇总)...... 最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。

       如果数据转换的频率或者要求不高可以手动实现ETL的功能;反之,如果对数据转换的要求比较高的话,就需要专门的ETL工具.



  1. 功能特性
    1. 开放性

支持各种类型业务系统数据源,包括不仅限于oracle、sqlserver、access等各类国内外关系型数据库,甚至pdf、word、excel、xml、txt等类型数据文件,支持多达30+数据源同时采集提取。国产信创数据库等即刻开放接口。 

1.2 扩展性 

集成Bee脚本开发环境(自研),图形设计可转换成后台bee脚本,可个性化定制开发,满足国内特殊信息现状。满足复杂业务逻辑数据处理需求。

提取的数据结构、数据内容、数据标准、数据处理流程都是可扩展和灵活配置的。

1.3简化性

简化了用户的操作。专用ETL通常通过图形化的配置方式,简单,灵活,使得用户无需过分关心数据库的各种内部细节,而专注于其功能实现。

1.4集成性

 集成数据标准转换和数据清洗功能。可对实际系统业务中复杂数据标准和代码转换,且配置简单、方便。数据抽取、清洗工作保证了数据质量。从而做到统一接口、统一数据文件格式、统一运行和维护方法。

1.5创新性 

独有的工作流调度、内置独有的脚本解释器功能组件(bee 脚本函数)处理清洗、过滤、转换。

1.6先进性 

核心自研可控,源自2004年 非开源包装技术。

1.7易安装维护 

系统本身是绿色免安装软件,拷贝就能用。基本不需要其他系统维护工作。

2非功能特点

 2.1 工具界面 

可以通过可视化操作方式进行设计,将大大降低开发门槛,使开发人员得到补充,避免人员流动性造成的运维困难。

 2.2 可用性 

改善数据运维的方式,运维人员经过基本培训后,简单操作即可满足ETL作业上线、部署等需求。

 2.3 安全性 

用户创建的作业文件采用加密方式存储,密钥采用与机器相关的硬件信息,当作业文件拷贝到其它机器时,由于对应密钥的硬件信息 发生改变,所以作业文件是无法读取的。这样可以杜绝非法用户将作业文件复制后、通过在其它机器创建同名用户从而窃取、破坏数 据信息的行为发生。

 为了防止程序开启后的非法访问(如用户在打开作业文件后离开机器,非法用户可借此窃取、破环数据信息),程序提供界面锁定功能。界面锁定后,必须提供锁定用户的密码才可重新进入程序。

2.4 易用性

 良好的易用性,逻辑清晰便于用户理解;系统操作简单,人机交互界面友好。系统操作界面一目了然,用户能够直观的找到自己使用的功能菜单,很方便的完成所需操作。

2.5设计约束 

所构建系统的所有设计约束。设计约束代表经过批准的、必须遵从的设计决定。示例包括软件语言、软件流程管理需求、规定使用的开发工具、体系结构和设计约束、购买的组件、类库等等。

3.部署要求

3.1.平台支持:

支持主流平台Linux, Windows以及国产操作系统,不同平台间具备可移植性(包含不同平台间移植以及从相同平台开发环境到生产环境间的移植);提供独立的运行框架,不依赖特定的数据库产品。同时支持各种硬件平台,如x86,龙芯等等。

3.2.满足信创要求

工具所依赖的操作系统、数据库、中间件符合信创改造要求。主要为:统信UOS操作系统、中科方德操作系统、中标麒麟、国产化数据库(人大金仓、达梦等)。

3.3.跨平台移植和向下兼容

工具跨平台或版本升级不影响原有作业设计及使用。或能提供作业升级脚本。

详见功能组件,如下图:


灵蜂ETL产品 BeeDI 之转换界面 配置
灵蜂ETL产品 BeeDI 之转换界面 配置

灵蜂ETL产品BeeDI之 数据联邦 配置

灵蜂ETL产品 BeeDI之 工作流 配置
灵蜂ETL产品 BeeDI之 工作流 配置
wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw== 编辑

相关文章:

国产化ETL产品必备的特性(非开源包装)

ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行抽取、清洗(净化)、转换、装载、标准、集成(汇总)...... 最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。…...

flink 操作mongodb的例子

Apache Flink 是一个流处理和批处理的开源框架,它通常用于处理大量数据流。然而,Flink 本身并不直接提供对 MongoDB 的原生支持,因为 MongoDB 是一个 NoSQL 数据库,而 Flink 主要与关系型数据库(如 JDBC 连接器&#x…...

【笔记】打卡01 | 初学入门

初学入门:01-02 01 基本介绍02 快速入门库处理数据集网络构建模型训练保存模型加载模型打卡-时间 01 基本介绍 MindSpore Data(数据处理层) ModelZoo(模型库) MindSpore Science(科学计算),包含…...

Rocky9使用cockpitweb登陆时root用户无法登陆

Rocky9使用cockpitweb登陆时root用户无法登陆 [rootlvs ~]# vim /etc/cockpit/disallowed-users [rootlvs ~]# systemctl restart cockpit 取消disallowed-users中的root,即可访问 ip:9090 登陆。...

微信小程序修改标题

要修改微信小程序页面的标题和调整字体大小,你需要对 app.json 和页面对应的 json 文件进行配置。 修改页面标题 打开 app.json 文件,找到 pages 字段,确认需要修改的页面路径。打开对应页面的 .json 文件(例如,pages/…...

Linux MySQL服务设置开机自启动

文章目录 前言简介一、准备工作二、操作步骤2.1 启动MySQL服务2.2 拷贝配置2.3 赋值权限2.4 添加为系统服务2.5 验证 总结 前言 请各大网友尊重本人原创知识分享,谨记本人博客:南国以南i、 提示:以下是本篇文章正文内容,下面案例…...

MacOS设备远程登录配置结合内网穿透实现异地ssh远程连接

文章目录 前言1. MacOS打开远程登录2. 局域网内测试ssh远程3. 公网ssh远程连接MacOS3.1 MacOS安装配置cpolar3.2 获取ssh隧道公网地址3.3 测试公网ssh远程连接MacOS 4. 配置公网固定TCP地址4.1 保留一个固定TCP端口地址4.2 配置固定TCP端口地址 5. 使用固定TCP端口地址ssh远程 …...

国有企业如何提高人效比?

随着市场竞争的日益激烈,国有企业面临着越来越大的经营压力。为了提高经济效益和核心竞争力,国有企业越来越重视提高人效比。人效比,即企业总收益与员工总人数的比值,反映了企业每名员工所创造的平均收益。提高人效比意味着在相同…...

Leetcode - 周赛401

目录 一,3178. 找出 K 秒后拿着球的孩子 二,3179. K 秒后第 N 个元素的值 三,3180. 执行操作可获得的最大总奖励 I 四,3181. 执行操作可获得的最大总奖励 II 一,3178. 找出 K 秒后拿着球的孩子 本题可以直接模拟&a…...

Java | Leetcode Java题解之第171题Excel表列序号

题目: 题解: class Solution {public int titleToNumber(String columnTitle) {int number 0;int multiple 1;for (int i columnTitle.length() - 1; i > 0; i--) {int k columnTitle.charAt(i) - A 1;number k * multiple;multiple * 26;}ret…...

【uni-app学习手札】

uni-app(vue3)编写微信小程序 编写uni-app不必拘泥于HBuilder-X编辑器,可用vscode进行编写,在《微信开发者工具》中进行热加载预览, 主要记录使用uni-app过程中自我备忘一些api跟语法,方便以后编写查找使用…...

ASP.NET Core 中使用 Dapper 的 Oracle 存储过程输出参数

介绍 Oracle 数据库功能强大,在企业环境中使用广泛。在 ASP.NET Core 应用程序中使用 Oracle 存储过程时,处理输出参数可能具有挑战性。本教程将指导您完成使用 Dapper(适用于 . NET 的轻量级 ORM(对象关系映射器)&am…...

C++的动态内存分配

使用new/delete操作符在堆中分配/释放内存 //使用new操作符在堆中分配内存int* p1 new int;*p1 2234;qDebug() << "数字是&#xff1a;" << *p1;//使用delete操作符在堆中释放内存delete p1;在分配内存的同时初始化 //在分配内存的时初始化int* p2 n…...

【论文阅读】-- TSR-TVD:时变数据分析和可视化的时间超分辨率

TSR-TVD: Temporal Super-Resolution for Time-Varying Data Analysis and Visualization 摘要1 引言2 相关工作3 我们的循环生成方法3.1 损失函数3.2 网络架构 4 结果与讨论4.1 数据集和网络训练4.2 结果4.3 讨论 5 结论和未来工作致谢参考文献附录1 训练算法及优化2 网络分析…...

《web应用技术》第12次课后作业

1、了解servlet技术 Servlet(server applet)&#xff1a;运行在服务器的小程序&#xff0c;Servlet就是一个接口&#xff0c;定义了Java类被浏览器访问到的规则。将来我们自定义一个类&#xff0c;实现Servlet接口&#xff0c;复写方法。 Servlet本身不能独立运行&#xff0c…...

【初阶数据结构】深入解析带头双向循环链表:探索底层逻辑

&#x1f525;引言 本篇将介绍带头双向循环链表底层实现以及在实现中需要注意的事项&#xff0c;帮助各位在使用过程中根据底层实现考虑到效率上问题和使用时可能会导致的错误使用 &#x1f308;个人主页&#xff1a;是店小二呀 &#x1f308;C语言笔记专栏&#xff1a;C语言笔…...

【面试干货】Java中的访问修饰符与访问级别

【面试干货】Java中的访问修饰符与访问级别 1、public2、protected3、默认&#xff08;没有访问修饰符&#xff09;4、private &#x1f496;The Begin&#x1f496;点点关注&#xff0c;收藏不迷路&#x1f496; 在Java中&#xff0c;访问修饰符用于控制类、变量、方法和构造器…...

Oracle最终还是杀死了MySQL

起因 大约15年前&#xff0c;Oracle收购了Sun公司&#xff0c;从而也拥有了MySQL&#xff0c;互联网上关于Oracle何时会“扼杀MySQL”的讨论此起彼伏。 当时流传着各种理论&#xff1a;从彻底扼杀 MySQL 以减少对 Oracle 专有数据库的竞争&#xff0c;到干掉 MySQL 开源项目&…...

【Python的随机数汇总】

​我们写python代码的时候&#xff0c;很少能用得上随机数&#xff0c;但是随机数有很多妙用。例如&#xff0c;在我们做测试数据集的时候&#xff0c;可以构建一个随机的dataframe&#xff1b; 或者在保存数据的时候&#xff0c;可以在每条数据前插入一列作为&#xff0c;不重…...

[状态压缩 广搜BFS]Saving Tang Monk

描述 《Journey to the West》(also 《Monkey》) is one of the Four Great Classical Novels of Chinese literature. It was written by Wu Chengen during the Ming Dynasty. In this novel, Monkey King Sun Wukong, pig Zhu Bajie and Sha Wujing, escorted Tang Monk to…...

【PTA实战】矩阵乘法:从输入格式到核心算法的完整解析

1. 矩阵乘法在PTA平台的核心挑战 第一次在PTA平台做矩阵乘法题时&#xff0c;我被那个"格式卡顿"坑得差点怀疑人生。明明算法逻辑完全正确&#xff0c;提交后却总是提示"格式错误"&#xff0c;这种经历相信很多同学都遇到过。矩阵乘法作为线性代数的基础运…...

JEB Pro 5.40 (macOS, Linux, Windows) - Android 反编译器和调试器

JEB Pro 5.40 (macOS, Linux, Windows) - 逆向工程平台 Reverse Engineering for Professionals. 请访问原文链接&#xff1a;https://sysin.org/blog/jeb/ 查看最新版。原创作品&#xff0c;转载请保留出处。 作者主页&#xff1a;sysin.org JEB Decompiler JEB 是逆向工程…...

ARM DAP调试架构核心机制与实践指南

1. ARM调试访问端口(DAP)架构解析调试访问端口(Debug Access Port, DAP)是ARM调试架构中的核心组件&#xff0c;它作为调试器与芯片内部调试资源的桥梁&#xff0c;提供了标准化的访问接口。DAP的设计遵循ARM Debug Interface v5.1(ADIv5.1)规范&#xff0c;支持两种物理接口协…...

CSS 容器查询完全指南

CSS 容器查询完全指南 引言 CSS 容器查询&#xff08;Container Queries&#xff09;是 CSS 规范中的一项革命性特性&#xff0c;它允许开发者根据容器的尺寸而非视口尺寸来应用样式。本文将深入探讨容器查询的各种用法和高级技巧。 基础概念回顾 容器查询 vs 媒体查询 特…...

Flutter 自定义动画完全指南

Flutter 自定义动画完全指南 引言 动画是现代移动应用的重要组成部分&#xff0c;它能够提升用户体验&#xff0c;使界面更加生动。Flutter 提供了强大的动画系统&#xff0c;本文将深入探讨如何创建自定义动画效果。 动画基础回顾 动画类型 补间动画 (Tween Animation) - 最常…...

Obsidian-Templates:卡片盒笔记法的终极模板库,构建你的第二大脑

Obsidian-Templates&#xff1a;卡片盒笔记法的终极模板库&#xff0c;构建你的第二大脑 【免费下载链接】Obsidian-Templates A repository containing templates and scripts for #Obsidian to support the #Zettelkasten method for note-taking. 项目地址: https://gitco…...

探究MicroBlaze软核在DDR3中运行sleep函数异常延迟的根源与规避策略

1. 现象描述&#xff1a;从BRAM到DDR3的诡异延迟 第一次把MicroBlaze程序从BRAM搬到DDR3运行时&#xff0c;我遇到了一个让人抓狂的问题&#xff1a;原本精准的sleep(1)延时竟然变成了长达数秒的卡顿。这个现象特别容易在Vitis环境下开发网络应用&#xff08;比如LwIP协议栈&am…...

ABAP 7.40+新语法实战:从传统代码到现代编程范式的重构

1. ABAP 7.40新语法带来的编程革命 十年前我刚接触ABAP时&#xff0c;代码风格还停留在SAP R/3时代的传统写法。每次看到满屏的DATA声明、LOOP...ENDLOOP和APPEND语句&#xff0c;就像在看上世纪90年代的编程教科书。直到ABAP 7.40版本发布&#xff0c;这个被称为"ABAP语言…...

从图文对到通用视觉:CLIP如何用对比学习重塑多模态预训练范式

1. 从图文匹配到通用视觉&#xff1a;CLIP的颠覆性思路 第一次看到CLIP模型时&#xff0c;我正为一个老问题头疼&#xff1a;训练好的图像分类器遇到新类别就直接"罢工"。比如用猫狗数据集训练的模型&#xff0c;突然给它看一只考拉&#xff0c;结果只会输出"猫…...

我的第一个CNN项目翻车实录:从过拟合到数据清洗,TensorFlow 2.1猫狗分类避坑指南

我的第一个CNN项目翻车实录&#xff1a;从过拟合到数据清洗&#xff0c;TensorFlow 2.1猫狗分类避坑指南 第一次接触深度学习时&#xff0c;我天真地以为只要按照教程搭建一个卷积神经网络(CNN)&#xff0c;就能轻松实现猫狗图片分类。然而现实给了我一记响亮的耳光——模型要么…...