当前位置: 首页 > news >正文

还不知道数据类岗位的相关技能和职责吗?涤生大数据告诉你(二)

续接上文:还不知道数据类岗位的相关技能和职责吗?涤生大数据告诉你(一)

图片

1.数据治理工程师

工作职责

数据治理工程师的工作职责主要包括以下几个方面:

1. 数据管理策略制定:制定和实施数据管理策略,包括数据收集、存储、处理和使用的规范和流程,确保数据的可靠性和一致性。

2. 数据质量管理:评估和监控数据质量,发现和解决数据质量问题,确保数据的准确性、完整性和一致性。

3. 数据安全和隐私保护:制定和执行数据安全策略和措施,保护数据的安全性和隐私,防止数据泄露和非法使用。

4. 数据架构设计:设计和维护适合业务需求的数据架构,包括逻辑模型和物理模型,确保数据的有效组织和高效利用。

5. 数据治理工具和技术应用:使用数据治理工具和技术,如数据目录、元数据管理工具、数据质量工具等,进行数据管理和治理工作。

6. 数据合规性管理:确保数据处理和使用符合相关法律法规和行业规范,遵循数据保护和隐私保护的要求。 

7. 与业务团队和技术团队合作:与业务团队和技术团队紧密合作,了解业务需求,提供数据治理支持和解决方案。

8. 数据培训和意识提升:开展数据培训和意识提升活动,提高组织内部对数据治理的理解和重视程度。

总的来说,数据治理工程师的工作职责是确保数据的质量、低成本和合规性,设计和维护适合业务需求的数据架构,并与业务和技术团队合作,提供数据治理支持和解决方案。

与数仓工程师的区别与工作交集

数据治理工程师和数仓工程师在公司的工作职责有一定的交集,但也存在一些区别。

数据治理工程师的主要职责是管理和治理公司的数据资产,确保数据质量、安全和合规性,并为业务和技术团队提供数据治理支持和解决方案。具体包括数据管理策略制定、数据质量管理、数据安全和隐私保护、数据架构设计、数据治理工具和技术应用、数据合规性管理等方面的工作。

数仓工程师的主要职责是设计、开发和维护公司的数据仓库系统,包括数据的抽取、转换、加载和存储等方面的工作。数仓工程师需要了解业务需求,设计数据模型和数据架构,开发ETL流程,确保数据的准确性、完整性和一致性。

两个岗位的交集在于数据架构设计和数据质量管理方面。数据治理工程师和数仓工程师都需要了解业务需求,设计适合的数据架构和数据模型。同时,两个岗位都需要关注数据质量问题,确保数据的准确性、完整性和一致性。

两个岗位的区别在于数据治理工程师更加注重数据资产的管理和治理,包括数据安全和隐私保护、数据合规性管理等方面的工作;而数仓工程师更加注重数据仓库系统的设计和开发,包括ETL流程的开发和维护等方面的工作。在很多公司中,并没有单独设立一个数据治理团队,而是由数仓开发担任这个角色, 数据仓库工程师作为数据治理的主力军参与数据治理体系建设中,更多的是以实施的角色参与到数据治理中。而数据治理工程师更多的是以数据治理牵头人,或者提供方法论角色参与到项目中。

综上所述,数据治理工程师和数仓工程师在工作职责有一定的交集,但也存在一些区别。两个岗位需要紧密合作,共同为公司的数据资产和业务需求提供更加质量,低成本的解决方案。

2.BI工程师

工作职责

BI工程师的工作职责主要包括以下几个方面:

1. 数据分析与报告:BI工程师负责收集、整理和分析公司的业务数据,并根据业务需求生成相应的报告和可视化图表。他们需要使用BI工具(如Tableau、Power BI等)进行数据分析和可视化展示,以帮助决策者更好地理解业务数据和趋势。

2. 数据和ETL开发:BI工程师也会参与设计和维护数据仓库系统。需要编写数据任务的ETL脚本,从不同的数据源中提取数据,并将其转换为可用于分析和报告的格式。

3. 数据模型设计:BI工程师需要根据业务需求设计数据模型,以支持准确和高效的数据分析。他们需要理解业务流程和数据关系,并使用数据建模工具(如ERwin、PowerDesigner等)设计适合的数据模型。

4. 数据质量管理:BI工程师负责确保数据的质量和一致性。他们需要监控数据质量指标,识别和解决数据质量问题,并建立数据质量管理流程和规范。

5. 技术支持与培训:BI工程师需要提供技术支持,解决业务用户在数据分析和报告过程中遇到的问题。他们还需要为用户提供培训,帮助他们更好地使用BI工具和系统。

总体而言,BI工程师在负责将大量的业务数据转化为有价值的信息和洞察,并帮助决策者做出基于数据的决策,核心工作内容是实现业务指标的可视化,并转化为业务和管理成更加易于理解和决策的数据展现方式。他们同时需要具备数据分析、数据仓库和ETL开发、数据模型设计以及数据质量管理等方面的技能和知识。

与数仓工程师的区别和工作交集

在信贷公司的大数据团队中,BI工程师和数仓工程师的工作有一定的交集,但也存在一些岗位区别。

1. 工作交集

- 数据分析和报告:BI工程师和数仓工程师都需要收集、整理和分析大量的业务数据,共同提供数据驱动的决策支持和业务洞察。

- 数据仓库开发:BI工程师和数仓工程师都需要设计、构建和维护数据仓库和数据集市,确保数据的准确性、完整性和一致性。

- 数据质量管理:因为完整的数据质量BI工程师和数仓工程师都需要监控和维护数据质量,保证数据的准确性和可靠性。

在日常工作中,数仓工程师更多扮演的角色是数据支撑和数据模型提供者的角色,例如一个报表需求,数仓工程师负责端到端全链路的数据开发工作,而bi工程师负责利用如tableau,finereport等报表工作基于数仓开发工程师提供的数据表实现报表展现工作。注意的是,有些公司当中bi工程师会兼备数据工程师的工作职责,例如负责ads层数据开发工作。

2. 岗位区别

 - 技术要求:BI工程师需要具备数据分析和报表工具的开发和运用能力,熟悉数据挖掘和分析技术,以及数据可视化工具的使用。而数仓工程师需要具备数据仓库模型设计和ETL流程开发的能力,熟悉数据建模和数据库技术。

- 业务关注点:BI工程师更加关注数据分析和报表工具的使用和业务需求的满足,致力于提供数据驱动的决策支持。数仓工程师更加关注数据仓库的建设和数据流程的优化,致力于提供高质量、高性能的数据基础设施。

- 角色定位:BI工程师通常更加贴近业务部门,与业务人员紧密合作,理解业务需求并提供相应的数据分析解决方案。数仓工程师通常更加贴近技术团队,与数据架构师和开发人员紧密合作,负责数据仓库的设计和开发。 

综上所述,BI工程师和数仓工程师在团队中的工作有一定的交集,但在技术要求、业务关注点和角色定位上存在一些区别。

图片

3.数据运维工程师

岗位要求

大数据运维工程师的岗位技能要求可以包括以下方面:

1. 大数据技术:熟悉大数据技术栈,如Hadoop、Spark、Hive、HBase等,了解这些组件的底层原理、架构和使用方法。

2. 数据存储管理:管理和维护大数据存储系统,如HDFS、HBase等,确保数据的可靠性和可用性,进行容量规划和性能优化。能够进行数据库安装、配置、备份和恢复等操作。

3. 数据存储运维:熟悉大数据存储系统如HDFS、NoSQL数据库等,能够进行常见的存储介质的运维保障工作。

4. 数据安全和权限管理:具备数据安全和权限管理的能力,了解数据加密、访问控制、数据保护等相关技术,能够制定和执行数据安全策略。

5. 故障排除和性能优化:具备大数据相关平或者组件的的故障排除和集群性能优化的能力,能够监控和诊断大数据平台的故障和性能问题,并采取相应措施进行解决和优化。

6. 编程和脚本语言:熟练掌握编程和脚本语言,如Python、Java、Shell等,能够编写自动化脚本和工具进行大数据运维工作。

7. 问题解决能力:具备良好的问题解决能力,能够快速定位和解决数据运维中的问题,具备良好的分析和沟通能力。

8. 团队合作:具备良好的团队合作能力,能够与数据工程师、数据科学家和业务团队等紧密合作,共同解决数据运维方面的问题和需求。

与数仓工程师的区别和工作交集

在日常工作中,大数据运维工程师和数仓工程师可能会有一些交集。例如:

1.当数据中台团队承接业务部门的一些数据服务类需求的时候,需要大数据运维团队和数仓团队协同完成需求的方案设计和开发上线,对于方案设计,两个团队都需要站在如何站在架构合理性的角度对需求进行方案设计。而对于开发工作,数仓工程师负责数据模型设计及数据开发工作,大数据运维工程师负责hbase,ck等存储介质的建表及接口开发工作,接口开发完成对下游应用系统暴露接口。

2.日常任务运维工作当中,一般由运维工程师负责监控集群及任务的故障问题,当集群出现故障告警或者调度任务出现报错,运维工程师首先会入手排查问题原因,如果是集群问题,运维工程师需要紧急修复故障问题,如果是调度任务代码或者数据开发问题,运维工程师会通知到对应的任务责任人,如数仓开发工程师,数仓工程师上线解决修复任务问题。

对于etl工程师也好,数仓工程师还是数据开发工程师也好,都是同一个目的支撑公司数据类应用的需求,为业务团队提供高质量的数据支持和解决方案。

相关文章:

还不知道数据类岗位的相关技能和职责吗?涤生大数据告诉你(二)

续接上文:还不知道数据类岗位的相关技能和职责吗?涤生大数据告诉你(一) 1.数据治理工程师 工作职责 数据治理工程师的工作职责主要包括以下几个方面: 1. 数据管理策略制定:制定和实施数据管理策略&#…...

常见应用层协议

一.HTTP(超文本传输协议) HTTP 和 HTTPS 二.FTP(文件传输协议) 三.SMTP(简单邮件传输协议) 四.POP3(邮局协议版本3) 五.IMAP(互联网消息访问协议) 六.DNS&am…...

解决docker容器无法关闭的问题

一般正常关闭: docker stop 容器ID解决方法 方法1:强制停止docker kill 容器ID方法2:直接重启dockersudo service docker stop方法3:直接删除容器,重新创建docker rm -f my_container...

2023-09-27 LeetCode每日一题(餐厅过滤器)

2023-09-27每日一题 一、题目编号 1333. 餐厅过滤器二、题目链接 点击跳转到题目位置 三、题目描述 给你一个餐馆信息数组 restaurants,其中 restaurants[i] [idi, ratingi, veganFriendlyi, pricei, distancei]。你必须使用以下三个过滤器来过滤这些餐馆信息…...

梯度下降法(SGD)原理

目录 梯度下降法(SGD)原理:求偏导 1. 梯度(在数学上的定义) 2. 梯度下降法迭代步骤 BGD批量梯度下降算法 BGD、SGD在工程选择上的tricks 梯度下降法(SGD)原理:求偏导 1. 梯度(在数学上的定义) 表示某一函数在该点处的方向导数沿着该方向取得最大值…...

QQ表情包存储位置解析

一些常见的设备和系统的QQ表情包存储位置: Windows系统: 路径:C:\Users[用户名]\Documents\Tencent Files[QQ号码]\Image\Image\CustomFace 在这个文件夹中,您可以找到所有自定义的QQ表情包。 Android系统: 路径&am…...

软件架构的演化和维护

软件架构的演化和维护 定义 定义 顶不住了,刷题去了,不搞这个了,想吐。。。...

C语言数组和指针笔试题(四)(一定要看)

目录 二维数组例题一例题二例题三例题四例题五例题六例题七例题八例题九例题十例题十一 结果 感谢各位大佬对我的支持,如果我的文章对你有用,欢迎点击以下链接 🐒🐒🐒个人主页 🥸🥸🥸C语言 🐿️…...

FragmentManager is already executing transactions

本文解决问题: java.lang.IllegalStateException: FragmentManager is already executing transactions 问题背景描述: 在Fragment中 用tablayoutviewpagerfragment,即Fragment嵌套Fragment场景、或者ViewPager2嵌套ViewPager2时。 执行生命…...

Matlab中clear,close all,clc功能详细说明

背景: 我们在写matlab程序时,首行总是先敲入:clear; close all; clc;,但你真的知道这三句话的具体作用嘛,下面进行详细说明和演示。 一、clear的功能 clear的功能:清理工作区变量,不清理前是…...

Typora安装无需破解免费使用

Typora简介: 在介绍Typora软件之前,需要先介绍一下MARKDOWN。 MARKDOWN是一种轻量型标记语言,它具有“极简主义”、高效、清晰、易读、易写、易更改纯文本的特点。 Typora 是一款支持实时预览的 Markdown 文本编辑器。它有 OS X、Windows、…...

LuatOS-SOC接口文档(air780E)--errDump - 错误上报

示例 -- 基本用法, 10分钟上报一次,如果有的话 if errDump thenerrDump.config(true, 600) end-- 附开源服务器端: https://gitee.com/openLuat/luatos-devlogerrDump.dump(zbuff, type, isDelete) 手动读取异常日志,主要用于用户将日志发送给自己的服务器而不是I…...

低代码平台如何助力国内企业数字化转型?

数字化是什么 数字化(Digitalization)是将许多复杂多变的信息转变为可以度量的数字、数据,再以这些数字、数据建立起适当的数字化模型,把它们转变为一系列二进制代码,引入计算机内部,进行统一处理&#xf…...

SI3262—高度集成的低功耗SOC芯片

Si3262是一款高度集成的低功耗SOC芯片,其集成了基于RISC-V核的低功耗MCU和工作在13.56MHz的非接触式读写器模块。 MCU模块具有低功耗、Low Pin Count、宽电压工作范围,集成了13/14/15/16位精度的ADC、LVD、UART、SPI、I2C、TIMER、WUP、IWDG、RTC、TSC等…...

除静电离子风机在无尘车间的应用

除静电离子风机在无尘车间中的应用非常广泛,主要是用来控制车间内的静电荷,防止静电对车间内的电子元器件、电路板等敏感部件产生损害。 具体来说,除静电离子风机通常采用电离器产生大量负离子,将车间内的静电荷中和成无害的水蒸气…...

Linux上的Pip和Python升级指南

在Linux系统上,保持Pip和Python版本的最新状态对于顺利进行Python开发至关重要。通过升级Pip和Python,你可以享受到最新的功能、修复的bug以及提升的开发效率。本文将为你提供在Linux上升级Pip和Python的详细指南,助你打造更强大的开发环境。…...

4G工业路由器高效数据传输助力光伏发电站管理

光伏发电站是能源产业中一种利用太阳能技术将光转化为电能的常见设施。随着物联网技术与环保能源的不断进步和应用的普及,光伏发电站的管理也变得更加便捷高效。 光伏发电站结合4G工业路由器实现远程监控管理,并用于采集发电站中的传感器数据和监控信息…...

【音视频笔记】Mediacodec+Muxer生成mp4,浏览器无法播放问题处理

文章目录 背景解决过程曲线修复方案 解决问题根源 背景 最近在测试视频录制功能时发现,AudioRecord MediaCodec MediaMuxer生成的MP4,PC浏览器无法播放 ,但是Android、Windows、Mac的播放器应用都能正常播放。虽然不禁想吐槽浏览器视频组件…...

debug过程中,矩阵左乘右乘相关概念梳理

1. 变换点或者变换向量 1.1左乘 矩阵左乘通常是指对”目标点“进行左乘,即: A ′ R ∗ A AR*A A′R∗A 其中,A为原始3维点,表示一个3*1的列向量,R为33的旋转矩阵,A‘为变换后的点 B ′ T ∗ B BT*B B′T∗B 其中…...

Ubuntu 安装Kafka

在本指南中,我们将逐步演示如何在 Ubuntu 22.04 上安装 Apache Kafka。 在大数据中,数以百万计的数据源生成了大量的数据记录流,这些数据源包括社交媒体平台、企业系统、移动应用程序和物联网设备等。如此庞大的数据带来的主要挑战有两个方面…...

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…...

IGP(Interior Gateway Protocol,内部网关协议)

IGP(Interior Gateway Protocol,内部网关协议) 是一种用于在一个自治系统(AS)内部传递路由信息的路由协议,主要用于在一个组织或机构的内部网络中决定数据包的最佳路径。与用于自治系统之间通信的 EGP&…...

Maven 概述、安装、配置、仓库、私服详解

目录 1、Maven 概述 1.1 Maven 的定义 1.2 Maven 解决的问题 1.3 Maven 的核心特性与优势 2、Maven 安装 2.1 下载 Maven 2.2 安装配置 Maven 2.3 测试安装 2.4 修改 Maven 本地仓库的默认路径 3、Maven 配置 3.1 配置本地仓库 3.2 配置 JDK 3.3 IDEA 配置本地 Ma…...

使用 SymPy 进行向量和矩阵的高级操作

在科学计算和工程领域,向量和矩阵操作是解决问题的核心技能之一。Python 的 SymPy 库提供了强大的符号计算功能,能够高效地处理向量和矩阵的各种操作。本文将深入探讨如何使用 SymPy 进行向量和矩阵的创建、合并以及维度拓展等操作,并通过具体…...

大语言模型(LLM)中的KV缓存压缩与动态稀疏注意力机制设计

随着大语言模型(LLM)参数规模的增长,推理阶段的内存占用和计算复杂度成为核心挑战。传统注意力机制的计算复杂度随序列长度呈二次方增长,而KV缓存的内存消耗可能高达数十GB(例如Llama2-7B处理100K token时需50GB内存&a…...

docker 部署发现spring.profiles.active 问题

报错: org.springframework.boot.context.config.InvalidConfigDataPropertyException: Property spring.profiles.active imported from location class path resource [application-test.yml] is invalid in a profile specific resource [origin: class path re…...

【生成模型】视频生成论文调研

工作清单 上游应用方向:控制、速度、时长、高动态、多主体驱动 类型工作基础模型WAN / WAN-VACE / HunyuanVideo控制条件轨迹控制ATI~镜头控制ReCamMaster~多主体驱动Phantom~音频驱动Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation速…...

STM32HAL库USART源代码解析及应用

STM32HAL库USART源代码解析 前言STM32CubeIDE配置串口USART和UART的选择使用模式参数设置GPIO配置DMA配置中断配置硬件流控制使能生成代码解析和使用方法串口初始化__UART_HandleTypeDef结构体浅析HAL库代码实际使用方法使用轮询方式发送使用轮询方式接收使用中断方式发送使用中…...

Git 3天2K星标:Datawhale 的 Happy-LLM 项目介绍(附教程)

引言 在人工智能飞速发展的今天,大语言模型(Large Language Models, LLMs)已成为技术领域的焦点。从智能写作到代码生成,LLM 的应用场景不断扩展,深刻改变了我们的工作和生活方式。然而,理解这些模型的内部…...

毫米波雷达基础理论(3D+4D)

3D、4D毫米波雷达基础知识及厂商选型 PreView : https://mp.weixin.qq.com/s/bQkju4r6med7I3TBGJI_bQ 1. FMCW毫米波雷达基础知识 主要参考博文: 一文入门汽车毫米波雷达基本原理 :https://mp.weixin.qq.com/s/_EN7A5lKcz2Eh8dLnjE19w 毫米波雷达基础…...