当前位置: 首页 > news >正文

2023大数据-架构师案例(八)

Lambda架构

  1. nginx (b) Hbase (c)Spark Streaming (d)Spark (e)MapReduce

(f)ETL (g)MemSQL  (h)HDFS (i)Flume (k)数据存储层
(l)kafka数据采集层 (m)业务逻辑层

将上面分别填入其中(9分)

1 d spark

2 e MapReduce

3 k 数据存储层

4 g MemSQL

5 h HDFS

6 I kafka

7 flume

8 ETL

解析:

ETL采用Sqoop/Datax来数据迁移到分布式存储文件HDFS,之后通过Spark和MapReduce工具离线计算处理,将结果视图发送到hive数据仓库,将结果存储到HDFS。

Nginx则是用flume采集信息,通过kafka实时数据集成,Spark Steaming计算处理分析,把结果存储到MemSQL/Doris。

合并计算则是用Spark来将批处理和实时处理的数据合并存储到HBase。

数据源:HDFS

批处理层:Offline Hive/MR/Spark

加速层:Flink/Storm

数据迁移:Collector/DataX/Sqoop

服务层:MongoDB/HBase/Redis OneDataAPI

Kappa架构

Kappa则是去掉了批处理层,所以处理历史数据的能力比Lambda架构差点。

业务和技术需求方面:

Lambda架构依赖Hadoop,Spark,Storm技术。

Kappa依赖Flink计算引擎,偏流式计算。

Hadoop里的HDFS是用于海量存储,而MapReduce则是用于海量计算。

相关文章:

2023大数据-架构师案例(八)

Lambda架构 nginx (b) Hbase (c)Spark Streaming (d)Spark (e)MapReduce (f)ETL (g)MemSQL (h)HDFS &#x…...

【Python】Python:探索未来科技的风向标

Python:探索未来科技的风向标 一、背景 近年来,随着人工智能、大数据、云计算等技术的飞速发展,Python 作为一门功能强大、简单易学的编程语言,逐渐成为了开发者的首选。在我国,Python 的热度持续攀升,不…...

Java语言程序设计——篇十一(6)

🌿🌿🌿跟随博主脚步,从这里开始→博主主页🌿🌿🌿 欢迎大家:这里是我的学习笔记、总结知识的地方,喜欢的话请三连,有问题可以私信🌳🌳&…...

2024年有哪些好用的文件加密软件?十款常用加密软件推荐

在2024年,随着数据泄露和网络威胁的日益复杂,文件加密软件成为了保护敏感信息不可或缺的工具。无论是个人用户还是企业,选择合适的加密软件都是确保数据安全的重要一环。 1. 安秉加密软件 安秉加密软件专为企业设计,提供全面的信…...

书生大模型学习笔记3 - 书生开源大模型链路体系

学习视频链接:书生浦语大模型全链路开源体系_哔哩哔哩_bilibili...

【竞技宝】奥运会:法国国奥淘汰埃及国奥晋级决赛

法国国奥在巴黎奥运会男足半决赛跟埃及国奥相遇,赛前大部分球迷和媒体,都一边倒看好法国国奥能轻松获胜。首先,法国国奥整体实力高出一个档次。最后,法国国奥坐拥主场作战的优势。所以,法国国奥正常发挥的话&#xff0…...

C++的STL简介(四)

目录 1.List 2.list 模拟实现 2.1基本框架 2.2 list_node 2.3 list 2.3.1 默认构造 2.3.2 析构函数 2.3.3 begin() 2.3.4 end() 2.3.5 size() 2.3.6 empty() 2.3.7 inser…...

NIO专题学习(一)

一、BIO/NIO/AIO介绍 1. 背景说明 在Java的软件设计开发中,通信架构是不可避免的。我们在进行不同系统或者不同进程之间的数据交互,或者在高并发的通信场景下都需要用到网络通信相关的技术。 对于一些经验丰富的程序员来说,Java早期的网络…...

Linux学习笔记:Linux基础知识汇总(个人复习版)

常用命令: 1、ls -a:显示所有文件(包括隐藏文件),简洁版 -l:显示所有文件,详细版 -R:显示所有文件以及子目录下文件,简洁版 可以搭配使用。 2、netstat -i&#x…...

MSR020/MSR040低温漂、低功耗电压基准

MSR020/MSR040 是低温漂、低功耗、高精度 CMOS 电压基准, 具有 0.05% 初始精度和低功耗的特点。 该器件的低输出电压迟滞和低长期输出电压漂移的 特性,可以进一步提高稳定性和系统可靠性。 此外,器 件的小尺寸和低工作电流的特性使其非…...

一个是生产打包的时候, 一个是本地测试启动的时候,maven如何配置?

在Maven项目中,使用两套不同的pom.xml配置分别用于生产打包和本地测试启动是常见需求,尤其当你需要调整依赖范围、插件配置或使用不同资源文件时。Maven通过profiles和activeProfiles提供了灵活的配置管理方案,允许你为不同的环境或构建场景定…...

公文字体包下载

https://zuzhibu.xaufe.edu.cn/info/1063/3421.htm 下载解压后,将相应字体文件粘贴至C:\Windows\Fonts 等待安装完成就可以了...

主从备份及安装准备

主从复制 学习内容 1. 备份的三种类型 1. 热备份 2. 逻辑备份 3. 物理备份 2. 情景 ⼊职企业,发现企业架构为⼀主多从,但是两台从服务器和主库不同 步,但是每天会全库北⽅主服务器上的数据到从服务器,由于数据量 不是很⼤&a…...

翻译英文的软件,分享3款翻译神器!

在这个全球化的时代,跨越语言障碍成为了我们连接世界的桥梁。无论你是旅行爱好者、国际商务人士,还是学习新语言的求知者,一款高效、准确的翻译软件都是不可或缺的伙伴。今天,就让我们一起探索那些让沟通无界限的翻译神器&#xf…...

软件测试解读——性能效率测试

一、性能效率测试概述 性能效率(efficiency)为GB/T 25000.51-2016标准中提及的软件产品的八大产品质量特征之一。性能效率测试用于评估待测系统与软件在给定的时间和其他资源限制下完成其指定功能的程度,也称作性能测试。 为完成系统与软件性能测试,…...

【PLC】子程序功能心得

博主用GX Works编程的时候用到子程序,这里给大家和自己强调一下,每个子程序一定要以SRET结束,尤其是有多个子程序的时候 博主吃了个大亏,由于有两个子程序,结果第一个子程序没有写SRET,结果两个子程序默认以…...

Iris for mac 好用的录屏软件

Iris 是一款高性能屏幕录像机,可录制到 h.264。Iris 在可用时利用板载 GPU 加速。它可以选择包括来自摄像头和最多两个麦克风的视频。 兼容性 所有功能在macOS 11.0-14上完全支持,包括macOS Sonoma。 简单编码 直接录制为h.264、h.265、ProRes或Motion…...

Transformers实战05-模型量化

文章目录 简介主要类型量化的优点量化的缺点量化过程量化过程反量化过程 精度和参数 量化实例bitsandbytes安装bitsandbytes4bit量化(加载)8bit量化(加载)验证效果 简介 模型量化(Model Quantization)是一种优化技术,旨在减少机器学习模型的…...

【Python】bytes 和 bytearray 到底是什么类型呢?

bytes和bytearray同属于二进制序列类型,是常见的数值类型的一种。 bytes多用在在文件的读写、网络通信、数据编码/解码等场景用的比较多。 而bytearray在二进制数据处理、图像处理、内存映射文件和网络通信等场景用的比较多。 其中这两部分的主要差别: …...

Windows10上安装SQL Server 2022 Express

Microsoft SQL Server 2022 Express是一个功能强大且可靠的免费数据管理系统,可为轻量级网站和桌面应用程序提供丰富可靠的数据存储,为关系数据库: (1).LocalDB(SqlLocalDB):是Express的一种轻型版本,该版本具备所有可…...

Java项目Loom升级实战:3步完成Spring WebFlux与虚拟线程深度整合(附压测对比数据)

第一章:Java项目Loom响应式编程转型概览Java Loom 项目引入的虚拟线程(Virtual Threads)与结构化并发(Structured Concurrency)为响应式编程范式带来了根本性变革。它并非替代 Project Reactor 或 RxJava,而…...

运维系列【仅供参考】:Centos7 后台执行(nohup命令)

Centos7 后台执行(nohup命令) Centos7 后台执行(nohup命令) nohup命令详解 nohup和&的区别 nohup 命令 & 2>&1的问题 Centos7 后台执行(nohup命令) nohup命令详解 nohup 命令运行由 Command参数和任何相关的 Arg参数指定的命令,忽略所有挂断(SIGHUP)…...

收藏!行业寒冬下,程序员薪资翻倍的秘密的是大模型(小白必看)

当下职场,程序员圈最热议的话题莫过于“行业寒冬”——降薪、裁员、优化成为常态,不少传统开发岗缩招严重,甚至有多年经验的工程师都面临失业危机…… 但诡异的是,另一边却有一批程序员逆势突围:薪资翻倍、Offer拿到手…...

创龙RK3568文件系统定制指南:5分钟快速添加自定义目录到rootfs

创龙RK3568文件系统定制指南:5分钟快速添加自定义目录到rootfs 在嵌入式Linux开发中,文件系统定制是每个开发者都会遇到的核心需求。想象一下这样的场景:你正在为智能家居网关设备开发固件,需要在根文件系统中添加一个/iot/config…...

Windows苹果设备驱动安装难题的终极解决方案

Windows苹果设备驱动安装难题的终极解决方案 【免费下载链接】Apple-Mobile-Drivers-Installer Powershell script to easily install Apple USB and Mobile Device Ethernet (USB Tethering) drivers on Windows! 项目地址: https://gitcode.com/gh_mirrors/ap/Apple-Mobile…...

LangFlow从安装到实战:可视化搭建多智能体应用完整教程

LangFlow从安装到实战:可视化搭建多智能体应用完整教程 1. LangFlow简介 LangFlow是一款革命性的低代码AI应用构建工具,它通过可视化界面让开发者能够像搭积木一样快速组合各种AI组件。无论你是想构建智能客服、文档分析系统还是多智能体协作应用&…...

COMSOL几何建模避坑指南:从二维草图到三维模型的完整参数化流程

COMSOL几何建模避坑指南:从二维草图到三维模型的完整参数化流程 几何建模是COMSOL仿真分析的基础环节,一个优秀的参数化模型不仅能提升工作效率,更能为后续的多物理场耦合分析奠定坚实基础。本文将系统梳理从二维草图到三维成型的完整工作流&…...

Room数据库迁移踩坑实录:从手动到自动的完整避坑指南

Room数据库迁移实战:从手动到自动的完整避坑指南 去年在重构一个百万级用户的金融类App时,我们团队在数据库迁移上栽了个大跟头。某个深夜的紧急更新后,部分用户的交易记录突然"消失",最终排查发现是漏掉了一个Migratio…...

Qwen3-ASR-0.6B入门指南:语音识别模型推理框架vLLM异步服务配置

Qwen3-ASR-0.6B入门指南:语音识别模型推理框架vLLM异步服务配置 1. 快速了解Qwen3-ASR-0.6B Qwen3-ASR-0.6B是一个专门用于语音识别的AI模型,属于Qwen3-ASR系列中的轻量级版本。这个模型最大的特点是既能识别语音内容,还能判断说话人使用的…...

人工智能音乐创作平台版权授权纷争背后的监管隐忧

【人工智能音乐分享权:环球与 Suno 的分歧焦点】据英国《金融时报》报道,人工智能驱动的音乐创作平台 Suno 与环球音乐集团、索尼音乐娱乐公司在授权协议上陷入僵局,核心分歧在于用户是否能分享人工智能生成歌曲。环球音乐希望曲目仅能在 Sun…...