主流云平台(AWS、华为云、阿里云、Google Cloud等)的**大数据及人工智能技术栈**及其核心组件的深度解析
云计算系列文章:
1. GCP(Cloud-native stack)的云原生技术栈介绍
2. 主流云厂商的云原生技术栈(Cloud-native stack)及其核心组件对比
3. 主流云平台(AWS、华为云、阿里云、Google Cloud等)的大数据及人工智能技术栈及其核心组件的深度解析
目前项目要用到大数据及AI,于是在网上研究了一下各大平台的技术栈及其核心组件,现分享一下,包括AWS、华为云、阿里云、Google Cloud等,涵盖技术架构、核心服务和典型应用场景:
一、大数据与AI技术栈分层架构
云厂商的技术栈通常分为以下核心层级:
- 数据基础设施层:存储、计算、网络
- 数据处理层:批处理/流处理/数据仓库
- AI/ML引擎层:训练、推理、工具链
- 应用服务层:行业化AI解决方案
- 治理与安全:数据治理、隐私保护
二、主流云厂商技术栈对比
1. AWS大数据与AI技术栈
核心优势:最完整的Serverless大数据服务 + 企业级AI工具链
-
大数据核心服务:
- 存储层
- S3(对象存储):EB级存储,支持智能分层
- EBS/EFS(块/文件存储):低延迟访问
- 计算层
- EMR(弹性MapReduce):托管Spark/Hadoop
- Glue(ETL服务):无服务器数据编排
- 数据分析
- Redshift:云数据仓库(支持PB级分析)
- Athena:S3上的交互式SQL查询
- Kinesis:实时流处理(对标Kafka)
- 存储层
-
AI/ML核心服务:
- 基础平台
- SageMaker:全托管ML平台(从训练到部署)
- Bedrock:企业级生成式AI服务(集成Claude/LLaMA等模型)
- 专项能力
- Rekognition:图像/视频分析(万级类别识别)
- Lex:对话式AI(支撑Alexa)
- 加速硬件
- Trainium/Inferentia:自研AI训练/推理芯片
- 基础平台
典型场景:Netflix(用EMR处理每日PB级用户行为数据)+ Airbnb(用SageMaker优化动态定价)
2. 华为云大数据与AI技术栈
核心优势:电信级可靠性 + 昇腾AI芯片软硬协同
-
大数据核心服务:
- 存储层
- OBS(对象存储):支持跨Region同步
- CloudTable:时序数据库(物联网场景优化)
- 计算层
- MRS(MapReduce服务):国产化Spark/Flink发行版
- DLI(数据湖探索):Serverless SQL交互分析
- 实时计算
- CloudStream:基于Flink的流处理引擎
- 存储层
-
AI/ML核心服务:
- 基础平台
- ModelArts:一站式AI开发平台(支持昇腾NPU加速)
- MindSpore:自研AI框架(国产替代TensorFlow/PyTorch)
- 行业AI
- HiLens:端云协同AI开发(用于智能摄像头等边缘设备)
- GaussDB(AI版):内嵌ML算法的分析型数据库
- 硬件底座
- 昇腾910B:算力达256TOPS(INT8)的AI芯片
- 基础平台
典型场景:中国移动(用MRS处理5G信令数据)+ 比亚迪(用ModelArts训练车机视觉模型)
3. 阿里云大数据与AI技术栈
核心优势:超大规模实践 + 电商场景验证
-
大数据核心服务:
- 存储层
- OSS(对象存储):支撑双11百万级QPS
- PFS:并行文件系统(高性能计算场景)
- 计算层
- MaxCompute(ODPS):EB级数据仓库(阿里内部100%跑其上)
- Realtime Compute for Apache Flink:阿里优化版Flink
- 实时数仓
- Hologres:实时分析引擎(亚秒级响应)
- 存储层
-
AI/ML核心服务:
- 基础平台
- PAI(Platform for AI):支持千卡级分布式训练
- DeepRec:推荐算法优化框架(淘宝核心推荐系统使用)
- 行业方案
- 通义千问:自研大模型(已集成到钉钉/天猫精灵)
- 视觉智能开放平台:2000+预训练模型
- 硬件创新
- 含光800:自研AI推理芯片(ResNet50性能达78578 FPS)
- 基础平台
典型场景:淘宝推荐系统(PAI+DeepRec处理日均万亿级特征)+ 高德地图(MaxCompute分析路径规划数据)
4. Google Cloud大数据与AI技术栈
核心优势:全球数据分布 + 原生AI研究能力
-
大数据核心服务:
- 存储层
- Cloud Storage:多区域自动复制
- Bigtable:PB级NoSQL数据库(支撑Google搜索)
- 计算层
- Dataproc:托管Spark/Hadoop
- Dataflow:完全托管式Apache Beam流批一体处理
- 分析服务
- BigQuery:Serverless数仓(支持SQL机器学习)
- Looker:BI可视化工具
- 存储层
-
AI/ML核心服务:
- 基础平台
- Vertex AI:统一MLOps平台(集成TensorFlow/Kubeflow)
- TPU Pods:千卡级AI训练集群
- 生成式AI
- Gemini API:多模态大模型服务
- Duet AI:编码助手(集成到Google Cloud IDE)
- 数据科学
- Colab:基于浏览器的Python Notebook
- 基础平台
典型场景:Spotify(用BigQuery分析4亿用户行为)+ SpaceX(用TPU训练卫星图像识别模型)
三、技术栈选型关键维度对比
| 维度 | AWS | 华为云 | 阿里云 | Google Cloud |
|---|---|---|---|---|
| 大数据吞吐能力 | ⭐⭐⭐⭐(EMR+S3) | ⭐⭐⭐(MRS+OBS) | ⭐⭐⭐⭐⭐(MaxCompute) | ⭐⭐⭐⭐(BigQuery) |
| AI训练规模 | ⭐⭐⭐⭐(SageMaker+Trainium) | ⭐⭐⭐⭐(ModelArts+昇腾) | ⭐⭐⭐⭐⭐(PAI+含光) | ⭐⭐⭐⭐⭐(Vertex AI+TPU) |
| 实时计算能力 | ⭐⭐⭐(Kinesis) | ⭐⭐⭐⭐(CloudStream) | ⭐⭐⭐⭐⭐(Flink优化版) | ⭐⭐⭐⭐(Dataflow) |
| 国产化替代 | × | ⭐⭐⭐⭐⭐(全栈自研) | ⭐⭐⭐(部分自主可控) | × |
四、前沿技术趋势
- 湖仓一体架构:
- AWS:Lake Formation + Redshift Spectrum
- 阿里云:MaxCompute-Hologres联邦查询
- AI-Native数据库:
- Google BigQuery ML(直接运行SQL训练模型)
- 华为云GaussDB(AI版)
- 边缘智能:
- 华为云KubeEdge + ModelArts Edge
- AWS IoT Greengrass + SageMaker Edge
相关文章:
主流云平台(AWS、华为云、阿里云、Google Cloud等)的**大数据及人工智能技术栈**及其核心组件的深度解析
云计算系列文章: 1. GCP(Cloud-native stack)的云原生技术栈介绍 2. 主流云厂商的云原生技术栈(Cloud-native stack)及其核心组件对比 3. 主流云平台(AWS、华为云、阿里云、Google Cloud等)的…...
智能粉尘监测解决方案|守护工业安全,杜绝爆炸隐患
在厂房轰鸣的生产线上,一粒微小粉尘的聚集可能成为一场灾难的导火索。如何实现粉尘浓度的精准监控与快速响应?我们为您打造了一套"感知-预警-处置"全闭环的智能安全方案! 行业痛点:粉尘管理的生死线 在金属加工、化工…...
阿里 FunASR 开源中文语音识别大模型应用示例(准确率比faster-whisper高)
文章目录 Github官网简介模型安装非流式应用示例流式应用示例 Github https://github.com/modelscope/FunASR 官网 https://www.funasr.com/#/ 简介 FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端…...
漏洞预警 | Windows 文件资源管理器欺骗漏洞(CVE-2025-24071、CVE-2025-24054)
1漏洞概述 漏洞类型 信息泄露 漏洞等级 高 漏洞编号 CVE-2025-24071、 CVE-2025-24054 漏洞评分 7.5 利用复杂度 中 影响版本 Windows三月更新前版本 利用方式 本地 POC/EXP 已公开 近日,微软发布windows操作系统更新修复漏洞,其中Windo…...
常见集合篇(二)数组、ArrayList与链表:原理、源码及业务场景深度解析
常见集合篇:数组、ArrayList与链表:原理、源码及业务场景深度解析 常见集合篇(二)数组、ArrayList与链表:原理、源码及业务场景深度解析1. 数组1.1 数组概述1.1.1 数组的定义与特点1.1.2 业务场景举例 1.2 寻址公式1.2…...
redis 缓存命中率降低,该如何解决?
命中率降低 Redis 缓存命中率降低,可能是由于多个因素导致的,比如缓存未命中、缓存污染、缓存淘汰过快等。针对不同情况,可以采取以下优化措施: 1. 分析缓存命中率下降的原因 在优化之前,先使用 Redis 监控工具 分析…...
LiteDB 数据存储与检索效率优化的最佳实践指导
一、引言 在当今数字化时代,数据处理和存储变得至关重要。对于小型项目或者嵌入式系统而言,需要一种轻量级、高效且易于使用的数据库解决方案。LiteDB 作为一款嵌入式的 NoSQL 数据库,因其零配置、易于集成等特点,受到了开发者的青睐。然而,若要充分发挥其性能优势,就需…...
数据结构——Map和Set
1. 搜索树 1. 概念 ⼆叉搜索树⼜称⼆叉排序树,它可以是⼀棵空树,或者是具有以下性质的⼆叉树: • 若它的左⼦树不为空,则左⼦树上所有节点的值都⼩于根节点的值 • 若它的右⼦树不为空,则右⼦树上所有节点的值都⼤于根节点的值…...
树莓派超全系列文档--(18)树莓派配置音频
这里写目录标题 音频更改音频输出通过桌面音量控制专业音频设备配置文件 通过 raspi-config 文章来源: http://raspberry.dns8844.cn/documentation 原文网址 音频 Raspberry Pi OS 有多种音频输出模式: 默认情况下,Raspberry Pi OS 将音频…...
Flutter中实现拍照识题的功能
文章目录 **1. 功能拆解****2. 具体实现步骤****(1) 拍照或选择图片****(2) 图片预处理(可选)****(3) 文字识别(OCR)****(4) 数学公式识别 → LaTeX****方案1:Mathpix API(高精度,付费ÿ…...
装饰器模式:如何用Java打扮一个对象?
引言装饰器模式具体实例共有接口类具体被装饰类抽象装饰器类具体装饰器类 测试装饰器模式的实际应用Java I/O 体系游戏开发中的角色装备系统 总结 引言 在生活中,我们都知道一句话,“人靠衣装马靠鞍”,如果想要让自己在别人眼里看起来更加好…...
OpenCV 图形API(或称G-API)(1)
操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 引言 OpenCV 图形API(或称G-API)是一个新的OpenCV模块,旨在使常规图像处理更快且更便携。通过引入一种新的基于图的执行…...
学以致用,基于OpenCV的公摊面积估算程序
由于很多户型图并没有标注各个房间或者走廊的面积,亦或比较模糊,且很多人并不具备迅速口算多个小数相加再做除法的能力,本帖通过程序粗略计算公摊比例。由于非专业人士,公摊面积涉及到很多建筑学的专业公式,因此本帖只…...
爬虫:网络请求(通信)步骤,http和https协议
电脑(浏览器):www.baidu.com——url DNS服务器:IP地址标注服务器——1.1.38 DNS服务器返回IP地址给浏览器 浏览器拿到IP地址去访问服务器,返回响应 服务器返回给响应数据:html/css/js/jpg... html:文本 cs…...
d2025331
目录 一、删除有序数组中的重复项II 二、删除有序数组中的重复项 三、数字转罗马格式 一、删除有序数组中的重复项II 一下写过,挺舒服! 1、统计超出2的数量有多少,仅保留2个重复数字 2、有多少次就从后往前覆盖几次 public int removeDupl…...
QT6开发指南笔记(1)QT简介,安装
(1)刚刚结束了 C 的学习,谢谢阿西老师的教导,开始 QT 的学习,运用 C ,而非 QML 。 保持知识的连贯性。 QT 公司 : (2)接着介绍 QT 的安装: 提取到的…...
Redis BitMap 实现签到及连续签到统计
一、引言 用户签到功能是很多应用都离不开的一个板块,单词打开、QQ达人等等为我们所熟知,这项功能该如何实现呢,一些朋友可能想当然的觉得无非将每日的签到数据记录下来不就好了,不会去细想用谁记录,如何记录才合适。 …...
全面解析 Spring AOP 切入点表达式
全面解析 Spring AOP 切入点表达式 大家好,我是钢板兽! Spring AOP(面向切面编程)是我们日常开发中实现日志记录、权限控制、事务管理等功能的神器。而切入点表达式(Pointcut Expression)则是这个神器的“…...
去中心化稳定币机制解析与产品策略建议
去中心化稳定币机制解析与产品策略建议(以Maker/DAI为例) 一、核心机制对比:法币抵押型 vs. 加密货币抵押型 法币抵押型(如USDT) 技术逻辑:1:1美元储备托管于中心化机构(如银行)&…...
GO语言杂记(文章持续更新)
1、MAIN冲突 在一个文件夹下有两个go文件同时写了main函数,将会报错,main函数只能在main包中。 实则不然,有些环境下并不会报错。 2、gofmt命令---自动对齐 命令作用:将go文件代码自动缩进。 gofmt -w escapecharprac.go...
OS6.【Linux】基本指令入门(5)
目录 1.配置公网IP到XShell中 2.日志 定义和作用 3.一些指令 date %Y、%m、%d、%H、%M、%S、%X、%F %s 时间戳的特点 时间戳的转换 cal cal 年份 其他选项 ★find★ whereis grep 练习 -v选项 -n选项 -i选项 多文件查找 特定目录下查找 1.配置公网IP到XShe…...
Moo0 VideoResizer,简单高效压缩视频!
Moo0 VideoResizer 是一款免费、轻量级的视频压缩工具,支持通过调整文件大小、屏幕尺寸或比特率等方式实现高效视频压缩。其核心优势在于操作简单且无需破解,可直接下载安装使用。软件注重用户友好性,采用非破坏性压缩技术,所有…...
【开发问题记录】高德地图 Web 端开发详解:高德地图 API 最佳实践指南(安装、marker添加、逆向地理编码、实际业务案例实操)
文章目录 1、引入高德地图的准备工作2、高德地图 JS API 使用方式2.1 JS API Loader2.1.1 使用 script 标签加载loader2.1.2 NPM 安装loader 2.2 script 标签加载 JS API 脚本2.2.1 同步加载2.2.2 异步加载 3、在 vue3 项目中使用3.1 安装 js api loader3.2 在组件中使用 4、实…...
Unity 简单使用Addressables加载SpriteAtlas图集资源
思路很简单,传入图集名和资源名,利用Addressables提供的异步加载方式从ab包中加载。加载完成后存储进缓存字典里,以供后续使用。 添加引用计数,防止多个地方使用同一图集时,不会提前释放 using UnityEngine; using U…...
LangChain 结构化输出:用 Pydantic + PydanticOutputParser 驯服 LLM 的“自由发挥”
目录 一、Pydantic 二、PydanticOutputParser 1、为什么需要 PydanticOutputParser? 2、Pydantic和PydanticOutputParser核心区别 3、Pydantic的不足 (1)无法直接解析非结构化文本 (2)缺乏对 LLM 输出的适配性 …...
快速入手-基于Django-rest-framework的自身组件权限认证(九)
1、在对应的视图函数里增加认证(局部起作用,不全局生效) 导入类: from rest_framework.authentication import ( BasicAuthentication, SessionAuthentication, ) from rest_framework.permissions import IsAuthentica…...
【复活吧,我的爱机!】Ideapad300-15isk拆机升级:加内存条 + 换固态硬盘 + 换电源
写在前面:本博客仅作记录学习之用,部分图片来自网络,如需引用请注明出处,同时如有侵犯您的权益,请联系删除! 文章目录 前言升级成本升级流程电池健康度加内存条和换内存条光驱位加装机械硬盘更换电池重装系…...
基于Spring AI开发本地Jenkins MCP Server服务
前言 首先介绍下MCP是什么? MCP是由开发了 Claude 模型的 Anthropic 公司2024年11月提出并开源的一项开放标准,全称:Model Context Protocol,它是一个开放协议,它使 LLM 应用与外部数据源和工具之间的无缝集成成为可能…...
基于简单神经网络的线性回归
一、概述 本代码实现了一个简单的神经网络进行线性回归任务。通过生成包含噪声的线性数据集,定义一个简单的神经网络类,使用梯度下降算法训练网络以拟合数据,并最终通过可视化展示原始数据、真实线性关系以及模型的预测结果。 二、依赖库 …...
【nvidia】Windows 双 A6000 显卡双显示器驱动更新问题修复
问题描述:windows自动更新nvidia驱动会导致只检测得到一个A6000显卡。 解决方法 下载 A6000 驱动 572.83-quadro-rtx-desktop-notebook-win10-win11-64bit-international-dch-whql.exehttps://download.csdn.net/download/qq_18846849/90554276 不要直接安装。如…...
