当前位置: 首页 > news >正文

自研芯片逾十年,亚马逊云科技Graviton系列芯片全面成熟

在云厂商自研芯片的浪潮中,亚马逊云科技无疑是最早践行这一趋势的先驱。自其迈出自研芯片的第一步起,便如同一颗石子投入平静的湖面,激起了层层涟漪,引领着云服务和云上算力向着更高性能、更低成本的方向演进。

早在2012年,自研Amazon Nitro系统的计划已经开启。目前亚马逊云科技已推出四大自研芯片产品家族:六代Amazon Nitro系统、四代通用处理器芯片Amazon Graviton、两代机器学习训练芯片Amazon Trainium和两代机器学习推理芯片Amazon Inferentia。

自2018 re:Invent 上推出第一代芯片以来,Amazon Graviton家族已经历了四代迭代。在企业降本增效的大趋势下,基于Amazon Graviton的Amazon EC2实例以及托管服务正成为越来越多客户的选择。

目前,亚马逊云科技基于Amazon Graviton的Amazon EC2实例种类达150多个,在全球已经部署的的Amazon Graviton处理器数量超过200万个,并拥有超过50,000客户,其中也涵盖了Amazon EC2前100客户90%以上。

今天我们就来看看Amazon Graviton在性能、商业落地方面的最新进展。


很多人可能好奇,作为云计算开创者的亚马逊云科技为什么要自己做芯片?我们可以从一个侧面探寻其动因。

在2022年的亚马逊云科技芯片创新日(Silicon Innovation Day)活动上,亚马逊高级副总裁兼杰出工程师James Hamilton回顾了亚马逊云科技自2012年开始的自研芯片历程。

Hamilton 表示,“最终,单台服务器的核心功能将集成为一个芯片系统。如果服务器上所有的创新将全部集中在芯片上。而我们不制造芯片,那么我们就没有创新。”

Hamilton强调了亚马逊云科技将继续加大在硬件研发方面的投入,推动下一代处理器的创新,以满足全球客户日益增长的需求。他坚信,随着技术的不断发展,亚马逊云科技将继续保持在云计算和硬件设计的前沿,引领行业走向更加高效、智能的未来。

回到Amazon Graviton,经过5年多的迭代,这一系列通用处理器芯片已经在技术、场景、商业各方面展现出日趋成熟的表现。

技术成熟:性能提升功耗下降无止尽

很多人不知道的是,在云计算厂商的身份外,亚马逊云科技自主完成所有自研芯片的开发工作,所有芯片均由Annapurna Labs团队设计和制造。

Annapurna Labs是亚马逊云科技于2015年收购的半导体微电子公司。早在收购之前,双方就在Nitro系统的开发方面紧密合作。对Annapurna Labs的收购加速了Nitro系统的开发,并加强了亚马逊云科技在硬件领域的创新实力。

目前,Annapurna Labs团队成员分布在全球多个地点,包括以色列的特拉维夫、加拿大的多伦多,以及德克萨斯州奥斯汀的实验室。

“我们的宗旨是为客户提供更多选择、更低成本和更高性能。” Annapurna Labs芯片工程总监Rami Sinno表示。“通过自主完成所有芯片的开发,避免依赖第三方,我们能够加速产品的交付进程。”

亚马逊云科技首席工程师Ali Saidi负责Amazon Graviton系列处理器的技术开发

负责Amazon Graviton技术开发的亚马逊云科技首席工程师Ali Saidi及其团队在Graviton系列的设计、制造和包装方面不断创新。譬如,在Graviton3中,研发团队将七个小型定制晶片和约550亿个晶体管整合到一个中央处理器(CPU)中。

围绕更佳性价比这一目标,每一代的Amazon Graviton都会比上一代有两位数的性能提升,且实现单位算力功耗的持续下降。譬如:

2021年推出的Amazon Graviton3,单核性能比Amazon Graviton2提升25%,浮点性能提升2倍,与同类型其他Amazon EC2实例相比,可节省60%的能源消耗。同时还首次在云计算芯片中采用性能更强、功耗更低的DDR5内存。

2023年推出的Amazon Graviton4较上一代产品性能提升高达30%,独立核心增加50%以上,内存带宽提升75%以上。

此外,通过Amazon Graviton4,亚马逊云科技实现首次面向实际应用设计CPU架构,即从传统的MicroBenchmark基准测试评价体系,转向以实际工作负载进行评价标准。通过真实工作负载雷达图,可以更好地衡量实际工作负载的优化效果。

场景成熟:支撑广泛的应用场景

历经四代产品迭代,目前Amazon Graviton支持广泛的应用场景,包括高性能计算、机器学习、人工智能、容器化应用构建、数据分析等等。比如:

在机器学习领域,Amazon Graviton在运行TensorFlow、PyTorch等深度学习框架时有出色表现,适合模型训练和推理任务,尤其在需要大量数据处理和矩阵计算的场景下。

在容器化应用构建领域,Amazon Graviton对多种容器编排工具(如ECS、EKS、Kubernetes等)和镜像仓库(如ECR、Docker Hub等)的支持,方便用户在Amazon Graviton上部署和管理容器化应用,适合微服务架构和DevOps环境。

在数据分析领域,Amazon Graviton可以在EMR、Spark等大数据分析框架上运行,支持批处理和流式数据分析等场景,适合实时数据分析和处理大规模数据集。流行的Spark框架在Graviton3上可以获得16.7%的成本节约。

亚马逊自身也是Amazon Graviton芯片的典型用户之一。2021年Prime Day期间,亚马逊首次使用Amazon Graviton2支持的Amazon EC2实例。2024年Prime-Day期间,亚马逊使用了超过25万个Graviton芯片为超过5800种不同的亚马逊电商服务提供支持。

商业成熟:新实例中“三分天下有其一”

第三方数据显示,在2023年推出的M7g系列实例中,采用Amazon Graviton的实例已经与英特尔、AMD三分天下,这进一步验证了Graviton芯片在通用实例中的受欢迎程度。

根据云成本管理和优化平台Vantage的一项调查,2024第一季度,在Amazon EC2 M7系列通用实例的成本支出方面,采用Graviton的M7g系列已经超过三分之一(34.5%)。

2024年第二季度,在Amazon RDS、Amazon ElastiCache和Amazon OpenSearch托管服务中,客户选择使用基于Amazon Graviton已超越了英特尔,越来越多客户选择基于Graviton的托管服务。

由于Amazon Graviton系列芯片对性价比的不断提升和广泛的应用场景,其也深受中国企业的青睐。

比如,全球领先IoT云平台涂鸦智能已经将整个公司40%以上的工作负载迁移到Amazon EC2 M6g和C6g新一代实例。跟上一代同配置的X86实例相比,CPU性能提升了100%,服务器单价降低20%,整体性价比提升2.5倍。

加速出海的互联网科技公司大宇无限通过使用 Amazon EMR on EKS,以及亚马逊云科技基于 ARM 架构的 Graviton2 实例,将运行大数据作业的整体性能提升了 30%,成本降低了 20%。

如今,亚马逊云科技的自研芯片之路已经走过十余年。透过已经全面成熟的Amazon Graviton系列芯片,亚马逊云科技实现深度整合硬件与软件,不仅大幅提升了云服务的体验与效率,更为全球用户带来了前所未有的云端算力性价比,开启了云计算领域的新篇章。

END

本文为「智能进化论」原创作品。

相关文章:

自研芯片逾十年,亚马逊云科技Graviton系列芯片全面成熟

在云厂商自研芯片的浪潮中,亚马逊云科技无疑是最早践行这一趋势的先驱。自其迈出自研芯片的第一步起,便如同一颗石子投入平静的湖面,激起了层层涟漪,引领着云服务和云上算力向着更高性能、更低成本的方向演进。 早在2012年&#x…...

Stable Diffusion 3 部署笔记

SD3下载地址:https://huggingface.co/stabilityai/stable-diffusion-3-medium/tree/main https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium comfyui 教程: 深度测评:SD3模型表现如何?实用教程助你玩转Stabl…...

微信小程序WXSS全局样式与局部样式的使用教程

微信小程序WXSS全局样式与局部样式的使用教程 引言 在微信小程序的开发中,样式的设计与实现是提升用户体验的关键部分。WXSS(WeiXin Style Sheets)作为微信小程序的样式表语言,不仅支持丰富的样式功能,还能通过全局样式与局部样式的灵活运用,帮助开发者构建美观且易于维…...

Docker 部署 MongoDB

🚀 作者主页: 有来技术 🔥 开源项目: youlai-mall 🍃 vue3-element-admin 🍃 youlai-boot 🍃 vue-uniapp-template 🌺 仓库主页: GitCode💫 Gitee &#x1f…...

Unity图形学之法线贴图原理

1.正常贴图:RGBA 4通道 每个通道取值范围 0-255 贴图里面取值是 0-1 2.法线贴图:法线怎么存入正常贴图的过程 每个通道里面存储的是一个向量(x,y,z,w) 通常我们会对应xyzw为rgba 存储值的范围也是0-1向量的取值范围是 -1到1法线怎么存入正常贴图的过程&…...

爬虫开发(5)如何写一个CSDN热门榜爬虫小程序

笔者 綦枫Maple 的其他作品,欢迎点击查阅哦~: 📚Jmeter性能测试大全:Jmeter性能测试大全系列教程!持续更新中! 📚UI自动化测试系列: SeleniumJava自动化测试系列教程❤ &#x1f4da…...

JVM系列之OOM观测准备

OOM, 全称 “Out Of Memory”,即内存用完的意思。JVM 因为没有足够的内存来为对象分配空间并且垃圾回收器也已经没有空间可回收时(可分配内存大于需要分配的内存), 就会抛出 java.lang.OutOfMemoryError。在实际的生产应用中,一旦…...

Qt | 开发技能提升档次哈

点击上方"蓝字"关注我们 01、Creator常用快捷键 >>> F1 查看帮助 F2 跳转到函数定义 Shift+F2 声明和定义之间切换 F3 查找下一个 F4 头文件和源文件之间切换 Ctrl+1 欢迎模式 Ctrl+2 编辑模…...

D79【 python 接口自动化学习】- python基础之HTTP

day79 requests模块发送请求 学习日期:20241125 学习目标:http定义及实战 -- requests模块进行get请求带参数&requests模块进行post请求 学习笔记: requests模块进行get请求 import requestsparams{"shouji":"130999…...

C++【日志模块中的writer类】前文中 循环队列用法

用到前文中的循环队列模板 /* ** File name: LogWriter.h ** Author: ** Date: 2024-11-4 ** Brief: 日志写入类 ** Note: 日志写入类,负责将日志写入文件和连接客户端。 ** Copyright (C) 1392019713qq.com All rights reserve…...

Linux:文件管理(一)——文件描述符fd

目录 一、文件基础认识 二、C语言操作文件的接口 1.> 和 >> 2.理解“当前路径” 三、相关系统调用 1.open 2.文件描述符 3.一切皆文件 4.再次理解重定向 一、文件基础认识 文件 内容 属性。换句话说,如果在电脑上新建了一个空白文档&#xff0…...

【C++初阶】第3课—类和对象(类的默认成员函数)

文章目录 1. 类的默认成员函数2. 构造函数3. 拷贝构造函数3.1 传值传参3.2 传值返回3.3 深拷贝和浅拷贝3.4 总结 4. 析构函数5. 赋值运算符重载5.1 运算符重载5.2 赋值运算符重载5.3 日期类的实现 6. 取地址运算符重载6.1 const 成员函数6.2 取地址运算符重载 1. 类的默认成员函…...

uni-app初学笔记:文件路径与作用

components:可复用的组件pages:页面(可见/不可见)static:静态资源,存放图片视频等 (相当于vue项目的 assets)mainjs:Vue初始化入口文件App.vue:应用配置,用来配置App全局样式以及监听pages.json :配置页面路…...

小程序-使用 iconfont 图标库报错:Failed to load font

官方默认可以忽略此错误,在清除缓存后首次刷新会显示此错误,重新渲染错误消失 解决方法: 在 iconfont 图标库选择项目设置 选中 Base64 保存,重新点击链接 -> 复制代码到项目中 操作步骤:...

【计网】自定义协议与序列化(一) —— Socket封装于服务器端改写

🌎 应用层自定义协议与序列化 文章目录: Tcp协议Socket编程 应用层简介 序列化和反序列化       重新理解read/write/recv/send及tcp的全双工       Socket封装       服务器端改写 🚀应用层简介 我们程序员写的一个个解决…...

速度革命:esbuild如何改变前端构建游戏 (1)

什么是 esbuild? esbuild 是一款基于 Go 语言开发的 JavaScript 构建打包工具,以其卓越的性能著称。相比传统的构建工具(如 Webpack),esbuild 在打包速度上有着显著的优势,能够将打包速度提升 10 到 100 倍…...

大语言模型---什么是注意力机制?LlaMA 中注意力机制的数学定义

摘要 注意力机制(Attention Mechanism)是一种在深度学习和人工智能中广泛使用的技术,旨在使模型在处理信息时能够重点关注重要的部分,从而提升任务的效率和精度。它最初应用于自然语言处理(NLP)&#xff0…...

LSA详情与特殊区域

LSA是构成LSDB的重要原材料,在OSPF中发挥很大作用。 报文 通用头部 LS age:LSA寿命,0-3600s Options:可选项 LS type:LSA类型,三要素之一 Link State ID:LSAID 三要素之一 Advertising Ro…...

Python爬虫能处理动态加载的内容吗?

Python爬虫确实可以处理动态加载的内容。动态加载的内容通常是通过JavaScript在客户端执行,这意味着当网页首次加载时,服务器返回的HTML可能并不包含最终用户看到的内容。相反,JavaScript代码会在页面加载后从服务器请求额外的数据&#xff0…...

Spring Boot Web应用开发:数据访问

数据访问是Web应用的关键部分,Spring Boot简化了这一流程,特别是通过集成Java Persistence API (JPA) 来实现数据持久化。以下是如何在Spring Boot中配置数据源、使用JPA进行数据持久化以及创建访问数据的REST接口。 配置数据源 在Spring Boot中&#…...

Vim 调用外部命令学习笔记

Vim 外部命令集成完全指南 文章目录 Vim 外部命令集成完全指南核心概念理解命令语法解析语法对比 常用外部命令详解文本排序与去重文本筛选与搜索高级 grep 搜索技巧文本替换与编辑字符处理高级文本处理编程语言处理其他实用命令 范围操作示例指定行范围处理复合命令示例 实用技…...

XML Group端口详解

在XML数据映射过程中,经常需要对数据进行分组聚合操作。例如,当处理包含多个物料明细的XML文件时,可能需要将相同物料号的明细归为一组,或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码,增加了开…...

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造,完美适配AGV和无人叉车。同时,集成以太网与语音合成技术,为各类高级系统(如MES、调度系统、库位管理、立库等)提供高效便捷的语音交互体验。 L…...

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑:陈萍萍的公主一点人工一点智能 未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战,在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…...

树莓派超全系列教程文档--(61)树莓派摄像头高级使用方法

树莓派摄像头高级使用方法 配置通过调谐文件来调整相机行为 使用多个摄像头安装 libcam 和 rpicam-apps依赖关系开发包 文章来源: http://raspberry.dns8844.cn/documentation 原文网址 配置 大多数用例自动工作,无需更改相机配置。但是,一…...

黑马Mybatis

Mybatis 表现层&#xff1a;页面展示 业务层&#xff1a;逻辑处理 持久层&#xff1a;持久数据化保存 在这里插入图片描述 Mybatis快速入门 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/6501c2109c4442118ceb6014725e48e4.png //logback.xml <?xml ver…...

Python爬虫实战:研究feedparser库相关技术

1. 引言 1.1 研究背景与意义 在当今信息爆炸的时代,互联网上存在着海量的信息资源。RSS(Really Simple Syndication)作为一种标准化的信息聚合技术,被广泛用于网站内容的发布和订阅。通过 RSS,用户可以方便地获取网站更新的内容,而无需频繁访问各个网站。 然而,互联网…...

MVC 数据库

MVC 数据库 引言 在软件开发领域,Model-View-Controller(MVC)是一种流行的软件架构模式,它将应用程序分为三个核心组件:模型(Model)、视图(View)和控制器(Controller)。这种模式有助于提高代码的可维护性和可扩展性。本文将深入探讨MVC架构与数据库之间的关系,以…...

论文浅尝 | 基于判别指令微调生成式大语言模型的知识图谱补全方法(ISWC2024)

笔记整理&#xff1a;刘治强&#xff0c;浙江大学硕士生&#xff0c;研究方向为知识图谱表示学习&#xff0c;大语言模型 论文链接&#xff1a;http://arxiv.org/abs/2407.16127 发表会议&#xff1a;ISWC 2024 1. 动机 传统的知识图谱补全&#xff08;KGC&#xff09;模型通过…...

全志A40i android7.1 调试信息打印串口由uart0改为uart3

一&#xff0c;概述 1. 目的 将调试信息打印串口由uart0改为uart3。 2. 版本信息 Uboot版本&#xff1a;2014.07&#xff1b; Kernel版本&#xff1a;Linux-3.10&#xff1b; 二&#xff0c;Uboot 1. sys_config.fex改动 使能uart3(TX:PH00 RX:PH01)&#xff0c;并让boo…...