AWS re:Invent 的创新技术

本月早些时候,Amazon 于 12 月 1 日至 5 日在内华达州拉斯维加斯举行了为期 5 天的 re:Invent 大会。如果您从未参加过 re:Invent 会议,那么最能描述它的词是“巨大”——不仅从与会者人数(60,000 人)来看,还从涵盖的主题的广度来看。MinIO 展位有 60,000 名与会者,整整 5 天都非常繁忙。因此,即使我亲自到场,我也没有机会沉浸在来自 Amazon 的有关他们来年云计算计划的所有数据中。所以,我不得不等到假期才去做大多数人认为相当书的事情。我每天观看主题演讲,仔细记录所讨论的所有内容。完成后,我已经查看了超过 10 小时的视频和超过 15 页的笔记。这项工作的目的不是为了与我内心的书取得联系,但我真的很想掌握 AI 的脉搏。以下是我所看到的事实。首先,亚马逊拥有世界上最大的云平台。其次,他们有很多客户将他们的云平台用于各种形式的 AI。他们有足够的预算来做任何他们想做的事情来帮助这些客户并保持竞争力。最后,人们普遍认为,近年来,亚马逊在人工智能方面落后于 Microsoft、谷歌和 Meta 等公司。综上所述(我的目标很简单),使用 re:Invent 主题演讲来了解 AI 在 2025 年的发展方向,以及他们实际上无限的工程资源、庞大的客户群和庞大的合作伙伴网络是否能够缩小人们认为存在的 AI 差距。以下是会议每天的主题演讲列表:
-
第 #1 天 – 周一夜现场,Peter DeSantis AWS 效用计算高级副总裁
-
第 #2 天 – AWS 首席执行官 Matt Garman 的 CEO 主题演讲
-
第 #3 天 – Swami Sivasubramanian 博士,主题演讲,AWS AI 和数据副总裁
-
第 #4 天 – AWS 全球专家和合作伙伴副总裁 Ruba Borno 博士的 AWS 合作伙伴主题演讲
-
第 #5 天 - Werner Vogels 博士,Amazon.com 副总裁兼首席技术官
回到我的 15 页笔记。我有点惊讶地发现,每个重要主题和每个宣布的新功能都很容易归入以下三个类别之一:存储、计算和 AI。这就是我将如何组织这篇文章。对于每个类别,我将给出我的总体意见,然后列出关键技术和新公告。
计算
我在 re:Invent 2024 上最大的惊喜与 Amazon 的计算目标有关。我花了一点时间才弄清楚,但很明显,他们无意成为其他供应商的芯片和服务器的供应商。相反,他们希望拥有自己设计的硬件产品。他们已经这样做了一段时间,但老实说,我不明白他们努力的规模。他们开发了自己的 CPU (Graviton2)、GPU (Trainium2)、互连 (NeuronLink) 和自定义网络协议 (SIDR)。他们的新 Trainium2 UltraServer 使用 NeuronLink 将四个 Trainium2 服务器连接在一起,形成一个用于训练和推理的巨型服务器。许多 AWS 服务使用自己的硬件,并且它们也可用作 EC2 实例类型。AWS 仍然与 Nvidia 保持合作关系,并将继续提供 Nvidia 的 GPU 作为实例类型。Trainium2 和 Graviton2 的承诺是,它们将提供优于其他芯片的成本优势。
公告
1 . 支持 Nvidia Blackwell 芯片的 P6 系列实例。
2 . 支持 Trainium2 芯片的 TRN2 系列实例。一个实例是具有 16 个 Trainium2 芯片的服务器,可提供高达 20.8 FP8 petaFLOPS 的吞吐量。
3 . TRN2 超级服务器 - 使用 neuronlink 连接 4 个 TRN2 实例 - 因此有 64 个 Trainium2 芯片。适用于无法安装在一台服务器上的模型。高达 83.2 FP8 petaFLOPS
4 . Trainium3 将于 2025 年推出 - 这将是 AWS 在 3 纳米工艺上制造的第一个芯片。它将是 Trainium2 的两倍。
存储
大多数存储公告都发生在第二天与 Matt Garman 的主题演讲中。但是,在第一天的主题演讲中,有一个非常有趣的故事,关于 Barge 项目,该项目努力构建一个巨大的存储服务器,以提高存储密度(并降低成本)。它在单个主机中有 288 个 20TB 硬盘驱动器。每个驳船机架重 4,500 磅,这意味着需要加固数据中心地板,并且需要专门的设备来移动它们。事实证明,以 7200 rpm 的速度旋转的 288 个驱动器会引起振动,从而增加故障率。一次故障的爆炸半径为 6 PB 的数据,必须花费大量资金进行恢复。最后,他们沉没了 Barge,并开始考虑如何从计算中解耦存储。一些存储公告让我印象深刻的是,对非结构化存储的需求正在增长。这在 S3 受到的关注中显而易见(请参阅下面的公告)。从 Matt 的主题演讲中宣布的一些统计数据中也可以明显看出:S3 现在存储了超过 400 万亿个对象。十年前,只有不到 100 个客户使用 S3 在 AWS 上存储了 1PB 级数据。如今,数千台存储了 1 PB,还有几家存储了超过 EB 级(这与我们的经验非常吻合)。关于非结构化存储,我的另一个想法是,Amazon 添加到其云中的许多新基础模型(将在下一节中介绍)会生成图像和视频。这些图像和视频需要存储在某个地方。如果这种风格或生成式 AI 起飞,那么对结构化数据的需求将进一步增加。在 MinIO,我们相信客户会希望为这些数据提供本地选项。Amazon 也非常重视他们的结构化数据存储解决方案。他们投入了大量精力来提高在不同区域中运行的主动-主动数据库实例之间的一致性。为此,他们重新设计了 SQL 和 noSQL 数据库中使用的事务引擎。在主题演讲的这一部分,有一个有趣的故事,关于他们如何必须将 EC2 实例与卫星同步,以更精确地保持时间同步。结果是,Aurora 和 DynamoDB 都可以使用其重新设计的事务引擎以多区域强一致性运行主动-主动。
公告
1 . S3 Table Buckets (S3 表存储桶) – 这是 Iceberg 表的一种新存储桶类型。承诺是 AWS 将负责维护 Iceberg 表所需的所有维护,例如压缩、快照管理等。初步测试表明,与暴力破解 S3“查询”相比,使用 SQL 的表存储桶的查询性能提高了 3 倍。
2 . S3 元数据 – 此功能允许您获取与对象关联的元数据并将其存储在表存储桶中。然后,您可以使用自己喜欢的分析工具来交互和查询元数据并获取关联的对象。
3 . Amazon Aurora DSQL(分布式 SQL 数据库)使用新事务引擎的区域之间具有很强的一致性。
4 . Amazon DynamoDB 全局表现在支持多区域强一致性。这是重新设计的事务引擎的应用程序,该引擎已应用于 DynamoDB,这是 Amazon 的 NoSQL 数据库。
人工智能
到目前为止,今年 re:Invent 大会上的大多数公告都是关于 AI 的。其中一些公告是在 Matt Garman 的第二次主题演讲中发布的,也是在第三天的 Swami Sivasubramanian 主题演讲中发布的。Swami 的主题演讲中充满了公告,几乎完全集中在 AI 上。有些是微不足道的,如果 Amazon 将它们分块,所有的公告都会更容易消化。我在下面描述了它们,但我应用了以下分类,这是我自己做的。
-
护栏 - 用于双重检查模型
-
与 Meta、Google 和 Microsoft 竞争的基础模型;
-
开发人员工具 - 用于代码生成和自动化软件开发生命周期的各个部分。
-
Agentic AI 可帮助客户自动化 AWS 的其他部分。
-
杂项 - 一些不适合我上面的类别。
护栏公告
1 . Amazon Bedrock 自动推理检查 – 这是一个护栏,旨在防止由于模型幻觉而导致的事实错误。
2 . Amazon SageMaker HyperPod 任务治理。最大限度地提高加速器利用率并降低模型训练、微调和推理的成本。
3 . Amazon Bedrock Guardrails 多模式毒性检测。图像内容的可配置保护措施。适用于具有映像支持的 Amazon Bedrock 中的所有基础模型。过滤掉图像中的暴力、仇恨和不当行为。
基础模型公告
1 . Amazon Nova – Foundation 模型有四种风格:Micro、Lite、Pro 和 Premier。
2 . Amazon Nova Canvas - 图像生成模型
3 . Amazon Nova Reel – 视频生成模型 – 今天的 6 秒视频。2 分钟的视频即将推出。
4 . poolside 即将来到 Bedrock - poolside assistant (Malibu 和 Point)。
5 . stability.aiStable Diffusion 3.5 即将登陆 Bedrock。
6 . Luma AI 即将登陆 Bedrock。Luma Ray2 视频生成模型。所有 Luma 模型都将登陆 Bedrock。
7 . Amazon Bedrock Marketplace – 提供对数百种新兴和专业模型的访问
开发人员工具公告
1 . Amazon Bedrock Model Distillation – 这允许您使用具有已知答案的提示将知识从大型复杂模型转移到较小的模型。它与微调类似,但略有不同。
2 . 适用于 .NET 的 Amazon Q 转换 – 在很短的时间内将 .NET 应用程序从 Windows 转换为 Linux。使用代理。介绍此功能时表示,客户希望使用一个简单的按钮来离开 Windows。
3 . 适用于 VMWare 工作负载的 Amazon Q 开发人员转换 – 将 VMWare 工作负载转换为云原生架构。根据依赖关系生成迁移计划。启动可将 VMWare 网络配置转换为 AWS 等效配置的代理。
4 . 适用于大型机的 Amazon Q 开发人员转换。使用代理自动发现、规划、重构和分析大型机代码 (Cobol)。
5 . Amazon Q Developer 在很短的时间内调查 AWS 环境中的问题。使用 CloudWatch 数据和 CloudTrail 日志。获取有关 AWS 运行手册和精选文档的建议,以快速解决问题。
6 . ISV 通过新的 API 与 Amazon Q 索引集成。
7 . Amazon Bedrock 提示缓存 – 跨多个 API 调用在提示中缓存重复的上下文。
8 . Amazon Bedrock Intelligent Prompt Routing – 自动将提示路由到不同的基础模型,以优化响应质量并降低成本。
9 . Amazon Kendra 生成式 AI 索引 – 连接到 SharePoint、OneDrive 和 Salesforce 等企业来源。RAG 使用支持 40 多个企业数据源。
10 . Amazon Bedrock 知识库支持结构化数据检索。将存储在 Amazon SageMaker、Lakehouse、Redshift 和 S3 表中的数据用于 RAG。
11 . Amazon Bedrock 知识库现在支持 GraphRAG – 使用知识图谱为生成式 AI 应用程序生成更相关的响应。知识图谱链接了数据源之间的关系。
12 . 下一代 Amazon SageMaker – 满足您所有数据、分析和 AI 需求的中心。通过集成数据、分析和 AI 工具来扩展 SageMaker。
13 . Amazon SageMaker Lakehouse – 通过开放、统一且安全的数据湖仓一体简化分析和 AI。跨 S3、Redshift、SaaS 和联合数据源统一访问数据。
14 . Amazon SageMaker HyperPod 灵活的训练计划
15 . Amazon Bedrock Data Automation – 转换非结构化多模态数据,用于生成式 AI 应用程序和分析。
16 . Amazon Q Developer 现已在 SageMaker Canvas 中推出 - 使用自然语言快速构建机器学习模式。用于构建模型的低代码产品。
Agentic AI 公告
1 . Amazon Bedrock 多代理协作
2 . 作为 Q Developer 的一部分,三个新的自主代理,用于生成单元测试、代码文档和代码审查。他们还将 Amazon Q 与 GitLab 的 Duo 助手集成。
3 . 适用于复杂工作流程的 Amazon Q 业务自动化。根据文档或录音自动构建工作流程。实时导航工作流程的更改,减少破损。
其他公告
1 . 合并 QuickSight 和 Amazon Q Business Data(反之亦然)。
2 . 来自 AWS 合作伙伴的 AI 应用程序现已在 Amazon SageMaker 中推出
3 . Amazon Q 中的 QuickSight 场景
4 . AWS 教育公平计划 – 为社区的教育服务提供 AWS 服务抵扣金。
结论
亚马逊在 2024 年度过了忙碌的一年,开发了我上面描述的所有功能。如果您对新公告进行简单计数,则计数将严重偏向 AI,但并非所有功能的工作量都相同。在我看来,在计算和存储方面所做的工作同样重要。设计 CPU、GPU 和新的服务器实例很困难,而且对存储进行的工程设计也很重要,因为它突破了结构化和非结构化存储解决方案的界限。关于 AI,我真的很喜欢 Guardrail 功能的思考。如果 2025 年是代理 AI 之年,那么适当的护栏将是确保正确完成代理 AI 的关键。2025 年将是有趣的一年,因为这些功能将被采用并进一步修改。
相关文章:
AWS re:Invent 的创新技术
本月早些时候,Amazon 于 12 月 1 日至 5 日在内华达州拉斯维加斯举行了为期 5 天的 re:Invent 大会。如果您从未参加过 re:Invent 会议,那么最能描述它的词是“巨大”——不仅从与会者人数(60,000 人)来看&…...
PHP7和PHP8的最佳实践
php 7 和 php 8 的最佳实践包括:使用类型提示以避免运行时错误;利用命名空间组织代码并避免命名冲突;采用命名参数、联合类型等新特性增强可读性;用错误处理优雅地处理异常;关注性能优化,如避免全局变量和选…...
Debian、Ubuntu 22.04和ubuntu 24.04国内镜像源(包括 docker 源)
Debian 更换国内清华源 1、备份原文件mv /etc/apt/sources.list /etc/apt/sources.list.old 2、写入新源,以下是 Debian 11 的: cat > /etc/apt/sources.list << EOF deb https://mirrors.tuna.tsinghua.edu.cn/debian/ bullseye main contrib…...
点亮一个esp32 的led
最近入了一个ESP32 兄弟们,这玩意还可以,买来肯定是给它点亮啊对吧 我就是点灯侠🎇 😭千万不要不接天线啊,不然你会一直找不到你的wifi 1.点灯第一步你得有IDE Arduino 就是这个绿东西 可是怎么下载安装呢ÿ…...
C++ shared_ptr进一步认知,为什么引用计数>2退出作用域都可以调用析构
1.使用智能指针需要#include <memeroy> 2.上代码: #include <memory> #include <iostream> using namespace std; struct lifePeriod {lifePeriod():a(1){cout << "无参构造!" << endl;}virtual ~lifePeriod(…...
JavaScript代码片段二
见过不少人、经过不少事、也吃过不少苦,感悟世事无常、人心多变,靠着回忆将往事串珠成链,聊聊感情、谈谈发展,我慢慢写、你一点一点看...... JavaScript统计文字个数、特殊字符转义、动态插入js代码、身份证验证 统计文字个数 f…...
【计算机视觉】单目深度估计模型-Depth Anything-V2
概述 本篇将简单介绍Depth Anything V2单目深度估计模型,该模型旨在解决现有的深度估计模型在处理复杂场景、透明或反射物体时的性能限制。与前一代模型相比,V2版本通过采用合成图像训练、增加教师模型容量,并利用大规模伪标签现实数据进行学…...
Servlet 和 Spring MVC:区别与联系
前言 在 Java Web 开发中,Servlet 和 Spring MVC 是两个重要的技术。Servlet 是 Java Web 的基础组件,而 Spring MVC 是一个高级 Web 框架,建立在 Servlet 的基础之上,提供了强大的功能和易用性。这篇文章将从定义、原理、功能对…...
【期末复习】三、内存管理
1.物理内存管理 空闲内存管理方式主要分为:等长划分和不等长划分。 内存管理方式 单一连续分区 基本思想:一段时间内只有一个进程在内存。 特点:简单,内存利用率低, 有三种不同的布局: 固定分区 把内存空间分割成若干区域, 称为分区。 每个分区的大小可以相同也可…...
Microsoft Azure Cosmos DB:全球分布式、多模型数据库服务
目录 前言1. Azure Cosmos DB 简介1.1 什么是 Azure Cosmos DB?1.2 核心技术特点 2. 数据模型与 API 支持2.1 文档存储(Document Store)2.2 图数据库(Graph DBMS)2.3 键值存储(Key-Value Store)…...
【Docker】安装registry本地镜像库,开启Https功能
下载镜像 docker pull registry:2 需要启动https功能,就要生成服务端的自签名的证书和私钥,以及在docker客户端安装这个经过签名的证书。 第一步:生成公私钥信息,第二步,制作证书签名申请文件, 第三步&…...
JUC--线程池
线程池 七、线程池7.1线程池的概述7.2线程池的构建与参数ThreadPoolExecutor 的构造方法核心参数线程池的工作原理 Executors构造方法newFixedThreadPoolnewCachedThreadPoolnewSingleThreadExecutornewScheduledThreadPool(int corePoolSize) 为什么不推荐使用内置线程池&…...
后端Java开发:第十一天
第十一天:方法重载 - 理解与应用 今天我们继续深入 Java 的世界,讨论 Java 中的 方法重载(Method Overloading)。你可能会想,什么是方法重载?简单来说,方法重载允许你在一个类中定义多个同名方…...
基于 GEE 的长时间序列 Landsat 5 影像下载
目录 1 完整代码 2 运行结果 1 完整代码 var LT5 ee.ImageCollection("LANDSAT/LT05/C01/T1"),imageVisParam {"opacity":1,"bands":["B4","B3","B2"],"gamma":1},roi ee.FeatureCollection(&quo…...
Unity-Mirror网络框架从入门到精通之Attributes属性介绍
前言 在现代游戏开发中,网络功能日益成为提升游戏体验的关键组成部分。Mirror是一个用于Unity的开源网络框架,专为多人游戏开发设计。它使得开发者能够轻松实现网络连接、数据同步和游戏状态管理。本文将深入介绍Mirror的基本概念、如何与其他网络框架进…...
软考证书邮寄步骤
一、点击网址 https://www.ruankao.org.cn/ 复制上述网址,粘贴至浏览器中。点击 “报名入口” 。 二、点击入口 选择考试批次。点击你所在考试地点的入口并进入。 三、登录 输入手机号和密码。进行验证。 四、点击基本信息 点击右上角。进入 “基本信息” 。 五、…...
计算机网络 (29)网络地址转换NAT
前言 网络地址转换(Network Address Translation,NAT)是计算机网络中的一种重要协议,它主要用于将私有IP地址转换为公共IP地址,以实现内部网络与外部网络之间的通信。 一、基本概念 NAT是一种在局域网(LAN&…...
nlp培训重点-2
1. 贝叶斯公式 import math import jieba import re import os import json from collections import defaultdictjieba.initialize()""" 贝叶斯分类实践P(A|B) (P(A) * P(B|A)) / P(B) 事件A:文本属于类别x1。文本属于类别x的概率,记做…...
设计模式(1)——面向对象和面向过程,封装、继承和多态
文章目录 一、day11. 什么是面向对象2. 面向对象的三要素:继承、封装和多态2.1 封装**2.1.1 封装的概念****2.1.2 如何实现封装****2.1.3 封装的底层实现**2.1.4 为什么使用封装?(好处)**2.1.5 封装只有类能做吗?结构体…...
培训机构Day24
今天讲了一些javaee比较过时的技术,虽然已经过时,该学的还得学学。 知识点: http://localhost:8080/demo01/demo1?a1&b2&c3 pattern: /demo1 上下文路径:ContextPath,/demo01,不包含请求参数。 …...
业务系统对接大模型的基础方案:架构设计与关键步骤
业务系统对接大模型:架构设计与关键步骤 在当今数字化转型的浪潮中,大语言模型(LLM)已成为企业提升业务效率和创新能力的关键技术之一。将大模型集成到业务系统中,不仅可以优化用户体验,还能为业务决策提供…...
django filter 统计数量 按属性去重
在Django中,如果你想要根据某个属性对查询集进行去重并统计数量,你可以使用values()方法配合annotate()方法来实现。这里有两种常见的方法来完成这个需求: 方法1:使用annotate()和Count 假设你有一个模型Item,并且你想…...
Qt Http Server模块功能及架构
Qt Http Server 是 Qt 6.0 中引入的一个新模块,它提供了一个轻量级的 HTTP 服务器实现,主要用于构建基于 HTTP 的应用程序和服务。 功能介绍: 主要功能 HTTP服务器功能: 支持 HTTP/1.1 协议 简单的请求/响应处理模型 支持 GET…...
Android15默认授权浮窗权限
我们经常有那种需求,客户需要定制的apk集成在ROM中,并且默认授予其【显示在其他应用的上层】权限,也就是我们常说的浮窗权限,那么我们就可以通过以下方法在wms、ams等系统服务的systemReady()方法中调用即可实现预置应用默认授权浮…...
短视频矩阵系统文案创作功能开发实践,定制化开发
在短视频行业迅猛发展的当下,企业和个人创作者为了扩大影响力、提升传播效果,纷纷采用短视频矩阵运营策略,同时管理多个平台、多个账号的内容发布。然而,频繁的文案创作需求让运营者疲于应对,如何高效产出高质量文案成…...
基于IDIG-GAN的小样本电机轴承故障诊断
目录 🔍 核心问题 一、IDIG-GAN模型原理 1. 整体架构 2. 核心创新点 (1) 梯度归一化(Gradient Normalization) (2) 判别器梯度间隙正则化(Discriminator Gradient Gap Regularization) (3) 自注意力机制(Self-Attention) 3. 完整损失函数 二…...
【JVM面试篇】高频八股汇总——类加载和类加载器
目录 1. 讲一下类加载过程? 2. Java创建对象的过程? 3. 对象的生命周期? 4. 类加载器有哪些? 5. 双亲委派模型的作用(好处)? 6. 讲一下类的加载和双亲委派原则? 7. 双亲委派模…...
Git 3天2K星标:Datawhale 的 Happy-LLM 项目介绍(附教程)
引言 在人工智能飞速发展的今天,大语言模型(Large Language Models, LLMs)已成为技术领域的焦点。从智能写作到代码生成,LLM 的应用场景不断扩展,深刻改变了我们的工作和生活方式。然而,理解这些模型的内部…...
探索Selenium:自动化测试的神奇钥匙
目录 一、Selenium 是什么1.1 定义与概念1.2 发展历程1.3 功能概述 二、Selenium 工作原理剖析2.1 架构组成2.2 工作流程2.3 通信机制 三、Selenium 的优势3.1 跨浏览器与平台支持3.2 丰富的语言支持3.3 强大的社区支持 四、Selenium 的应用场景4.1 Web 应用自动化测试4.2 数据…...
基于鸿蒙(HarmonyOS5)的打车小程序
1. 开发环境准备 安装DevEco Studio (鸿蒙官方IDE)配置HarmonyOS SDK申请开发者账号和必要的API密钥 2. 项目结构设计 ├── entry │ ├── src │ │ ├── main │ │ │ ├── ets │ │ │ │ ├── pages │ │ │ │ │ ├── H…...
