当前位置: 首页 > news >正文

AWS re:Invent 的创新技术

本月早些时候,Amazon 于 12 月 1 日至 5 日在内华达州拉斯维加斯举行了为期 5 天的 re:Invent 大会。如果您从未参加过 re:Invent 会议,那么最能描述它的词是“巨大”——不仅从与会者人数(60,000 人)来看,还从涵盖的主题的广度来看。MinIO 展位有 60,000 名与会者,整整 5 天都非常繁忙。因此,即使我亲自到场,我也没有机会沉浸在来自 Amazon 的有关他们来年云计算计划的所有数据中。所以,我不得不等到假期才去做大多数人认为相当书的事情。我每天观看主题演讲,仔细记录所讨论的所有内容。完成后,我已经查看了超过 10 小时的视频和超过 15 页的笔记。这项工作的目的不是为了与我内心的书取得联系,但我真的很想掌握 AI 的脉搏。以下是我所看到的事实。首先,亚马逊拥有世界上最大的云平台。其次,他们有很多客户将他们的云平台用于各种形式的 AI。他们有足够的预算来做任何他们想做的事情来帮助这些客户并保持竞争力。最后,人们普遍认为,近年来,亚马逊在人工智能方面落后于 Microsoft、谷歌和 Meta 等公司。综上所述(我的目标很简单),使用 re:Invent 主题演讲来了解 AI 在 2025 年的发展方向,以及他们实际上无限的工程资源、庞大的客户群和庞大的合作伙伴网络是否能够缩小人们认为存在的 AI 差距。以下是会议每天的主题演讲列表:

  • 第 #1 天 – 周一夜现场,Peter DeSantis AWS 效用计算高级副总裁

  • 第 #2 天 – AWS 首席执行官 Matt Garman 的 CEO 主题演讲

  • 第 #3 天 – Swami Sivasubramanian 博士,主题演讲,AWS AI 和数据副总裁

  • 第 #4 天 – AWS 全球专家和合作伙伴副总裁 Ruba Borno 博士的 AWS 合作伙伴主题演讲

  • 第 #5 天 - Werner Vogels 博士,Amazon.com 副总裁兼首席技术官

回到我的 15 页笔记。我有点惊讶地发现,每个重要主题和每个宣布的新功能都很容易归入以下三个类别之一:存储、计算和 AI。这就是我将如何组织这篇文章。对于每个类别,我将给出我的总体意见,然后列出关键技术和新公告。

计算

我在 re:Invent 2024 上最大的惊喜与 Amazon 的计算目标有关。我花了一点时间才弄清楚,但很明显,他们无意成为其他供应商的芯片和服务器的供应商。相反,他们希望拥有自己设计的硬件产品。他们已经这样做了一段时间,但老实说,我不明白他们努力的规模。他们开发了自己的 CPU (Graviton2)、GPU (Trainium2)、互连 (NeuronLink) 和自定义网络协议 (SIDR)。他们的新 Trainium2 UltraServer 使用 NeuronLink 将四个 Trainium2 服务器连接在一起,形成一个用于训练和推理的巨型服务器。许多 AWS 服务使用自己的硬件,并且它们也可用作 EC2 实例类型。AWS 仍然与 Nvidia 保持合作关系,并将继续提供 Nvidia 的 GPU 作为实例类型。Trainium2 和 Graviton2 的承诺是,它们将提供优于其他芯片的成本优势。

公告

1 . 支持 Nvidia Blackwell 芯片的 P6 系列实例。

2 . 支持 Trainium2 芯片的 TRN2 系列实例。一个实例是具有 16 个 Trainium2 芯片的服务器,可提供高达 20.8 FP8 petaFLOPS 的吞吐量。

3 . TRN2 超级服务器 - 使用 neuronlink 连接 4 个 TRN2 实例 - 因此有 64 个 Trainium2 芯片。适用于无法安装在一台服务器上的模型。高达 83.2 FP8 petaFLOPS

4 . Trainium3 将于 2025 年推出 - 这将是 AWS 在 3 纳米工艺上制造的第一个芯片。它将是 Trainium2 的两倍。

存储

大多数存储公告都发生在第二天与 Matt Garman 的主题演讲中。但是,在第一天的主题演讲中,有一个非常有趣的故事,关于 Barge 项目,该项目努力构建一个巨大的存储服务器,以提高存储密度(并降低成本)。它在单个主机中有 288 个 20TB 硬盘驱动器。每个驳船机架重 4,500 磅,这意味着需要加固数据中心地板,并且需要专门的设备来移动它们。事实证明,以 7200 rpm 的速度旋转的 288 个驱动器会引起振动,从而增加故障率。一次故障的爆炸半径为 6 PB 的数据,必须花费大量资金进行恢复。最后,他们沉没了 Barge,并开始考虑如何从计算中解耦存储。一些存储公告让我印象深刻的是,对非结构化存储的需求正在增长。这在 S3 受到的关注中显而易见(请参阅下面的公告)。从 Matt 的主题演讲中宣布的一些统计数据中也可以明显看出:S3 现在存储了超过 400 万亿个对象。十年前,只有不到 100 个客户使用 S3 在 AWS 上存储了 1PB 级数据。如今,数千台存储了 1 PB,还有几家存储了超过 EB 级(这与我们的经验非常吻合)。关于非结构化存储,我的另一个想法是,Amazon 添加到其云中的许多新基础模型(将在下一节中介绍)会生成图像和视频。这些图像和视频需要存储在某个地方。如果这种风格或生成式 AI 起飞,那么对结构化数据的需求将进一步增加。在 MinIO,我们相信客户会希望为这些数据提供本地选项。Amazon 也非常重视他们的结构化数据存储解决方案。他们投入了大量精力来提高在不同区域中运行的主动-主动数据库实例之间的一致性。为此,他们重新设计了 SQL 和 noSQL 数据库中使用的事务引擎。在主题演讲的这一部分,有一个有趣的故事,关于他们如何必须将 EC2 实例与卫星同步,以更精确地保持时间同步。结果是,Aurora 和 DynamoDB 都可以使用其重新设计的事务引擎以多区域强一致性运行主动-主动。

公告

1 . S3 Table Buckets (S3 表存储桶) – 这是 Iceberg 表的一种新存储桶类型。承诺是 AWS 将负责维护 Iceberg 表所需的所有维护,例如压缩、快照管理等。初步测试表明,与暴力破解 S3“查询”相比,使用 SQL 的表存储桶的查询性能提高了 3 倍。

2 . S3 元数据 – 此功能允许您获取与对象关联的元数据并将其存储在表存储桶中。然后,您可以使用自己喜欢的分析工具来交互和查询元数据并获取关联的对象。

3 . Amazon Aurora DSQL(分布式 SQL 数据库)使用新事务引擎的区域之间具有很强的一致性。

4 . Amazon DynamoDB 全局表现在支持多区域强一致性。这是重新设计的事务引擎的应用程序,该引擎已应用于 DynamoDB,这是 Amazon 的 NoSQL 数据库。

人工智能

到目前为止,今年 re:Invent 大会上的大多数公告都是关于 AI 的。其中一些公告是在 Matt Garman 的第二次主题演讲中发布的,也是在第三天的 Swami Sivasubramanian 主题演讲中发布的。Swami 的主题演讲中充满了公告,几乎完全集中在 AI 上。有些是微不足道的,如果 Amazon 将它们分块,所有的公告都会更容易消化。我在下面描述了它们,但我应用了以下分类,这是我自己做的。

  • 护栏 - 用于双重检查模型

  • 与 Meta、Google 和 Microsoft 竞争的基础模型;

  • 开发人员工具 - 用于代码生成和自动化软件开发生命周期的各个部分。

  • Agentic AI 可帮助客户自动化 AWS 的其他部分。

  • 杂项 - 一些不适合我上面的类别。

护栏公告

1 . Amazon Bedrock 自动推理检查 – 这是一个护栏,旨在防止由于模型幻觉而导致的事实错误。

2 . Amazon SageMaker HyperPod 任务治理。最大限度地提高加速器利用率并降低模型训练、微调和推理的成本。

3 . Amazon Bedrock Guardrails 多模式毒性检测。图像内容的可配置保护措施。适用于具有映像支持的 Amazon Bedrock 中的所有基础模型。过滤掉图像中的暴力、仇恨和不当行为。

基础模型公告

1 . Amazon Nova – Foundation 模型有四种风格:Micro、Lite、Pro 和 Premier。

2 . Amazon Nova Canvas - 图像生成模型

3 . Amazon Nova Reel – 视频生成模型 – 今天的 6 秒视频。2 分钟的视频即将推出。

4 . poolside 即将来到 Bedrock - poolside assistant (Malibu 和 Point)。

5 . stability.aiStable Diffusion 3.5 即将登陆 Bedrock。

6 . Luma AI 即将登陆 Bedrock。Luma Ray2 视频生成模型。所有 Luma 模型都将登陆 Bedrock。

7 . Amazon Bedrock Marketplace – 提供对数百种新兴和专业模型的访问

开发人员工具公告

1 . Amazon Bedrock Model Distillation – 这允许您使用具有已知答案的提示将知识从大型复杂模型转移到较小的模型。它与微调类似,但略有不同。

2 . 适用于 .NET 的 Amazon Q 转换 – 在很短的时间内将 .NET 应用程序从 Windows 转换为 Linux。使用代理。介绍此功能时表示,客户希望使用一个简单的按钮来离开 Windows。

3 . 适用于 VMWare 工作负载的 Amazon Q 开发人员转换 – 将 VMWare 工作负载转换为云原生架构。根据依赖关系生成迁移计划。启动可将 VMWare 网络配置转换为 AWS 等效配置的代理。

4 . 适用于大型机的 Amazon Q 开发人员转换。使用代理自动发现、规划、重构和分析大型机代码 (Cobol)。

5 . Amazon Q Developer 在很短的时间内调查 AWS 环境中的问题。使用 CloudWatch 数据和 CloudTrail 日志。获取有关 AWS 运行手册和精选文档的建议,以快速解决问题。

6 . ISV 通过新的 API 与 Amazon Q 索引集成。

7 . Amazon Bedrock 提示缓存 – 跨多个 API 调用在提示中缓存重复的上下文。

8 . Amazon Bedrock Intelligent Prompt Routing – 自动将提示路由到不同的基础模型,以优化响应质量并降低成本。

9 . Amazon Kendra 生成式 AI 索引 – 连接到 SharePoint、OneDrive 和 Salesforce 等企业来源。RAG 使用支持 40 多个企业数据源。

10 . Amazon Bedrock 知识库支持结构化数据检索。将存储在 Amazon SageMaker、Lakehouse、Redshift 和 S3 表中的数据用于 RAG。

11 . Amazon Bedrock 知识库现在支持 GraphRAG – 使用知识图谱为生成式 AI 应用程序生成更相关的响应。知识图谱链接了数据源之间的关系。

12 . 下一代 Amazon SageMaker – 满足您所有数据、分析和 AI 需求的中心。通过集成数据、分析和 AI 工具来扩展 SageMaker。

13 . Amazon SageMaker Lakehouse – 通过开放、统一且安全的数据湖仓一体简化分析和 AI。跨 S3、Redshift、SaaS 和联合数据源统一访问数据。

14 . Amazon SageMaker HyperPod 灵活的训练计划

15 . Amazon Bedrock Data Automation – 转换非结构化多模态数据,用于生成式 AI 应用程序和分析。

16 . Amazon Q Developer 现已在 SageMaker Canvas 中推出 - 使用自然语言快速构建机器学习模式。用于构建模型的低代码产品。

Agentic AI 公告

1 . Amazon Bedrock 多代理协作

2 . 作为 Q Developer 的一部分,三个新的自主代理,用于生成单元测试、代码文档和代码审查。他们还将 Amazon Q 与 GitLab 的 Duo 助手集成。

3 . 适用于复杂工作流程的 Amazon Q 业务自动化。根据文档或录音自动构建工作流程。实时导航工作流程的更改,减少破损。

其他公告

1 . 合并 QuickSight 和 Amazon Q Business Data(反之亦然)。

2 . 来自 AWS 合作伙伴的 AI 应用程序现已在 Amazon SageMaker 中推出

3 . Amazon Q 中的 QuickSight 场景

4 . AWS 教育公平计划 – 为社区的教育服务提供 AWS 服务抵扣金。

结论

亚马逊在 2024 年度过了忙碌的一年,开发了我上面描述的所有功能。如果您对新公告进行简单计数,则计数将严重偏向 AI,但并非所有功能的工作量都相同。在我看来,在计算和存储方面所做的工作同样重要。设计 CPU、GPU 和新的服务器实例很困难,而且对存储进行的工程设计也很重要,因为它突破了结构化和非结构化存储解决方案的界限。关于 AI,我真的很喜欢 Guardrail 功能的思考。如果 2025 年是代理 AI 之年,那么适当的护栏将是确保正确完成代理 AI 的关键。2025 年将是有趣的一年,因为这些功能将被采用并进一步修改。

相关文章:

AWS re:Invent 的创新技术

本月早些时候,Amazon 于 12 月 1 日至 5 日在内华达州拉斯维加斯举行了为期 5 天的 re:Invent 大会。如果您从未参加过 re:Invent 会议,那么最能描述它的词是“巨大”——不仅从与会者人数(60,000 人)来看&…...

PHP7和PHP8的最佳实践

php 7 和 php 8 的最佳实践包括:使用类型提示以避免运行时错误;利用命名空间组织代码并避免命名冲突;采用命名参数、联合类型等新特性增强可读性;用错误处理优雅地处理异常;关注性能优化,如避免全局变量和选…...

Debian、Ubuntu 22.04和ubuntu 24.04国内镜像源(包括 docker 源)

Debian 更换国内清华源 1、备份原文件mv /etc/apt/sources.list /etc/apt/sources.list.old 2、写入新源&#xff0c;以下是 Debian 11 的&#xff1a; cat > /etc/apt/sources.list << EOF deb https://mirrors.tuna.tsinghua.edu.cn/debian/ bullseye main contrib…...

点亮一个esp32 的led

最近入了一个ESP32 兄弟们&#xff0c;这玩意还可以&#xff0c;买来肯定是给它点亮啊对吧 我就是点灯侠&#x1f387; &#x1f62d;千万不要不接天线啊&#xff0c;不然你会一直找不到你的wifi 1.点灯第一步你得有IDE Arduino 就是这个绿东西 可是怎么下载安装呢&#xff…...

C++ shared_ptr进一步认知,为什么引用计数>2退出作用域都可以调用析构

1.使用智能指针需要#include <memeroy> 2.上代码&#xff1a; #include <memory> #include <iostream> using namespace std; struct lifePeriod {lifePeriod():a(1){cout << "无参构造&#xff01;" << endl;}virtual ~lifePeriod(…...

JavaScript代码片段二

见过不少人、经过不少事、也吃过不少苦&#xff0c;感悟世事无常、人心多变&#xff0c;靠着回忆将往事串珠成链&#xff0c;聊聊感情、谈谈发展&#xff0c;我慢慢写、你一点一点看...... JavaScript统计文字个数、特殊字符转义、动态插入js代码、身份证验证 统计文字个数 f…...

【计算机视觉】单目深度估计模型-Depth Anything-V2

概述 本篇将简单介绍Depth Anything V2单目深度估计模型&#xff0c;该模型旨在解决现有的深度估计模型在处理复杂场景、透明或反射物体时的性能限制。与前一代模型相比&#xff0c;V2版本通过采用合成图像训练、增加教师模型容量&#xff0c;并利用大规模伪标签现实数据进行学…...

Servlet 和 Spring MVC:区别与联系

前言 在 Java Web 开发中&#xff0c;Servlet 和 Spring MVC 是两个重要的技术。Servlet 是 Java Web 的基础组件&#xff0c;而 Spring MVC 是一个高级 Web 框架&#xff0c;建立在 Servlet 的基础之上&#xff0c;提供了强大的功能和易用性。这篇文章将从定义、原理、功能对…...

【期末复习】三、内存管理

1.物理内存管理 空闲内存管理方式主要分为:等长划分和不等长划分。 内存管理方式 单一连续分区 基本思想:一段时间内只有一个进程在内存。 特点:简单,内存利用率低, 有三种不同的布局: 固定分区 把内存空间分割成若干区域, 称为分区。 每个分区的大小可以相同也可…...

Microsoft Azure Cosmos DB:全球分布式、多模型数据库服务

目录 前言1. Azure Cosmos DB 简介1.1 什么是 Azure Cosmos DB&#xff1f;1.2 核心技术特点 2. 数据模型与 API 支持2.1 文档存储&#xff08;Document Store&#xff09;2.2 图数据库&#xff08;Graph DBMS&#xff09;2.3 键值存储&#xff08;Key-Value Store&#xff09;…...

【Docker】安装registry本地镜像库,开启Https功能

下载镜像 docker pull registry:2 需要启动https功能&#xff0c;就要生成服务端的自签名的证书和私钥&#xff0c;以及在docker客户端安装这个经过签名的证书。 第一步&#xff1a;生成公私钥信息&#xff0c;第二步&#xff0c;制作证书签名申请文件&#xff0c; 第三步&…...

JUC--线程池

线程池 七、线程池7.1线程池的概述7.2线程池的构建与参数ThreadPoolExecutor 的构造方法核心参数线程池的工作原理 Executors构造方法newFixedThreadPoolnewCachedThreadPoolnewSingleThreadExecutornewScheduledThreadPool(int corePoolSize) 为什么不推荐使用内置线程池&…...

后端Java开发:第十一天

第十一天&#xff1a;方法重载 - 理解与应用 今天我们继续深入 Java 的世界&#xff0c;讨论 Java 中的 方法重载&#xff08;Method Overloading&#xff09;。你可能会想&#xff0c;什么是方法重载&#xff1f;简单来说&#xff0c;方法重载允许你在一个类中定义多个同名方…...

基于 GEE 的长时间序列 Landsat 5 影像下载

目录 1 完整代码 2 运行结果 1 完整代码 var LT5 ee.ImageCollection("LANDSAT/LT05/C01/T1"),imageVisParam {"opacity":1,"bands":["B4","B3","B2"],"gamma":1},roi ee.FeatureCollection(&quo…...

Unity-Mirror网络框架从入门到精通之Attributes属性介绍

前言 在现代游戏开发中&#xff0c;网络功能日益成为提升游戏体验的关键组成部分。Mirror是一个用于Unity的开源网络框架&#xff0c;专为多人游戏开发设计。它使得开发者能够轻松实现网络连接、数据同步和游戏状态管理。本文将深入介绍Mirror的基本概念、如何与其他网络框架进…...

软考证书邮寄步骤

一、点击网址 https://www.ruankao.org.cn/ 复制上述网址&#xff0c;粘贴至浏览器中。点击 “报名入口” 。 二、点击入口 选择考试批次。点击你所在考试地点的入口并进入。 三、登录 输入手机号和密码。进行验证。 四、点击基本信息 点击右上角。进入 “基本信息” 。 五、…...

计算机网络 (29)网络地址转换NAT

前言 网络地址转换&#xff08;Network Address Translation&#xff0c;NAT&#xff09;是计算机网络中的一种重要协议&#xff0c;它主要用于将私有IP地址转换为公共IP地址&#xff0c;以实现内部网络与外部网络之间的通信。 一、基本概念 NAT是一种在局域网&#xff08;LAN&…...

nlp培训重点-2

1. 贝叶斯公式 import math import jieba import re import os import json from collections import defaultdictjieba.initialize()""" 贝叶斯分类实践P(A|B) (P(A) * P(B|A)) / P(B) 事件A&#xff1a;文本属于类别x1。文本属于类别x的概率&#xff0c;记做…...

设计模式(1)——面向对象和面向过程,封装、继承和多态

文章目录 一、day11. 什么是面向对象2. 面向对象的三要素&#xff1a;继承、封装和多态2.1 封装**2.1.1 封装的概念****2.1.2 如何实现封装****2.1.3 封装的底层实现**2.1.4 为什么使用封装&#xff1f;&#xff08;好处&#xff09;**2.1.5 封装只有类能做吗&#xff1f;结构体…...

培训机构Day24

今天讲了一些javaee比较过时的技术&#xff0c;虽然已经过时&#xff0c;该学的还得学学。 知识点&#xff1a; http://localhost:8080/demo01/demo1?a1&b2&c3 pattern: /demo1 上下文路径&#xff1a;ContextPath&#xff0c;/demo01&#xff0c;不包含请求参数。 …...

Chapter03-Authentication vulnerabilities

文章目录 1. 身份验证简介1.1 What is authentication1.2 difference between authentication and authorization1.3 身份验证机制失效的原因1.4 身份验证机制失效的影响 2. 基于登录功能的漏洞2.1 密码爆破2.2 用户名枚举2.3 有缺陷的暴力破解防护2.3.1 如果用户登录尝试失败次…...

《Qt C++ 与 OpenCV:解锁视频播放程序设计的奥秘》

引言:探索视频播放程序设计之旅 在当今数字化时代,多媒体应用已渗透到我们生活的方方面面,从日常的视频娱乐到专业的视频监控、视频会议系统,视频播放程序作为多媒体应用的核心组成部分,扮演着至关重要的角色。无论是在个人电脑、移动设备还是智能电视等平台上,用户都期望…...

云启出海,智联未来|阿里云网络「企业出海」系列客户沙龙上海站圆满落地

借阿里云中企出海大会的东风&#xff0c;以**「云启出海&#xff0c;智联未来&#xff5c;打造安全可靠的出海云网络引擎」为主题的阿里云企业出海客户沙龙云网络&安全专场于5.28日下午在上海顺利举办&#xff0c;现场吸引了来自携程、小红书、米哈游、哔哩哔哩、波克城市、…...

【解密LSTM、GRU如何解决传统RNN梯度消失问题】

解密LSTM与GRU&#xff1a;如何让RNN变得更聪明&#xff1f; 在深度学习的世界里&#xff0c;循环神经网络&#xff08;RNN&#xff09;以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而&#xff0c;传统RNN存在的一个严重问题——梯度消失&#…...

基于Uniapp开发HarmonyOS 5.0旅游应用技术实践

一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架&#xff0c;支持"一次开发&#xff0c;多端部署"&#xff0c;可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务&#xff0c;为旅游应用带来&#xf…...

【C++从零实现Json-Rpc框架】第六弹 —— 服务端模块划分

一、项目背景回顾 前五弹完成了Json-Rpc协议解析、请求处理、客户端调用等基础模块搭建。 本弹重点聚焦于服务端的模块划分与架构设计&#xff0c;提升代码结构的可维护性与扩展性。 二、服务端模块设计目标 高内聚低耦合&#xff1a;各模块职责清晰&#xff0c;便于独立开发…...

今日学习:Spring线程池|并发修改异常|链路丢失|登录续期|VIP过期策略|数值类缓存

文章目录 优雅版线程池ThreadPoolTaskExecutor和ThreadPoolTaskExecutor的装饰器并发修改异常并发修改异常简介实现机制设计原因及意义 使用线程池造成的链路丢失问题线程池导致的链路丢失问题发生原因 常见解决方法更好的解决方法设计精妙之处 登录续期登录续期常见实现方式特…...

ABAP设计模式之---“简单设计原则(Simple Design)”

“Simple Design”&#xff08;简单设计&#xff09;是软件开发中的一个重要理念&#xff0c;倡导以最简单的方式实现软件功能&#xff0c;以确保代码清晰易懂、易维护&#xff0c;并在项目需求变化时能够快速适应。 其核心目标是避免复杂和过度设计&#xff0c;遵循“让事情保…...

JAVA后端开发——多租户

数据隔离是多租户系统中的核心概念&#xff0c;确保一个租户&#xff08;在这个系统中可能是一个公司或一个独立的客户&#xff09;的数据对其他租户是不可见的。在 RuoYi 框架&#xff08;您当前项目所使用的基础框架&#xff09;中&#xff0c;这通常是通过在数据表中增加一个…...

视频行为标注工具BehaviLabel(源码+使用介绍+Windows.Exe版本)

前言&#xff1a; 最近在做行为检测相关的模型&#xff0c;用的是时空图卷积网络&#xff08;STGCN&#xff09;&#xff0c;但原有kinetic-400数据集数据质量较低&#xff0c;需要进行细粒度的标注&#xff0c;同时粗略搜了下已有开源工具基本都集中于图像分割这块&#xff0c…...