当前位置: 首页 > news >正文

在亚马逊云科技上云原生部署DeepSeek-R1模型(上)

DeepSeek-R1在开源版本发布的第二天就登陆了亚马逊云科技AWS云平台,这个速度另小李哥十分震惊。这又让我想起了在亚马逊云科技全球云计算大会re:Invent2025里,亚马逊CEO Andy Jassy说过的:随着目前生成式AI应用规模的扩大,云计算的成本变得至关重要,大家都在寻求具有高性价比的AI模型。其次开发一个真正优质生成式AI应用真的不容易,当我们自由选择 AI 模型开发应用时,最终会形成多元化的模型生态。这说明:不会存在一个通用模型能满足所有需求。

同时他也提到了亚马逊云科技提供的广泛而深入的模型选择,让客户可以精准匹配业务需求。通过密切关注客户需求与技术发展,亚马逊云科技也在不断扩展精选模型库,既包括行业领先的主流模型,也引入了最新的优秀模型。这种高性能、差异化的模型组合,帮助开发者和企业始终站在AI 创新的前沿。这就是DeepSeek-R1能这么快登录亚马逊云科技平台的核心原因。

DeepSeek-R1模型现已登陆亚马逊云科技

位于杭州的AI初创公司DeepSeek于2024年12月发布了DeepSeek-V3,随后在2025年1月20日推出 DeepSeek-R1、DeepSeek-R1-Zero(6710 亿参数)和DeepSeek-R1-Distill(1.5–70 亿参数),并在1月27日推出了视觉AI模型Janus-Pro-7B。这些模型现已全面开放,并比同类模型的成本便宜90-95%!同时DeepSeek模型以卓越的推理能力从各大海外的AI模型中脱颖而出,一发冲天,这得益于其强化学习(RL)等创新的训练方法。

好消息是现在大家可以在Amazon Bedrock和Amazon SageMaker AI训练、部署和使用DeepSeek-R1模型了:

  • Amazon Bedrock适合希望通过API快速集成DeepSeek预训练基础模型的开发者。
  • Amazon SageMaker AI适用于需要深度定制、训练和部署DeepSeek,并希望直接访问底层基础设施的开发者。
  • AWS Trainium和AWS Inferentia芯片目前也支持DeepSeek-R1-Distill蒸馏模型,可在Amazon EC2或Amazon SageMaker AI上经济高效地运行推理任务。

借助亚马逊云科技,大家可以以最低的云计算基础设施投入,利用DeepSeek-R1模型构建、测试,并安全地扩展大家的生成式AI应用。大家还可以结合Amazon Bedrock Guardrails,为AI应用提供额外的安全防护,确保符合开发者们业务场景的AI安全策略。目前大家可以通过以下方式,在亚马逊云科技上部署DeepSeek-R1:

Amazon Bedrock Marketplace(适用于DeepSeek-R1模型)

Amazon SageMaker JumpStart(适用于DeepSeek-R1模型)

Amazon Bedrock 自定义模型导入(适用于DeepSeek-R1-Distill)

Amazon EC2 Trn1实例(适用于DeepSeek-R1-Distill)

在Amazon Bedrock Marketplace模型市场里部署DeepSeek-R1

Amazon Bedrock Marketplace目前提供全球超过100+个热门、新兴及专业化基础模型,涵盖各种行业领先的AI模型。大家可以在控制台的模型目录中快速发现、订阅并部署适合大家需求的模型。

使用ApplyGuardrail API实现DeepSeek-R1的安全调用

Amazon Bedrock也允许大家引入安全防护措施更安全的访问DeepSeek模型,防止生成有害内容,并针对关键安全指标评估模型。大家也可以使用代码调用Amazon Bedrock ApplyGuardrail API,为 DeepSeek-R1模型实现安全防护措施,评估用户输入和模型响应。大家可以使用 Amazon Bedrock控制台或直接通过代码API创建安全防护策略。创建安全防护的示例代码可以在亚马逊云科技GitHub示例代码仓库找到。Guardrail的工作流程原理如下:

  1. 系统接收用户输入,并将其发送至ApplyGuardrail API进行审核。
  2. 输入通过审核后,才会发送到模型进行推理。
  3. 模型返回输出后,再次经过ApplyGuardrail API对输出进行安全检查。
  4. 如果输出通过审核,最终结果会返回给用户。
  5. 如果输入或输出未通过审核,系统会返回一条消息,说明拦截原因,并指明干预发生在输入阶段还是输出阶段。

 

开始部署DeepSeek-R1

如果大家想要在Amazon Bedrock中访问DeepSeek-R1,请完成以下步骤:

1. 在Amazon Bedrock控制台的导航面板中,选择Foundation models下的Model catalog。大家同样也可以使用亚马逊云科技SDK,通过代码中的InvokeModel API调用该模型。该模型目前不支持Converse API或其他 Amazon Bedrock功能。
2. 筛选提供商为DeepSeek,并选择DeepSeek-R1模型。

模型详细信息页面提供了有关模型功能、定价结构和实施指南的多种基本信息。大家可以找到详细的使用说明,包括示例API调用语句代和集成的代码片段。该模型利用强化学习优化和CoT推理能力,支持多种文本生成任务,包括内容创作、代码生成和问答。
该页面同时还包含部署选项和许可信息,帮助大家在应用程序中快速使用上手DeepSeek-R1。

3. 接下来点击Deploy开始使用DeepSeek-R1

系统将提示大家需要为DeepSeek-R1的部署进行资源配置,模型的ID将被自动填充进配置。
4. 在Endpoint name字段输入一个端点名称(1–50 个字母数字字符)。
5. 在Number of instances字段输入要部署的计算服务器数量(1–100 之间)。
6. 在Instance type字段选择的计算服务器实例类型。如果想体验DeepSeek-R1的最佳性能,建议大家使用GPU实例类型,例如ml.p5e.48xlarge。


7. 同时建议大家在高级选项中,也进行安全和底层环境的配置,包括虚拟私有云(VPC)网络、IAM访问角色权限和数据加密设置。对于大多数场景,默认的设置就已经足够了。但对于生产环境的部署,大家需要设计好这些设置,以确保它们符合大家业务和组织内部的安全和合规要求。
8. 选择 Deploy 以开始使用该模型。

9. 在部署完成后,大家就可以直接在Amazon Bedrock playground中测试DeepSeek-R1的输出和性能。先选择Open in playground进入用户交互式界面,我们输入提示词,并调整模型参数,如 temperature 和 maximum length等。
在Bedrock中使用R1时,我建议大家使用DeepSeek的预制聊天提示词模板,这样可以获得更好的回复效果。模板如下:

<|begin▁of▁sentence|><|User|>content for inference<|Assistant|>


在大家集成DeepSeek到AI应用之前,可以通过playground快速测试模型的响应,并优化提示词。

使用Python代码调用DeepSeek-R1生成推理回复

以下的代码段介绍了如何通过Python的形式调用Amazon Bedrock的invoke_model和ApplyGuardrail API两个API进行推理生成回复。该Python代码段初始化了bedrock_runtime客户端,配置了推理参数,并发送包含提示词的请求生成文本。

import boto3
import json
from enum import Enum# Initialize Bedrock client
bedrock_runtime = boto3.client("bedrock-runtime")# Configuration
MODEL_ID = "your-model-id"  # Bedrock model ID
GUARDRAIL_ID = "your-guardrail-id"
GUARDRAIL_VERSION = "your-guardrail-version"class ChatTemplate(Enum):LLAMA = "llama"QWEN = "qwen"DEEPSEEK = "deepseek"def format_prompt(prompt, template):"""Format prompt according to model chat template"""templates = {ChatTemplate.LLAMA: f"""<|begin_of_text|><|start_header_id|>system<|end_header_id|>
You are a helpful assistant<|eot_id|><|start_header_id|>user<|end_header_id|>
{prompt}<|eot_id|><|start_header_id|>assistant<|end_header_id|>""",ChatTemplate.QWEN: f"""<|im_start|>user\n{prompt}<|im_end|>\n<|im_start|>assistant""",ChatTemplate.DEEPSEEK: f"""You are a helpful assistant <|User|>{prompt}<|Assistant|>"""}return templates[template]def invoke_with_guardrails(prompt, template=ChatTemplate.DEEPSEEK, max_tokens=1000, temperature=0.6, top_p=0.9):"""Invoke Bedrock model with input and output guardrails"""# Apply input guardrailsinput_guardrail = bedrock_runtime.apply_guardrail(guardrailIdentifier=GUARDRAIL_ID,guardrailVersion=GUARDRAIL_VERSION,source='INPUT',content=[{"text": {"text": prompt}}])if input_guardrail['action'] == 'GUARDRAIL_INTERVENED':return f"Input blocked: {input_guardrail['outputs'][0]['text']}"# Format prompt with selected templateformatted_prompt = format_prompt(prompt, template)# Prepare model inputrequest_body = {"inputs": formatted_prompt,"parameters": {"max_new_tokens": max_tokens,"top_p": top_p,"temperature": temperature}}# Invoke modelresponse = bedrock_runtime.invoke_model(modelId=MODEL_ID,body=json.dumps(request_body))# Parse model responsemodel_output = json.loads(response['body'].read())['generated_text']# Apply output guardrailsoutput_guardrail = bedrock_runtime.apply_guardrail(guardrailIdentifier=GUARDRAIL_ID,guardrailVersion=GUARDRAIL_VERSION,source='OUTPUT',content=[{"text": {"text": model_output}}])if output_guardrail['action'] == 'GUARDRAIL_INTERVENED':return f"Output blocked: {output_guardrail['outputs'][0]['text']}"return model_output# Example usage
if __name__ == "__main__":prompt = "What's 1+1?"result = invoke_with_guardrails(prompt, template=ChatTemplate.DEEPSEEK)print(result)

以上就是在亚马逊云科技上云原生部署DeepSeek-R1模型的上篇内容,我们在本篇中通过Amazon Bedrock部署并测试了DeepSeek模型,在下篇中小李哥将继续介绍,如何利用Amazon Sagemaker JumpStart通过脚本的形式轻松一键部署DeepSeek预训练模型,请大家关注小李哥,不要错过云原生AI开发方案的更多精彩内容。

相关文章:

在亚马逊云科技上云原生部署DeepSeek-R1模型(上)

DeepSeek-R1在开源版本发布的第二天就登陆了亚马逊云科技AWS云平台&#xff0c;这个速度另小李哥十分震惊。这又让我想起了在亚马逊云科技全球云计算大会re:Invent2025里&#xff0c;亚马逊CEO Andy Jassy说过的&#xff1a;随着目前生成式AI应用规模的扩大&#xff0c;云计算的…...

Redis实现分布式锁详解

前言 用 Redis 实现分布式锁&#xff0c;是我们常见的实现分布式锁的一种方式 下面是 redis 实现 分布式锁的四种方式&#xff0c;每种方式都有一定的问题&#xff0c;直到最后的 zookeeper 先透露一下&#xff1a; Redission 解决了 set ex nx 无法自动续期的问题 RedLo…...

表单标签(使用场景注册页面)

表单域&#xff08;了解即可&#xff0c;还要到学习服务器阶段才可以真正送到后台&#xff09; 定义了一个区域了之后&#xff0c;可以把这部分区域发送到后台上 <form action“url地址” method“提交方式” name"表单域名称">各种表单元素控件 </form>…...

c++ template-3

第 7 章 按值传递还是按引用传递 从一开始&#xff0c;C就提供了按值传递&#xff08;call-by-value&#xff09;和按引用传递&#xff08;call-by-reference&#xff09;两种参数传递方式&#xff0c;但是具体该怎么选择&#xff0c;有时并不容易确定&#xff1a;通常对复杂类…...

【创建模式-单例模式(Singleton Pattern)】

赐萧瑀 实现方案饿汉模式懒汉式&#xff08;非线程安全&#xff09;懒汉模式&#xff08;线程安全&#xff09;双重检查锁定静态内部类 攻击方式序列化攻击反射攻击 枚举(最佳实践)枚举是一种类 唐 李世民 疾风知劲草&#xff0c;板荡识诚臣。 勇夫安识义&#xff0c;智者必怀仁…...

攻防世界你猜猜

打开题目发现是一串十六进制的数据 我尝试解码了一下没发现什么&#xff0c;最后找了一下发现因为这是504B0304开头的所以是一个zip文件头 用python代码还原一下 from Crypto.Util.number import * f open("guess.zip","wb") s 0x504B03040A0001080000…...

【Axure教程】标签版分级多选下拉列表

分级多选下拉列表是指一个下拉列表&#xff0c;它包含多个层次的选项&#xff0c;用户可以选择一个或多个选项。这些选项通常是根据某种层级关系来组织的&#xff0c;例如从上到下有不同的分类或者过滤条件&#xff0c;用户选择上层选项后&#xff0c;下层选项会发生变化&#…...

DeepSeek图解10页PDF

以前一直在关注国内外的一些AI工具&#xff0c;包括文本型、图像类的一些AI实践&#xff0c;最近DeepSeek突然爆火&#xff0c;从互联网收集一些资料与大家一起分享学习。 本章节分享的文件为网上流传的DeepSeek图解10页PDF&#xff0c;免费附件链接给出。 1 本地 1 本地部…...

Centos7 停止维护,docker 安装

安装docker报错 执行docker安装命令&#xff1a;sudo yum install -y docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin&#xff0c;出现如下错误 更换yum源 [rootlocalhost yum.repos.d]# sudo mv /etc/yum.repos.d/CentOS-Base.repo /et…...

日志级别修改不慎引发的一场CPU灾难

背景 今天下午16.28有同事通过日志配置平台将某线上应用部分包的日志等级由error调为info&#xff0c;进而导致部分机器CPU升高&#xff0c;甚至有机器CPU达到100%&#xff0c;且ygc次数增加&#xff0c;耗时增加到80&#xff5e;100ms。 故障发现与排查 16.28陆续出现线上C…...

FPGA实现SDI视频缩放转UltraScale GTH光口传输,基于GS2971+Aurora 8b/10b编解码架构,提供2套工程源码和技术支持

目录 1、前言工程概述免责声明 2、相关方案推荐我已有的所有工程源码总目录----方便你快速找到自己喜欢的项目我这里已有的 GT 高速接口解决方案本博已有的 SDI 编解码方案我这里已有的FPGA图像缩放方案 3、工程详细设计方案工程设计原理框图SDI 输入设备GS2971芯片BT1120转RGB…...

二级C语言题解:矩阵主、反对角线元素之和,二分法求方程根,处理字符串中 * 号

目录 一、程序填空&#x1f4dd; --- 矩阵主、反对角线元素之和 题目&#x1f4c3; 分析&#x1f9d0; 二、程序修改&#x1f6e0;️ --- 二分法求方程根 题目&#x1f4c3; 分析&#x1f9d0; 三、程序设计&#x1f4bb; --- 处理字符串中 * 号 题目&#x1f…...

利用 Python 爬虫获取按关键字搜索淘宝商品的完整指南

在电商数据分析和市场研究中&#xff0c;获取商品的详细信息是至关重要的一步。淘宝作为中国最大的电商平台之一&#xff0c;提供了丰富的商品数据。通过 Python 爬虫技术&#xff0c;我们可以高效地获取按关键字搜索的淘宝商品信息。本文将详细介绍如何利用 Python 爬虫技术获…...

什么是幂等性

幂等性&#xff08;Idempotence&#xff09;是一个在数学、计算机科学等多个领域都有重要应用的概念&#xff0c;下面从不同领域为你详细介绍其含义。 数学领域 在数学中&#xff0c;幂等性是指一个操作或函数进行多次相同的运算&#xff0c;其结果始终与进行一次运算的结果相…...

群晖NAS如何通过WebDAV和内网穿透实现Joplin笔记远程同步

文章目录 前言1. 检查群晖Webdav 服务2. 本地局域网IP同步测试3. 群晖安装Cpolar工具4. 创建Webdav公网地址5. Joplin连接WebDav6. 固定Webdav公网地址7. 公网环境连接测试 前言 在数字化浪潮的推动下&#xff0c;笔记应用已成为我们记录生活、整理思绪的重要工具。Joplin&…...

示例:JAVA调用deepseek

近日&#xff0c;国产AI DeepSeek在中国、美国的科技圈受到广泛关注&#xff0c;甚至被认为是大模型行业的最大“黑马”。在外网&#xff0c;DeepSeek被不少人称为“神秘的东方力量”。1月27日&#xff0c;DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜&#xff0c;在…...

【提示工程】:如何有效与大语言模型互动

随着人工智能技术的快速发展,大语言模型(LLM)如 GPT 系列在各类任务中的应用越来越广泛。从文本生成到代码编写,从数据分析到内容创作,这些模型展现出了强大的能力。然而,要充分发挥大语言模型的潜力,关键在于如何设计高质量的提示词(Prompts)。这门技术被称为提示工程…...

操作系统—经典同步问题

补充 互斥信号量mutex初值均为1 同步信号量根据问题实际描述自己设计 生产者-消费者问题 问题描述&#xff1a;一组生产者进程和一组消费者进程 共享一个初始为空、大小为n的缓冲区。&#xff08;缓冲区&#xff1a;临界资源&#xff09; 只有缓冲区没满时&#xff0c;生产者…...

profinet工业通信协议网关:提升钢铁冶炼智能制造效率的利器

工业通信协议网关profinet转ethercat&#xff08;稳联技术WL-PN-ECATM&#xff09;在钢铁冶炼生产线中的智能应用实践 在现代钢铁冶炼生产中&#xff0c;复杂的设备互联和数据传输对生产效率和质量控制至关重要。本案例详细阐述了某大型钢铁集团通过工业通信协议网关实现生产线…...

Vue基础:计算属性(描述依赖响应式状态的复杂逻辑)

文章目录 引言computed() 方法期望接收一个 getter 函数可写计算属性:计算属性的 Setter计算属性的缓存机制调试 Computed引言 推荐使用计算属性来描述依赖响应式状态的复杂逻辑 computed 函数:它接受 getter 函数并为 getter 返回的值返回一个不可变的响应式 ref 对象。 c…...

web vue 项目 Docker化部署

Web 项目 Docker 化部署详细教程 目录 Web 项目 Docker 化部署概述Dockerfile 详解 构建阶段生产阶段 构建和运行 Docker 镜像 1. Web 项目 Docker 化部署概述 Docker 化部署的主要步骤分为以下几个阶段&#xff1a; 构建阶段&#xff08;Build Stage&#xff09;&#xff1a…...

python打卡day49

知识点回顾&#xff1a; 通道注意力模块复习空间注意力模块CBAM的定义 作业&#xff1a;尝试对今天的模型检查参数数目&#xff0c;并用tensorboard查看训练过程 import torch import torch.nn as nn# 定义通道注意力 class ChannelAttention(nn.Module):def __init__(self,…...

理解 MCP 工作流:使用 Ollama 和 LangChain 构建本地 MCP 客户端

&#x1f31f; 什么是 MCP&#xff1f; 模型控制协议 (MCP) 是一种创新的协议&#xff0c;旨在无缝连接 AI 模型与应用程序。 MCP 是一个开源协议&#xff0c;它标准化了我们的 LLM 应用程序连接所需工具和数据源并与之协作的方式。 可以把它想象成你的 AI 模型 和想要使用它…...

UE5 学习系列(三)创建和移动物体

这篇博客是该系列的第三篇&#xff0c;是在之前两篇博客的基础上展开&#xff0c;主要介绍如何在操作界面中创建和拖动物体&#xff0c;这篇博客跟随的视频链接如下&#xff1a; B 站视频&#xff1a;s03-创建和移动物体 如果你不打算开之前的博客并且对UE5 比较熟的话按照以…...

Java - Mysql数据类型对应

Mysql数据类型java数据类型备注整型INT/INTEGERint / java.lang.Integer–BIGINTlong/java.lang.Long–––浮点型FLOATfloat/java.lang.FloatDOUBLEdouble/java.lang.Double–DECIMAL/NUMERICjava.math.BigDecimal字符串型CHARjava.lang.String固定长度字符串VARCHARjava.lang…...

Cinnamon修改面板小工具图标

Cinnamon开始菜单-CSDN博客 设置模块都是做好的&#xff0c;比GNOME简单得多&#xff01; 在 applet.js 里增加 const Settings imports.ui.settings;this.settings new Settings.AppletSettings(this, HTYMenusonichy, instance_id); this.settings.bind(menu-icon, menu…...

SpringBoot+uniapp 的 Champion 俱乐部微信小程序设计与实现,论文初版实现

摘要 本论文旨在设计并实现基于 SpringBoot 和 uniapp 的 Champion 俱乐部微信小程序&#xff0c;以满足俱乐部线上活动推广、会员管理、社交互动等需求。通过 SpringBoot 搭建后端服务&#xff0c;提供稳定高效的数据处理与业务逻辑支持&#xff1b;利用 uniapp 实现跨平台前…...

网络编程(UDP编程)

思维导图 UDP基础编程&#xff08;单播&#xff09; 1.流程图 服务器&#xff1a;短信的接收方 创建套接字 (socket)-----------------------------------------》有手机指定网络信息-----------------------------------------------》有号码绑定套接字 (bind)--------------…...

浪潮交换机配置track检测实现高速公路收费网络主备切换NQA

浪潮交换机track配置 项目背景高速网络拓扑网络情况分析通信线路收费网络路由 收费汇聚交换机相应配置收费汇聚track配置 项目背景 在实施省内一条高速公路时遇到的需求&#xff0c;本次涉及的主要是收费汇聚交换机的配置&#xff0c;浪潮网络设备在高速项目很少&#xff0c;通…...

GruntJS-前端自动化任务运行器从入门到实战

Grunt 完全指南&#xff1a;从入门到实战 一、Grunt 是什么&#xff1f; Grunt是一个基于 Node.js 的前端自动化任务运行器&#xff0c;主要用于自动化执行项目开发中重复性高的任务&#xff0c;例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...