在亚马逊云科技上云原生部署DeepSeek-R1模型(上)
DeepSeek-R1在开源版本发布的第二天就登陆了亚马逊云科技AWS云平台,这个速度另小李哥十分震惊。这又让我想起了在亚马逊云科技全球云计算大会re:Invent2025里,亚马逊CEO Andy Jassy说过的:随着目前生成式AI应用规模的扩大,云计算的成本变得至关重要,大家都在寻求具有高性价比的AI模型。其次开发一个真正优质生成式AI应用真的不容易,当我们自由选择 AI 模型开发应用时,最终会形成多元化的模型生态。这说明:不会存在一个通用模型能满足所有需求。
同时他也提到了亚马逊云科技提供的广泛而深入的模型选择,让客户可以精准匹配业务需求。通过密切关注客户需求与技术发展,亚马逊云科技也在不断扩展精选模型库,既包括行业领先的主流模型,也引入了最新的优秀模型。这种高性能、差异化的模型组合,帮助开发者和企业始终站在AI 创新的前沿。这就是DeepSeek-R1能这么快登录亚马逊云科技平台的核心原因。
DeepSeek-R1模型现已登陆亚马逊云科技
位于杭州的AI初创公司DeepSeek于2024年12月发布了DeepSeek-V3,随后在2025年1月20日推出 DeepSeek-R1、DeepSeek-R1-Zero(6710 亿参数)和DeepSeek-R1-Distill(1.5–70 亿参数),并在1月27日推出了视觉AI模型Janus-Pro-7B。这些模型现已全面开放,并比同类模型的成本便宜90-95%!同时DeepSeek模型以卓越的推理能力从各大海外的AI模型中脱颖而出,一发冲天,这得益于其强化学习(RL)等创新的训练方法。
好消息是现在大家可以在Amazon Bedrock和Amazon SageMaker AI训练、部署和使用DeepSeek-R1模型了:
- Amazon Bedrock适合希望通过API快速集成DeepSeek预训练基础模型的开发者。
- Amazon SageMaker AI适用于需要深度定制、训练和部署DeepSeek,并希望直接访问底层基础设施的开发者。
- AWS Trainium和AWS Inferentia芯片目前也支持DeepSeek-R1-Distill蒸馏模型,可在Amazon EC2或Amazon SageMaker AI上经济高效地运行推理任务。

借助亚马逊云科技,大家可以以最低的云计算基础设施投入,利用DeepSeek-R1模型构建、测试,并安全地扩展大家的生成式AI应用。大家还可以结合Amazon Bedrock Guardrails,为AI应用提供额外的安全防护,确保符合开发者们业务场景的AI安全策略。目前大家可以通过以下方式,在亚马逊云科技上部署DeepSeek-R1:
Amazon Bedrock Marketplace(适用于DeepSeek-R1模型)
Amazon SageMaker JumpStart(适用于DeepSeek-R1模型)
Amazon Bedrock 自定义模型导入(适用于DeepSeek-R1-Distill)
Amazon EC2 Trn1实例(适用于DeepSeek-R1-Distill)
在Amazon Bedrock Marketplace模型市场里部署DeepSeek-R1
Amazon Bedrock Marketplace目前提供全球超过100+个热门、新兴及专业化基础模型,涵盖各种行业领先的AI模型。大家可以在控制台的模型目录中快速发现、订阅并部署适合大家需求的模型。

使用ApplyGuardrail API实现DeepSeek-R1的安全调用
Amazon Bedrock也允许大家引入安全防护措施更安全的访问DeepSeek模型,防止生成有害内容,并针对关键安全指标评估模型。大家也可以使用代码调用Amazon Bedrock ApplyGuardrail API,为 DeepSeek-R1模型实现安全防护措施,评估用户输入和模型响应。大家可以使用 Amazon Bedrock控制台或直接通过代码API创建安全防护策略。创建安全防护的示例代码可以在亚马逊云科技GitHub示例代码仓库找到。Guardrail的工作流程原理如下:
- 系统接收用户输入,并将其发送至ApplyGuardrail API进行审核。
- 输入通过审核后,才会发送到模型进行推理。
- 模型返回输出后,再次经过ApplyGuardrail API对输出进行安全检查。
- 如果输出通过审核,最终结果会返回给用户。
- 如果输入或输出未通过审核,系统会返回一条消息,说明拦截原因,并指明干预发生在输入阶段还是输出阶段。
开始部署DeepSeek-R1
如果大家想要在Amazon Bedrock中访问DeepSeek-R1,请完成以下步骤:
1. 在Amazon Bedrock控制台的导航面板中,选择Foundation models下的Model catalog。大家同样也可以使用亚马逊云科技SDK,通过代码中的InvokeModel API调用该模型。该模型目前不支持Converse API或其他 Amazon Bedrock功能。
2. 筛选提供商为DeepSeek,并选择DeepSeek-R1模型。

模型详细信息页面提供了有关模型功能、定价结构和实施指南的多种基本信息。大家可以找到详细的使用说明,包括示例API调用语句代和集成的代码片段。该模型利用强化学习优化和CoT推理能力,支持多种文本生成任务,包括内容创作、代码生成和问答。
该页面同时还包含部署选项和许可信息,帮助大家在应用程序中快速使用上手DeepSeek-R1。
3. 接下来点击Deploy开始使用DeepSeek-R1

系统将提示大家需要为DeepSeek-R1的部署进行资源配置,模型的ID将被自动填充进配置。
4. 在Endpoint name字段输入一个端点名称(1–50 个字母数字字符)。
5. 在Number of instances字段输入要部署的计算服务器数量(1–100 之间)。
6. 在Instance type字段选择的计算服务器实例类型。如果想体验DeepSeek-R1的最佳性能,建议大家使用GPU实例类型,例如ml.p5e.48xlarge。

7. 同时建议大家在高级选项中,也进行安全和底层环境的配置,包括虚拟私有云(VPC)网络、IAM访问角色权限和数据加密设置。对于大多数场景,默认的设置就已经足够了。但对于生产环境的部署,大家需要设计好这些设置,以确保它们符合大家业务和组织内部的安全和合规要求。
8. 选择 Deploy 以开始使用该模型。
9. 在部署完成后,大家就可以直接在Amazon Bedrock playground中测试DeepSeek-R1的输出和性能。先选择Open in playground进入用户交互式界面,我们输入提示词,并调整模型参数,如 temperature 和 maximum length等。
在Bedrock中使用R1时,我建议大家使用DeepSeek的预制聊天提示词模板,这样可以获得更好的回复效果。模板如下:
<|begin▁of▁sentence|><|User|>content for inference<|Assistant|>

在大家集成DeepSeek到AI应用之前,可以通过playground快速测试模型的响应,并优化提示词。
使用Python代码调用DeepSeek-R1生成推理回复
以下的代码段介绍了如何通过Python的形式调用Amazon Bedrock的invoke_model和ApplyGuardrail API两个API进行推理生成回复。该Python代码段初始化了bedrock_runtime客户端,配置了推理参数,并发送包含提示词的请求生成文本。
import boto3
import json
from enum import Enum# Initialize Bedrock client
bedrock_runtime = boto3.client("bedrock-runtime")# Configuration
MODEL_ID = "your-model-id" # Bedrock model ID
GUARDRAIL_ID = "your-guardrail-id"
GUARDRAIL_VERSION = "your-guardrail-version"class ChatTemplate(Enum):LLAMA = "llama"QWEN = "qwen"DEEPSEEK = "deepseek"def format_prompt(prompt, template):"""Format prompt according to model chat template"""templates = {ChatTemplate.LLAMA: f"""<|begin_of_text|><|start_header_id|>system<|end_header_id|>
You are a helpful assistant<|eot_id|><|start_header_id|>user<|end_header_id|>
{prompt}<|eot_id|><|start_header_id|>assistant<|end_header_id|>""",ChatTemplate.QWEN: f"""<|im_start|>user\n{prompt}<|im_end|>\n<|im_start|>assistant""",ChatTemplate.DEEPSEEK: f"""You are a helpful assistant <|User|>{prompt}<|Assistant|>"""}return templates[template]def invoke_with_guardrails(prompt, template=ChatTemplate.DEEPSEEK, max_tokens=1000, temperature=0.6, top_p=0.9):"""Invoke Bedrock model with input and output guardrails"""# Apply input guardrailsinput_guardrail = bedrock_runtime.apply_guardrail(guardrailIdentifier=GUARDRAIL_ID,guardrailVersion=GUARDRAIL_VERSION,source='INPUT',content=[{"text": {"text": prompt}}])if input_guardrail['action'] == 'GUARDRAIL_INTERVENED':return f"Input blocked: {input_guardrail['outputs'][0]['text']}"# Format prompt with selected templateformatted_prompt = format_prompt(prompt, template)# Prepare model inputrequest_body = {"inputs": formatted_prompt,"parameters": {"max_new_tokens": max_tokens,"top_p": top_p,"temperature": temperature}}# Invoke modelresponse = bedrock_runtime.invoke_model(modelId=MODEL_ID,body=json.dumps(request_body))# Parse model responsemodel_output = json.loads(response['body'].read())['generated_text']# Apply output guardrailsoutput_guardrail = bedrock_runtime.apply_guardrail(guardrailIdentifier=GUARDRAIL_ID,guardrailVersion=GUARDRAIL_VERSION,source='OUTPUT',content=[{"text": {"text": model_output}}])if output_guardrail['action'] == 'GUARDRAIL_INTERVENED':return f"Output blocked: {output_guardrail['outputs'][0]['text']}"return model_output# Example usage
if __name__ == "__main__":prompt = "What's 1+1?"result = invoke_with_guardrails(prompt, template=ChatTemplate.DEEPSEEK)print(result)
以上就是在亚马逊云科技上云原生部署DeepSeek-R1模型的上篇内容,我们在本篇中通过Amazon Bedrock部署并测试了DeepSeek模型,在下篇中小李哥将继续介绍,如何利用Amazon Sagemaker JumpStart通过脚本的形式轻松一键部署DeepSeek预训练模型,请大家关注小李哥,不要错过云原生AI开发方案的更多精彩内容。
相关文章:
在亚马逊云科技上云原生部署DeepSeek-R1模型(上)
DeepSeek-R1在开源版本发布的第二天就登陆了亚马逊云科技AWS云平台,这个速度另小李哥十分震惊。这又让我想起了在亚马逊云科技全球云计算大会re:Invent2025里,亚马逊CEO Andy Jassy说过的:随着目前生成式AI应用规模的扩大,云计算的…...
Redis实现分布式锁详解
前言 用 Redis 实现分布式锁,是我们常见的实现分布式锁的一种方式 下面是 redis 实现 分布式锁的四种方式,每种方式都有一定的问题,直到最后的 zookeeper 先透露一下: Redission 解决了 set ex nx 无法自动续期的问题 RedLo…...
表单标签(使用场景注册页面)
表单域(了解即可,还要到学习服务器阶段才可以真正送到后台) 定义了一个区域了之后,可以把这部分区域发送到后台上 <form action“url地址” method“提交方式” name"表单域名称">各种表单元素控件 </form>…...
c++ template-3
第 7 章 按值传递还是按引用传递 从一开始,C就提供了按值传递(call-by-value)和按引用传递(call-by-reference)两种参数传递方式,但是具体该怎么选择,有时并不容易确定:通常对复杂类…...
【创建模式-单例模式(Singleton Pattern)】
赐萧瑀 实现方案饿汉模式懒汉式(非线程安全)懒汉模式(线程安全)双重检查锁定静态内部类 攻击方式序列化攻击反射攻击 枚举(最佳实践)枚举是一种类 唐 李世民 疾风知劲草,板荡识诚臣。 勇夫安识义,智者必怀仁…...
攻防世界你猜猜
打开题目发现是一串十六进制的数据 我尝试解码了一下没发现什么,最后找了一下发现因为这是504B0304开头的所以是一个zip文件头 用python代码还原一下 from Crypto.Util.number import * f open("guess.zip","wb") s 0x504B03040A0001080000…...
【Axure教程】标签版分级多选下拉列表
分级多选下拉列表是指一个下拉列表,它包含多个层次的选项,用户可以选择一个或多个选项。这些选项通常是根据某种层级关系来组织的,例如从上到下有不同的分类或者过滤条件,用户选择上层选项后,下层选项会发生变化&#…...
DeepSeek图解10页PDF
以前一直在关注国内外的一些AI工具,包括文本型、图像类的一些AI实践,最近DeepSeek突然爆火,从互联网收集一些资料与大家一起分享学习。 本章节分享的文件为网上流传的DeepSeek图解10页PDF,免费附件链接给出。 1 本地 1 本地部…...
Centos7 停止维护,docker 安装
安装docker报错 执行docker安装命令:sudo yum install -y docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin,出现如下错误 更换yum源 [rootlocalhost yum.repos.d]# sudo mv /etc/yum.repos.d/CentOS-Base.repo /et…...
日志级别修改不慎引发的一场CPU灾难
背景 今天下午16.28有同事通过日志配置平台将某线上应用部分包的日志等级由error调为info,进而导致部分机器CPU升高,甚至有机器CPU达到100%,且ygc次数增加,耗时增加到80~100ms。 故障发现与排查 16.28陆续出现线上C…...
FPGA实现SDI视频缩放转UltraScale GTH光口传输,基于GS2971+Aurora 8b/10b编解码架构,提供2套工程源码和技术支持
目录 1、前言工程概述免责声明 2、相关方案推荐我已有的所有工程源码总目录----方便你快速找到自己喜欢的项目我这里已有的 GT 高速接口解决方案本博已有的 SDI 编解码方案我这里已有的FPGA图像缩放方案 3、工程详细设计方案工程设计原理框图SDI 输入设备GS2971芯片BT1120转RGB…...
二级C语言题解:矩阵主、反对角线元素之和,二分法求方程根,处理字符串中 * 号
目录 一、程序填空📝 --- 矩阵主、反对角线元素之和 题目📃 分析🧐 二、程序修改🛠️ --- 二分法求方程根 题目📃 分析🧐 三、程序设计💻 --- 处理字符串中 * 号 题目…...
利用 Python 爬虫获取按关键字搜索淘宝商品的完整指南
在电商数据分析和市场研究中,获取商品的详细信息是至关重要的一步。淘宝作为中国最大的电商平台之一,提供了丰富的商品数据。通过 Python 爬虫技术,我们可以高效地获取按关键字搜索的淘宝商品信息。本文将详细介绍如何利用 Python 爬虫技术获…...
什么是幂等性
幂等性(Idempotence)是一个在数学、计算机科学等多个领域都有重要应用的概念,下面从不同领域为你详细介绍其含义。 数学领域 在数学中,幂等性是指一个操作或函数进行多次相同的运算,其结果始终与进行一次运算的结果相…...
群晖NAS如何通过WebDAV和内网穿透实现Joplin笔记远程同步
文章目录 前言1. 检查群晖Webdav 服务2. 本地局域网IP同步测试3. 群晖安装Cpolar工具4. 创建Webdav公网地址5. Joplin连接WebDav6. 固定Webdav公网地址7. 公网环境连接测试 前言 在数字化浪潮的推动下,笔记应用已成为我们记录生活、整理思绪的重要工具。Joplin&…...
示例:JAVA调用deepseek
近日,国产AI DeepSeek在中国、美国的科技圈受到广泛关注,甚至被认为是大模型行业的最大“黑马”。在外网,DeepSeek被不少人称为“神秘的东方力量”。1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在…...
【提示工程】:如何有效与大语言模型互动
随着人工智能技术的快速发展,大语言模型(LLM)如 GPT 系列在各类任务中的应用越来越广泛。从文本生成到代码编写,从数据分析到内容创作,这些模型展现出了强大的能力。然而,要充分发挥大语言模型的潜力,关键在于如何设计高质量的提示词(Prompts)。这门技术被称为提示工程…...
操作系统—经典同步问题
补充 互斥信号量mutex初值均为1 同步信号量根据问题实际描述自己设计 生产者-消费者问题 问题描述:一组生产者进程和一组消费者进程 共享一个初始为空、大小为n的缓冲区。(缓冲区:临界资源) 只有缓冲区没满时,生产者…...
profinet工业通信协议网关:提升钢铁冶炼智能制造效率的利器
工业通信协议网关profinet转ethercat(稳联技术WL-PN-ECATM)在钢铁冶炼生产线中的智能应用实践 在现代钢铁冶炼生产中,复杂的设备互联和数据传输对生产效率和质量控制至关重要。本案例详细阐述了某大型钢铁集团通过工业通信协议网关实现生产线…...
Vue基础:计算属性(描述依赖响应式状态的复杂逻辑)
文章目录 引言computed() 方法期望接收一个 getter 函数可写计算属性:计算属性的 Setter计算属性的缓存机制调试 Computed引言 推荐使用计算属性来描述依赖响应式状态的复杂逻辑 computed 函数:它接受 getter 函数并为 getter 返回的值返回一个不可变的响应式 ref 对象。 c…...
UE5 学习系列(二)用户操作界面及介绍
这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…...
Docker 离线安装指南
参考文章 1、确认操作系统类型及内核版本 Docker依赖于Linux内核的一些特性,不同版本的Docker对内核版本有不同要求。例如,Docker 17.06及之后的版本通常需要Linux内核3.10及以上版本,Docker17.09及更高版本对应Linux内核4.9.x及更高版本。…...
TDengine 快速体验(Docker 镜像方式)
简介 TDengine 可以通过安装包、Docker 镜像 及云服务快速体验 TDengine 的功能,本节首先介绍如何通过 Docker 快速体验 TDengine,然后介绍如何在 Docker 环境下体验 TDengine 的写入和查询功能。如果你不熟悉 Docker,请使用 安装包的方式快…...
从WWDC看苹果产品发展的规律
WWDC 是苹果公司一年一度面向全球开发者的盛会,其主题演讲展现了苹果在产品设计、技术路线、用户体验和生态系统构建上的核心理念与演进脉络。我们借助 ChatGPT Deep Research 工具,对过去十年 WWDC 主题演讲内容进行了系统化分析,形成了这份…...
vscode(仍待补充)
写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用 侧边栏 vscode还能连接ssh? debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...
Matlab | matlab常用命令总结
常用命令 一、 基础操作与环境二、 矩阵与数组操作(核心)三、 绘图与可视化四、 编程与控制流五、 符号计算 (Symbolic Math Toolbox)六、 文件与数据 I/O七、 常用函数类别重要提示这是一份 MATLAB 常用命令和功能的总结,涵盖了基础操作、矩阵运算、绘图、编程和文件处理等…...
Android 之 kotlin 语言学习笔记三(Kotlin-Java 互操作)
参考官方文档:https://developer.android.google.cn/kotlin/interop?hlzh-cn 一、Java(供 Kotlin 使用) 1、不得使用硬关键字 不要使用 Kotlin 的任何硬关键字作为方法的名称 或字段。允许使用 Kotlin 的软关键字、修饰符关键字和特殊标识…...
Reasoning over Uncertain Text by Generative Large Language Models
https://ojs.aaai.org/index.php/AAAI/article/view/34674/36829https://ojs.aaai.org/index.php/AAAI/article/view/34674/36829 1. 概述 文本中的不确定性在许多语境中传达,从日常对话到特定领域的文档(例如医学文档)(Heritage 2013;Landmark、Gulbrandsen 和 Svenevei…...
Java求职者面试指南:计算机基础与源码原理深度解析
Java求职者面试指南:计算机基础与源码原理深度解析 第一轮提问:基础概念问题 1. 请解释什么是进程和线程的区别? 面试官:进程是程序的一次执行过程,是系统进行资源分配和调度的基本单位;而线程是进程中的…...
【C++特殊工具与技术】优化内存分配(一):C++中的内存分配
目录 一、C 内存的基本概念 1.1 内存的物理与逻辑结构 1.2 C 程序的内存区域划分 二、栈内存分配 2.1 栈内存的特点 2.2 栈内存分配示例 三、堆内存分配 3.1 new和delete操作符 4.2 内存泄漏与悬空指针问题 4.3 new和delete的重载 四、智能指针…...


