当前位置: 首页 > article >正文

华为云Flexus+DeepSeek征文|DeepSeek-V3/R1商用服务体验全流程

华为云 Flexus 与 DeepSeek-V3/R1 的深度整合,构建了一套 “弹性算力 + 智能引擎” 的协同体系。
Flexus 系列云服务器基于柔性计算技术,通过动态资源调度(如 Flexus X 实例)实现 CPU / 内存的实时弹性分配,尤其适合大模型推理阶段的负载波动需求。而 DeepSeek-V3/R1 作为深度求索的旗舰模型,采用混合专家架构(MoE)与强化学习技术,在通用能力与专业推理间形成差异化定位:V3 以 6710 亿参数覆盖多模态任务(文本、图像、音视频),支持 128K 长上下文窗口和高吞吐量处理;
R1 则通过动态门控专家调度与自进化知识库(1.2 亿条推理链),在数学推理(MATH-500 得分 97.3%)、代码生成(HumanEval 72.8%)等场景达到 GPT-4o 级性能,且推理成本仅为其 1/50。

一、华为云 ModelArts Studio 平台上,两者的协同体现为三层优化:

全栈技术融合:
昇腾 AI 处理器与 DeepSeek 模型的深度适配,使推理速度提升 30%,训练效率提高 45%;
服务化升级:
通过 “模型即服务” 模式,用户可直接调用千亿级 Token 优化的预训练模型,并享受从调优到监控的全生命周期服务;
生态化协同:
Dify-LLM 低代码开发平台支持一键部署 DeepSeek 模型,通过可视化编排界面快速构建智能客服、多模态交互等应用,3 天内即可完成从开通到上线的全流程。

二、开通DeepSeek-V3/R1商用服务

2.1、点击进入到ModelArts Studio大模型即服务平台页面 https://www.huaweicloud.com/product/modelarts/studio.html
1111
2.2、点击在线推理菜单——开通服务
在这里插入图片描述

2.3、根据你自身的业务需要开通相关的服务,例如: DeepSeek-V3-32K、DeepSeek-R1-32K。
DeepSeek-V3-32K模型是DeepSeek-V3-32K 是深度求索(DeepSeek)公司推出的高性能混合专家(MoE)架构大语言模型,参数量为671B。
DeepSeek-R1-32K模型是是深度求索(DeepSeek)推出的第一代高性能推理大模型,专注于复杂推理任务(如数学、代码生成和逻辑推理),参数量为671B。

在这里插入图片描述

三、开发接口信息调用

API地址

https://api.modelarts-maas.com/v1/chat/completions

模型名称

DeepSeek-V3

获取API Key
在调用MaaS的模型服务时,需要填写API Key用于接口的鉴权认证。请创建新的API Key或使用已有API Key,前往 API Key管理
步骤二: 复制调用示例并替换接口信息、API Key

# coding=utf-8import requests
import jsonif __name__ == '__main__':url = "https://api.modelarts-maas.com/v1/chat/completions" # API地址api_key = "yourApiKey"  # 把yourApiKey替换成已获取的API Key # Send request.headers = {'Content-Type': 'application/json','Authorization': f'Bearer {api_key}' }data = {"model":"DeepSeek-V3", # 模型名称"messages": [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": "你好"}],# 是否开启流式推理, 默认为False, 表示不开启流式推理"stream": True,# 在流式输出时是否展示使用的token数目。只有当stream为True时改参数才会生效。# "stream_options": { "include_usage": True },# 控制采样随机性的浮点数,值较低时模型更具确定性,值较高时模型更具创造性。"0"表示贪婪取样。默认为0.6。"temperature": 0.6}response = requests.post(url, headers=headers, data=json.dumps(data), verify=False)# Print result.print(response.status_code)print(response.text)

四、DeepSeek-V3/R1商用服务使用方式

4.1 在线体验
点击已开通的模型进行在线体验Flexus+DeepSeek从技术协同到产业赋能的实践探索,如下图所示。
在这里插入图片描述

4.2 华为云Flexus+DeepSeek响应速度非常的快速

右下角看到本次问题消耗的tokens,会根据使用量来进行计费

在这里插入图片描述

在“文本对话”页面右上角,单击“参数设置”,拖动或直接输入数值配置推理参数。可以单击“恢复默认”,将参数值调回默认值。

参数说明取值样例
温度/Temperature设置推理温度。数值较高,输出结果更加随机。数值较低,输出结果更加集中和确定。0.7
核采样/top_p设置推理核采样。调整输出文本的多样性,数值越大,生成文本的多样性就越高。1
top_k选择在模型的输出结果中选择概率最高的前K个结果。1000

在这里插入图片描述

五、全面了解ModelArts Studio产品架构

在这里插入图片描述

六、生态协同与未来展望

华为云与 DeepSeek 的合作不仅是技术层面的整合,更构建了开放共赢的产业生态:
开发者赋能:ModelArts Studio 提供千万 Token 免费额度与沙箱环境,配合详实的教学文档,使新手也能快速上手;
行业解决方案:针对金融、医疗等领域,联合推出 “模型 + 场景” 的预集成方案,例如 DeepSeek-R1 与 Flexus 企业搜索服务结合,可构建行业知识图谱,实现 “驱邪” 到 “挂菖蒲” 等语义联想检索;
成本创新:通过动态知识蒸馏技术,模型迭代周期缩短至 72 小时,结合 Flexus 的绿色计算碳积分激励,企业可进一步降低算力成本达 30%。

七、最后总结使用感受

本次深度体验华为云 DeepSeek-V3/R1 商用大模型服务,整体流程丝滑流畅,推理能力堪称惊艳,在智能问答、代码生成、企业知识库构建等场景中展现出卓越适配性。特别值得推荐的是,开发者可将其与 Dify 平台深度结合,让 AI 应用开发效率实现飞跃式提升,轻松解锁更多智能化场景新可能~

相关文章:

华为云Flexus+DeepSeek征文|DeepSeek-V3/R1商用服务体验全流程

华为云 Flexus 与 DeepSeek-V3/R1 的深度整合,构建了一套 “弹性算力 智能引擎” 的协同体系。 Flexus 系列云服务器基于柔性计算技术,通过动态资源调度(如 Flexus X 实例)实现 CPU / 内存的实时弹性分配,尤其适合大模…...

Go语言的原子操作

当我们想要对某个变量并发安全的修改,除了使用官方提供的mutex,还可以使用sync/atomic包的原子操作,它能够保证对变量的读取或修改期间不被其他的协程所影响。 Golang提供的原子操作都是非侵入式的,由标准库sync/atmoic包提供&am…...

Visual Studio 2022 插件推荐

Visual Studio 2022 插件推荐 Visual Studio 2022 (简称 VS2022) 是一款强大的 IDE,适合各类系统组件、框架和应用的开发。插件是接入 VS2022 最重要的扩展方式之一,它们可以大幅提升开发效率、优化代码质量,并提供强大的调试和分析功能。 …...

【深度学习-pytorch篇】3. 优化器实现:momentum,NAG,AdaGrad,RMSProp,Adam

Optimization Algorithms Explained 1. Beale Function 与导数函数讲解 Beale 函数是一个著名的用于测试优化算法性能的函数,其具有多个局部极值点,适合评估不同优化器的表现: def beale(x1, x2):"""Beale 函数定义&#x…...

C# NX二次开发-查找连续倒圆角面

在QQ群里有人问怎么通过一个选择一个倒圆角面来自动选中一组倒圆角面。 可以通过ufun函数 UF_MODL_ask_face_type 和 UF_MODL_ask_face_props 可判断处理选择相应的一组圆角面。 代码: Tag[] 查找连续倒圆角面(Tag faceTag) {theUf.Modl.AskFaceType(faceTag, out int typ…...

今天遇到的bug

先呈现一下BUG现象。 这主要是一个传参问题,参数一直传不过去。后来我才发现,问题所在。 我们这里用的RquestBody接收参数,所有请求的参数需要用在body体中接收,但是我们用postman,用的是字符串查询方式传参&#x…...

Go语言字符串类型详解

1. 定义字符串类型 package mainimport ("fmt");func main() {var str1 string "你好 GoLang 1"var str2 "你好 GoLang 2"str3 : "你好 GoLang 3"fmt.Printf("%v--%T\n", str1, str1)// 你好 GoLang 1--stringfmt.Printf…...

长安链智能合约命令解析(全集)

创建命令解析 ./cmc client contract user create \ --contract-namefact \ --runtime-typeWASMER \ --byte-code-path./testdata/claim-wasm-demo/rust-fact-2.0.0.wasm \ --version1.0 \ --sdk-conf-path./testdata/sdk_config.yml \ --admin-key-file-paths./testdata/cryp…...

一、OpenCV的基本操作

目录 1、OpenCV的模块 2、OpenCV的基础操作 2.1图像的IO操作 2.2绘制几何图形 2.3获取并修改图像中的像素点 2.4 获取图像的属性 2.5图像通道的拆分与合并 2.6色彩空间的改变 3、OpenCV的算数操作 3.1图像的加法 3.2图像的混合 3.3总结 1、OpenCV的模块 2、OpenCV的基…...

裂缝仪在线监测装置:工程安全领域的“实时守卫者”

在基础设施运维领域,裂缝扩展是威胁建筑结构安全的核心隐患之一。传统人工巡检方式存在效率低、时效性差、数据主观性强等局限,而裂缝仪在线监测装置通过技术迭代,实现了对结构裂缝的自动化、持续性追踪,为工程安全评估提供科学依…...

【论文精读】2024 ECCV--MGLD-VSR现实世界视频超分辨率(RealWorld VSR)

文章目录 一、摘要二、问题三、Method3.1 Latent Diffusion Model3.2 Motion-guided Diffusion Sampling3.3 Temporal-aware Decoder Fine-tuning 四、实验设置4.1 训练阶段4.2 训练数据 贡献总结 论文全称: Motion-Guided Latent Diffusion for Temporally Consis…...

SpringBoot简单体验

1 Helloworld 打开:https://start.spring.io/ 选择maven配置。增加SpringWeb的依赖。 Generate之后解压,代码大致如下: hpDESKTOP-430500P:~/springboot2/demo$ tree ├── HELP.md ├── mvnw ├── mvnw.cmd ├── pom.xml └── s…...

【系统架构设计师】2025年上半年真题论文回忆版: 论系统负载均衡设计方法(包括解题思路和参考素材)

更多内容请见: 备考系统架构设计师-专栏介绍和目录 文章目录 真题题目(2025年上半年 试题3)解题思路论文素材参考1、静态负载均衡策略2、动态负载均衡策略3、基于场景的负载均衡真题题目(2025年上半年 试题3) 请围绕 “论系统负载均衡设计方法” 论题,依次从以下三个方面…...

2025年通用 Linux 服务器操作系统该如何选择?

2025年通用 Linux 服务器操作系统该如何选择? 服务器操作系统的选择对一个企业IT和云服务影响很大,主推的操作系统在后期更换的成本很高,而且也有很大的迁移风险,所以企业在选择服务器操作系统时要尤为重视。 之前最流行的服务器…...

Azure devops 系统之五-部署ASP.NET web app

今天介绍如何通过vscode 来创建一个asp.net web app,并部署到azure 上。 创建 ASP.NET Web 应用 在您的计算机上打开一个终端窗口并进入工作目录。使用 dotnet new webapp 命令创建一个新的 .NET Web 应用,然后将目录切换到新创建的应用。 dotnet new webapp -n MyFirstAzu…...

Hadoop是什么

注:本人不懂Hadoop是什么,问的大模型,让它用生动浅显的语言向我解释。为了防止忘记,我把它说的记录下来。接下来的解释都是大模型生成的,如果有错误的地方欢迎指正 。 ​​Hadoop 是什么?(一句…...

学习路之PHP--easyswoole_panel安装使用

学习路之PHP--easyswoole_panel安装使用 一、新建文件夹二、安装三、改配置地址四、访问 IP:Port 自动进入index.html页面 一、新建文件夹 /www/wwwroot/easyswoole_panel 及配置ftp 解压easyswoole_panel源码 https://github.com/easyswoole-panel/easyswoole_panel 二、安…...

结合 AI 编程,让前端开发更简单:趋势、方法与实践

在 AI 迅猛发展的浪潮中,前端开发正在迎来范式转变。本文将深入探讨如何将 AI 编程能力嵌入前端工程体系中,重塑前端生产力工具链与开发方式。 一、前端开发的核心痛点 尽管前端框架(如 Vue、React)已经大大简化了 UI 构建&#…...

【拓扑排序】P6560 [SBCOI2020] 时光的流逝|普及+

本文涉及知识点 C图论 拓扑排序 P6560 [SBCOI2020] 时光的流逝 题目背景 时间一分一秒的过着,伴随着雪一同消融在了这个冬天, 或许,要是时光能停留在这一刻,该有多好啊。 … “这是…我在这个小镇的最后一个冬天了吧。” “嗯…...

SSRF 接收器

接收请求 IP.php <?php // 定义日志文件路径 $logFile hackip.txt;// 处理删除请求 if (isset($_POST[delete])) {$ipToDelete $_POST[ip];$lines file($logFile, FILE_IGNORE_NEW_LINES);$newLines array();foreach ($lines as $line) {$parts explode( | , $line);…...

【设计模式】责任链

【设计模式】责任链 在实际开发中&#xff0c;我们经常遇到这样的需求&#xff1a;某个请求需要经过多个处理者&#xff0c;但处理的顺序、方式可能会变化或扩展。这时候&#xff0c;责任链模式就能派上用场。 责任链模式&#xff08;Chain of Responsibility&#xff09; 是…...

unix/linux source 命令,其高级使用

就像在物理学中,掌握了基本定律后,我们可以开始研究更复杂的系统和现象,source 的高级用法也是建立在对其基本行为深刻理解之上的。 让我们一起探索 source 的高级应用领域: 1. 条件化加载 (Conditional Sourcing) 根据某些条件来决定是否 source 一个文件,或者 source…...

邮件验证码存储推荐方式

邮件验证码的存储方案需要兼顾 安全性、性能 和 可维护性&#xff0c;以下是详细分析和推荐方案&#xff1a; 1. 推荐方案&#xff1a;Redis&#xff08;首选&#xff09; 为什么选择 Redis&#xff1f; 优势说明高性能内存读写&#xff0c;毫秒级响应&#xff0c;适合高频验…...

Allegro 输出生产数据详解

说明 用于PCB裸板的生产可以分别单独创建文件 光绘数据(Gerber)、钻孔(NC Drill)、IPC网表;或者通过ODB++或IPC2581文件(这是一个新格式),它包含生产裸板所需要的所有信息 光绘数据 Artwork Gerber 光绘数据一般包含设计中各个层面的蚀刻线路、阻焊、铅锡、字符等信…...

FastAPI MCP 快速入门教程

目录 什么是 FastAPI MCP&#xff1f;项目设置1. 初始化项目2. 安装依赖3. 项目结构 编写代码创建主应用文件 运行和测试1. 启动服务器2. 使用 MCP Inspector 测试 什么是 FastAPI MCP&#xff1f; FastAPI MCP 是一个将 FastAPI 应用程序转换为 Model Context Protocol (MCP)…...

uni-app学习笔记二十一--pages.json中tabBar设置底部菜单项和图标

如果应用是一个多 tab 应用&#xff0c;可以通过 tabBar 配置项指定一级导航栏&#xff0c;以及 tab 切换时显示的对应页。 在 pages.json 中提供 tabBar 配置&#xff0c;不仅仅是为了方便快速开发导航&#xff0c;更重要的是在App和小程序端提升性能。在这两个平台&#xff…...

【Redis】基本命令

Redis命令行客户端 现在我们已经启动了Redis服务&#xff0c;下面将介绍如何使用redis - cli连接、操作Redis服务。客户端和服务端的交互过程如图1 - 3所示。 redis - cli可以使用两种方式连接Redis服务器。 第一种是交互式方式&#xff1a;通过redis - cli -h {host} -p {p…...

爬虫工具链的详细分类解析

以下是针对爬虫工具链的详细分类解析&#xff0c;涵盖静态页面、动态渲染和框架开发三大场景的技术选型与核心特性&#xff1a; &#x1f9e9; 一、静态页面抓取&#xff08;HTML结构固定&#xff09; 工具组合&#xff1a;Requests BeautifulSoup 适用场景&#xff1a;目标数…...

鸿蒙编译ffmpeg库

下载 ffmpeg 项目 基于如下项目编译的 ffmpeg git clone https://gitcode.com/openharmony-sig/tpc_c_cplusplus.git 配置编译环境 下载 command line tools https://developer.huawei.com/consumer/cn/download/ 导出 OHOS_SDK 环境变量 export OHOS_SDK~/command-line-…...

哈希:闭散列的开放定址法

我还是曾经的那个少年 1.概念 通过其要存储的值与存储的位置建立映射关系。 如&#xff1a;基数排序也是运用了哈希开放定址法的的思想。 弊端&#xff1a;仅适用于数据集中的情况 2.开放定址法 问题&#xff1a;按照上述哈希的方式&#xff0c;向集合插入数据为44&#xff…...