华为云Flexus+DeepSeek征文 | DeepSeek-V3/R1商用服务开通体验全流程及使用评测
作者简介
我是摘星,一名专注于云计算和AI技术的开发者。本次通过华为云MaaS平台体验DeepSeek系列模型,将实际使用经验分享给大家,希望能帮助开发者快速掌握华为云AI服务的核心能力。
目录
1. 前言
2. 开通DeepSeek-V3/R1商用服务
2.1 准备工作
2.2 详细开通步骤
Step 1:登录华为云控制台
Step 2:进入“模型推理-在线推理”模块
Step 3:开通商用服务
Step 4:获取API调用信息
3. 方式一:REST API调用
3.1 基础调用示例
3.2 流式输出模式
4. 方式二:OpenAI SDK调用
4.1 环境准备
4.2 基础调用示例
4.3 流式输出模式
5. 对比评测
6. 使用建议
7. 常见问题
8. 总结
1. 前言
近年来,大模型技术快速发展,华为云推出的DeepSeek-V3/R1商用大模型服务,为企业及开发者提供了高性能的AI推理能力。本文将详细介绍如何在华为云ModelArts Studio上开通DeepSeek-V3/R1商用服务,并分享实际使用体验,帮助开发者快速上手。
2. 开通DeepSeek-V3/R1商用服务
2.1 准备工作
- 华为云账号:需注册并完成实名认证(个人/企业均可)
- 账号余额 ≥10元(避免因欠费导致服务开通失败)
- 访问入口:华为云ModelArts Studio
2.2 详细开通步骤
Step 1:登录华为云控制台
- 访问华为云官网,点击右上角**“登录”**,输入账号密码。
- 进入控制台,在顶部搜索栏输入 “ModelArts”,进入 ModelArts Studio 服务页面。
Step 2:进入“模型推理-在线推理”模块
- 在左侧导航栏选择 “模型推理” → “在线推理”。
- 点击 “商用服务” 标签页,找到 DeepSeek-V3/R1 大模型服务。
Step 3:开通商用服务
- 点击 “立即开通”,系统会提示 “服务授权”,勾选同意后确认。
- 等待约1-2分钟,系统自动完成服务部署,状态变为 “运行中” 即表示开通成功。
Step 4:获取API调用信息
- 在 “在线推理” 页面,找到已开通的DeepSeek-V3/R1服务,点击 “详情”。
Y3DY4WF5wJLE3q8XEVpbRqNqUBse4SmaazT5_2jYw3logYwxEQEIpa04Vhu8VwRTtII_Grn5SnbNlr4OZb4LAw - 记录 API访问地址(Endpoint) 和 API密钥(AK/SK),后续调用需使用。
✅ 开通成功! 现在可以开始使用DeepSeek-V3/R1进行推理任务。
3. 方式一:REST API调用
3.1 基础调用示例
# coding=utf-8
import requests
import jsonurl = "https://api.modelarts-maas.com/v1/chat/completions" # API地址
api_key = "" # 替换为你的API Keyheaders = {'Content-Type': 'application/json','Authorization': f'Bearer {api_key}'
}data = {"model": "DeepSeek-R1", "messages": [{"role": "system", "content": "你是一名AI助手"},{"role": "user", "content": "用Python实现二分查找"}],"temperature": 0.6,"stream": False # 关闭流式输出
}response = requests.post(url, headers=headers, json=data)
print(f"状态码: {response.status_code}")
print("响应结果:")
print(json.dumps(response.json(), indent=2, ensure_ascii=False))
3.2 流式输出模式
# coding=utf-8
import requests
import jsonurl = "https://api.modelarts-maas.com/v1/chat/completions" # API地址
api_key = "" # 替换为你的API Keyheaders = {'Content-Type': 'application/json','Authorization': f'Bearer {api_key}'
}data = {"model": "DeepSeek-R1", # 可替换为DeepSeek-R1"messages": [{"role": "system", "content": "你是一名AI助手"},{"role": "user", "content": "用Python实现二分查找"}],"temperature": 0.6,"stream": True
}
try:with requests.post(url, headers=headers, json=data, stream=True) as response:response.raise_for_status() # 检查HTTP错误print(f"状态码: {response.status_code}")for chunk in response.iter_lines():if chunk:decoded = chunk.decode('utf-8').strip()if decoded.startswith("data:"):data_str = decoded[5:].strip() # 去掉 "data: " 前缀if data_str != "[DONE]":try:data_obj = json.loads(data_str)# 检查数据结构是否包含 contentif "choices" in data_obj and len(data_obj["choices"]) > 0:delta = data_obj["choices"][0].get("delta", {})content = delta.get("content", "")if content:print(content, end="", flush=True)except json.JSONDecodeError as e:print(f"JSON解析错误: {e}, 原始数据: {decoded}")
except requests.exceptions.RequestException as e:print(f"请求失败: {e}")
4. 方式二:OpenAI SDK调用
4.1 环境准备
pip install --upgrade "openai>=1.0"
4.2 基础调用示例
# coding=utf-8
from openai import OpenAIclient = OpenAI(base_url="https://api.modelarts-maas.com/v1",api_key="" # 替换为你的API Key
)response = client.chat.completions.create(model="DeepSeek-R1", # 指定模型messages=[{"role": "system", "content": "你是一名资深程序员"},{"role": "user", "content": "解释快速排序算法"}],temperature=0.7
)print(response.choices[0].message.content)
4.3 流式输出模式
from openai import OpenAIclient = OpenAI(base_url="https://api.modelarts-maas.com/v1",api_key="" # 替换为你的API Key
)stream = client.chat.completions.create(model="DeepSeek-R1",messages=[{"role": "user", "content": "用三句话介绍华为云"}],stream=True
)for chunk in stream:if chunk.choices and len(chunk.choices) > 0: # 检查 choices 是否有效delta = chunk.choices[0].deltaif delta and delta.content: # 检查 delta 和 content 是否存在print(delta.content, end="", flush=True)
5. 对比评测
特性 | REST API | OpenAI SDK |
兼容性 | 通用HTTP接口 | 完全兼容OpenAI生态 |
流式响应 | 需手动处理chunk数据 | 原生支持stream参数 |
代码复杂度 | 需要构造HTTP请求 | 封装完善,调用简洁 |
适用场景 | 嵌入式设备、非Python环境 | Python项目快速集成 |
额外功能 | 可查看原始响应头 | 自动类型检查 |
6. 使用建议
- 企业级应用:推荐使用REST API,便于统一管理请求日志和监控
- AI原型开发:优先选择OpenAI SDK,可快速迁移其他大模型代码
- 性能敏感场景:流式模式(stream=True)能显著提升用户体验
- 安全注意:API Key需通过环境变量管理,避免硬编码泄露
7. 常见问题
Q1: 如何查看API使用量?
A: 在华为云控制台"费用中心 > 使用量统计"查看调用次数和Token消耗
Q2: 流式输出时如何计算费用?
A: 按实际生成的Token数量计费,与是否流式无关
Q3: 最大支持多少上下文长度?
A: DeepSeek-V3支持32K tokens,R1支持8K tokens
8. 总结
本次体验了华为云 DeepSeek-V3/R1 商用大模型服务,整体流程顺畅,推理能力强大,适用于 智能问答、代码生成、企业知识库 等场景。推荐开发者结合 Dify平台 进行AI应用开发,进一步提升效率。
下一步计划:尝试基于Dify搭建企业知识库,并测试高可用方案,欢迎关注后续评测!
相关资源
- 华为云ModelArts Studio
- DeepSeek-V3/R1官方文档
- Dify一键部署方案
- REST API参考
- OpenAI SDK指南
相关文章:

华为云Flexus+DeepSeek征文 | DeepSeek-V3/R1商用服务开通体验全流程及使用评测
作者简介 我是摘星,一名专注于云计算和AI技术的开发者。本次通过华为云MaaS平台体验DeepSeek系列模型,将实际使用经验分享给大家,希望能帮助开发者快速掌握华为云AI服务的核心能力。 目录 1. 前言 2. 开通DeepSeek-V3/R1商用服务 2.1 准…...
redis列表类型
练习命令使用,具体如下: lpush llen lrange lpoprpush lindex lset rpop linsert LPUSH命令用来向列表左边增加元素,返回值表示增加元素后列表的长度 127.0.0.1:6379> lpush letter A B C (integer) 3 127.0.0.1:6379> type letter …...

人工智能数学基础实验(一):智能推荐系统实战
一、实验目的 本次实验旨在通过构建用户相似度矩阵和实现个性化推荐,帮助我们直观理解推荐系统的核心原理及其背后的数学基础。具体目标如下: 运用 Python 计算用户间的评分相似度,掌握余弦相似度等数学工具在衡量用户偏好中的应用ÿ…...

uni-app学习笔记十二-vue3中组件传值(对象传值)
一.单对象传值 父组件定义对象的值 <template><view><UserInfo :obj"userinfo"></UserInfo></view> </template><script setup>import {ref} from "vue"const userinfo ref({name:"蛛儿",avatar:&…...

Vue.js教学第十四章:Vuex模块化,打造高效大型应用状态管理
Vuex(二):深入剖析 Vuex 模块化与高级应用 在大型 Vue 应用开发中,随着应用功能的不断扩展和复杂度的增加,状态管理的难度也随之上升。Vuex 作为 Vue.js 的官方状态管理库,提供了模块化功能,使得我们可以将状态管理逻辑拆分成多个模块,从而提高 Vuex 的可维护性和可读…...
Ubuntu/Linux 服务器上调整系统时间(日期和时间)
在 Ubuntu/Linux 服务器上调整系统时间(日期和时间)可以通过以下命令实现,具体分为 手动设置 和 自动同步(NTP)两种方式: 1. 查看当前系统时间 date或查看详细时区信息: timedatectl2. 手动设…...

win11 禁用/恢复 内置笔记本键盘(保证管用)
文章目录 禁用启用 禁用 1)按下 win x,点击 设备管理器 2)拔掉所有笔记本外设(一定要都拔掉,不然后面禁用设备会混淆),然后右键点击 键盘 > HID Keyboard Device 2)点击 更新…...

精度不够?光纤激光尺0.2ppm误差解锁微米级制造
当“精度焦虑”成为制造业的隐形门槛: 在半导体光刻中,1nm偏差可能导致整片晶圆报废; 在精密机床加工中,热变形让传统测量工具“失灵”…… “高精度、高稳定、抗干扰”——工业超精密制造的三大痛点,如何破局…...

Android 16系统源码_自由窗口(一)触发自由窗口模式
前言 从 Android 7.0 开始,Google 推出了一个名为“多窗口模式”的新功能,允许在设备屏幕上同时显示多个应用,多窗口模式允许多个应用同时共享同一屏幕,多窗口模式(Multi Window Supports)目前支持以下三种…...

sqli-labs第十八关——POST-UA注入
一:判断注入类型 先在用户名和密码框尝试判断,发现都得不到需要的回显 所以查看源码 可以发现username和password的输入后端都做了检查,没法直接注入 所以我们尝试uagent注入 UA注入: 没有url解码处理只识别原始空格ÿ…...
流式优先架构:彻底改变实时数据处理
近年来,随着现代组织的数据环境日趋复杂且高速流动,传统数据库系统已难以满足实时分析、物联网应用以及即时决策的需求。围绕批处理和静态数据模型设计的 RDBMS(关系型数据库管理系统)在架构层面缺乏实时处理能力,而流…...
WebSockets 在实时通信中的应用与优化
WebSockets 在实时通信中的应用与优化 1. 引言 在现代互联网应用中,实时通信 已成为许多场景的核心需求,如在线聊天、直播互动、在线游戏、实时数据推送等。而传统的 HTTP 轮询或长轮询方式往往伴随着 高延迟、资源浪费 等问题,使得开发者在…...
零基础教程:用 Docker + pgloader 将 MySQL 数据库迁移到 PostgreSQL
在日常开发中,可能会遇到从 MySQL 迁移到 PostgreSQL 的需求。你也许是: 正在准备从传统架构转向云原生;想使用 PostgreSQL 更强的事务与 JSON 支持;想统一团队数据库技术栈;纯粹为了尝试学习不同的数据库系统。别担心,无需手动写导出脚本,无需配置复杂工具,只需借助 D…...

mac上安装 Rust 开发环境
1.你可以按照提示在终端中执行以下命令(安全、官方支持): curl --proto https --tlsv1.2 -sSf https://sh.rustup.rs | sh然后按提示继续安装即可。 注意:安装过程中建议选择默认配置(按 1 即可)。 如果遇…...
解决RedisTemplate的json反序列泛型丢失问题
背景 在使用redisTemplate操作redis时我们针对对象的序列化通常将序列化成json存储到redis。一般如下配置 Bean ConditionalOnMissingBean public RedisTemplate<?, ?> redisTemplate(RedisConnectionFactory redisConnectionFactory, ObjectProvider<RedisT…...
【Elasticsearch】创建别名的几种方式
在 Elasticsearch 中,有以下几种创建索引别名的方式: 1. 在创建索引时指定别名 在创建索引时,可以直接在索引定义中指定别名。这种方式可以在索引创建的同时完成别名的绑定,避免后续的额外操作。 示例: json PUT /te…...
【JAVA】中文我该怎么排序?
📘 Java 中文排序教学文档(基于 Collator) 🧠 目录 概述Java 中字符串排序的默认行为为什么需要 Collator使用 Collator 进行中文排序升序 vs 降序排序自定义对象字段排序多字段排序示例总结对比表附录:完整代码示例 …...

《C 语言字符串操作从入门到实战(下篇):strncpy/strncat/strstr 等函数原理与实现》
目录 七. strncpy函数的使用与模拟实现 7.1 strncpy函数理解 7.2 strncpy函数使用示例 7.3 strncpy函数模拟实现 八. strncat函数的使用与模拟实现 8.1 strncat函数理解 8.2 strncat函数使用示例 8.3 strncat函数模拟实现 九. strncmp函数的使用 9.1 strncmp函数理…...

百度飞桨PaddleOCR 3.0开源发布 OCR精度跃升13%
百度飞桨 PaddleOCR 3.0 开源发布 2025 年 5 月 20 日,百度飞桨团队正式发布了 PaddleOCR 3.0 版本,并将其开源。这一新版本在文字识别精度、多语种支持、手写体识别以及高精度文档解析等方面取得了显著进展,进一步提升了 PaddleOCR 在 OCR …...

Xilinx 7Series\UltraScale 在线升级FLASH STARTUPE2和STARTUPE3使用
一、FPGA 在线升级 FPGA 在线升级FLASH时,一般是通过逻辑生成SPI接口操作FLASH,当然也可以通过其他SOC经FPGA操作FLASH,那么FPGA就要实现在启动后对FLASH的控制。 对于7Series FPGA,只有CCLK是专用引脚,SPI接口均为普…...

数字孪生驱动的离散制造智能升级:架构设计与工程实践
针对离散制造行业多品种、小批量的生产特性,本文提出一种基于数字孪生的智能制造解决方案。以某国家级智能制造试点示范项目为载体,构建"云-边-端"协同的数字孪生系统,实现设备综合效率(OEE)提升28.7%、订单…...

9.4在 VS Code 中配置 Maven
在 VS Code 中配置 Maven 需要完成 Maven 环境安装 一、安装 Maven(如果未安装) 下载 Maven 访问 Apache Maven 官网,下载最新版本的 Maven(如apache-maven-3.9.9-bin.zip)。 解压文件 将下载的 ZIP 文件解压到本地目…...
mmaction2——tools文件夹下
build_rawframes.py 用法示例 python tools/data/build_rawframes.py data/videos data/frames --task rgb --level 2 --ext mp4 --use-opencv --num-worker 8总结: 只需要 RGB 帧,推荐 --use-opencv,简单高效,无需额外依赖。 …...

新能源汽车充电桩资源如何利用资源高效配置?
新能源汽车充电桩资源的高效配置是实现绿色交通转型的关键环节。随着新能源汽车保有量的快速增长,充电基础设施的供需矛盾日益凸显。如何优化充电桩资源布局、提升使用效率、平衡不同场景需求,成为当前亟待解决的问题。以下是几点关于充电桩资源高效配置…...
python 程序实现了毫米波大规模MIMO系统中的信道估计对比实验
python 程序实现了毫米波大规模MIMO系统中的信道估计对比实验 import numpy as np import matplotlib.pyplot as plt import tensorflow as tf from tensorflow.keras.models import Sequential, Model from tensorflow.keras.layers...
NTFS0x90属性和0xa0属性和0xb0属性的一一对应关系是index_entry中的index_node中VCN和runlist和bitmap
第一部分: 0: kd> dt _FILE_RECORD_SEGMENT_HEADER 0xc1241400 Ntfs!_FILE_RECORD_SEGMENT_HEADER 0x000 MultiSectorHeader : _MULTI_SECTOR_HEADER 0x008 Lsn : _LARGE_INTEGER 0x80e74aa 0x010 SequenceNumber : 5 0x012 Referen…...
PDF 编辑批量拆分合并OCR 识别
各位办公小能手们!你们有没有过被PDF文件折磨得死去活来的经历?反正我是有,每次要编辑PDF,那叫一个费劲啊!不过呢,今天我要给大家介绍一款神器——WPS PDF to Word,有了它,PDF编辑那…...

LeetCode --- 450周赛
题目列表 3550. 数位和等于下标的最小下标 3551. 数位和排序需要的最小交换次数 3552. 网格传送门旅游 3553. 包含给定路径的最小带权子树 II 一、数位和等于下标的最小下标 直接模拟计算数位和即可,代码如下 // C class Solution { public:int smallestIndex(ve…...

SpringBoot中消息转换器的选择
SpringBoot返回xml-CSDN博客 是返回JSON 还是XML 是由内容协商机制确认的,SpringBoot为了开发便利性,如果我没有该消息转换器,默认就返回了JSON,如果需要XML那么,引入 <dependency><groupId>com.fasterxml.jackson.dataformat</groupId><artifactId>…...
(初级)前端初学者入门指南:HTML5与CSS3核心知识详解
对于前端初学者来说,掌握HTML5和CSS3的基础知识是构建现代化网页的第一步。本文将围绕语义化标签、多媒体嵌入、盒模型、Flexbox布局和Grid布局五大核心知识点展开,通过代码示例和详细解析帮助大家快速上手。 一、HTML5:从结构到交互的革新 …...