当前位置: 首页 > article >正文

基于PAI+专属网关+私网连接:构建全链路 Deepseek 云上私有化部署与模型调用架构

DeepSeek - R1 是由深度求索公司推出的首款推理模型,该模型在数学、代码和推理任务上的表现优异,市场反馈火爆。在大模型技术商业化进程中,企业级用户普遍面临四大核心挑战:

  • 算力投入成本高昂:构建千亿参数级模型的训练与推理集群需巨额开支,导致中小企业难以跨越技术准入门槛;
  • 算力资源供应紧张:一线城市 GPU 集群受限于硬件供应短缺与资源抢占激烈,算力资源不足;
  • 模型部署复杂:从算法适配、性能调优到业务系统集成的端到端部署周期动辄数月,部署困难;
  • 数据安全合规风险:传统公网调用模式存在数据泄露隐患,难以满足企业对核心数据安全防护的严苛要求。

对于对数据主权敏感、业务全球化、需长期技术自主权的企业来说,其在 AI 商业化进程中实现技术可控、成本可控、风险可控尤为重要,基于以上基本诉求,此类客户更加注重:

  1. 自主可控的 AI 部署能力:
  • 需要灵活管理模型版本、算法优化路径,而非完全依赖第三方 API 接口。
  • 可定制模型(如微调预训练模型或集成自研算法)。
  1. 数据隐私与合规性保障:
  • 核心业务数据(如客户隐私、生产数据、财务数据)需在私有网络内处理,避免公网暴露风险。
  1. 跨区域业务协同需求:
  • 全球化业务需在不同区域(如亚洲、欧洲、美洲)部署低延迟的AI推理服务。
  1. 成本与资源效率优化:
  • AI 推理使用量大,避免 API 的高单价调用成本,需自主可控的按需弹性调度算力资源。

为了解决以上问题,阿里云推荐使用基于阿里云 PAI+ 专属网关 + 私网连接解决方案:破解大模型落地的技术与资源瓶颈。

阿里云 PAI 目前已经支持一键部署 DeepSeek-V3、DeepSeek-R1 模型,结合乌兰察布的 GPU 资源与阿里云 CEN 全球骨干网能力,配合使用专属网关 + 私网连接,企业可快速搭建:

  1. 全球骨干级内网通道:通过 CEN 云企业网打通全球 VPC 与本地混合云,实现内网级访问延迟

  2. 全链路零公网暴露:专属网关 + 私网连接确保模型调用、数据传输全程私有化

  3. 东数西算算力网络:低成本利用乌兰察布算力资源,支撑全球业务的 AI 推理需求

通过此方案可以帮助企业级用户搭建东数西算核心算力网络,快速构建零公网暴露的云上私有化部署与模型调用架构。

场景示例

本文以下图场景为例。某企业在阿里云华东(上海)地域创建了专有网络 VPC1,在该 VPC1 中有业务环境。为了业务环境的稳定性和安全性,该企业希望在乌兰察布使用 PAI 部署一套自有的云上 Deepseek 模型调用环境,提供给上海的业务集群使用,并要求私网访问,以构建全链路私有化部署与模型调用架构。
在这里插入图片描述

前提条件

  • 您已在乌兰察布地域创建了专有网络 VPC1,并在两个可用区内创建两台交换机
    VSW1、VSW2,创建了对应的安全组。具体操作,请参见创建专有网络,创建和管理交换机。
  • 您已在上海地域创建了专有网络 VPC2,并在两个可用区内创建两台交换机
    VSW3、VSW4,创建了对应的安全组。具体操作,请参见创建专有网络,创建和管理交换机。
  • 您已分别在 VSW3 和 VSW4 中创建 ECS01 和 ECS02 实例。
  • 您已创建云企业网 CEN,并分别在上海、乌兰察布创建好转发路由器 TR,并将 VPC1 和 VPC2 互相打通,具体步骤请参考跨地域
    VPC 互通。

步骤一:使用模型在线服务 EAS,一键搭建 DeepSeek-R1 模型

  1. 登录人工智能平台 PAI。

  2. 在顶部菜单栏,选择 PAI 所属的地域。

  3. 在左侧导航栏,选择模型部署 > 模型在线服务( EAS )。

  4. 在推理服务中,点击部署服务。

  5. 在场景化模型部署中,选择 LLM 大语言模型部署。
    在这里插入图片描述
    在这里插入图片描述

  6. 点击部署。

步骤二:在 EAS 模型在线服务中创建专属网关,打通服务调用所属 VPC

  1. 在模型在线服务( EAS )菜单栏中,切换到专属网关页签,新建专属网关 > 新建后付费专属网关。
    在这里插入图片描述

  2. 在模型在线服务( EAS )菜单栏中,切换到专属网关页签,新建专属网关 > 新建后付费专属网关(按量付费)。

  3. 购买完成后,为专属网关添加专有网络。
    单击专属网关名称,在开通相关服务后,在网关详情页面网关访问控制 > 专有网络页签,添加乌兰察布地域专有网络 VPC1 ,交换机 VSW2。创建后,在乌兰察布地域进入私网连接 > 终端节点,可以看到专属网关自动已经创建好对应的接口终端节点。
    在这里插入图片描述
    在这里插入图片描述

  4. 为专属网关关联其他 VPC,本文选择华东(上海)地域 VPC1。
    在这里插入图片描述
    在这里插入图片描述

创建后,在云解析 Privatezone > 域名设置里,可以看到专属网关已自动创建好对应的 VPC 内网解析。
在这里插入图片描述
5. 修改专属网关白名单设置,放通对应的 VPC 网段。
在这里插入图片描述
在这里插入图片描述

步骤三:将模型在线服务 EAS 加入到对应专属网关

  1. 在模型在线服务( EAS )菜单栏中,切换到推理服务页签,在对应模型服务的操作菜单中点击更新。
    在这里插入图片描述
  2. 在页签的右上角点击切换为自定义部署,下拉菜单到服务功能页签,选择已经创建的专属网关,并更新配置。
    在这里插入图片描述
    在这里插入图片描述
  3. 在模型在线服务( EAS )菜单栏中,切换到推理服务页签,在对应模型服务的服务方式菜单中点击调用信息。
    在这里插入图片描述
    选择 VPC 地址调用,可以看到对应的模型服务地址以及 Token 信息
    在这里插入图片描述

步骤四:测试使用私网调用 EAS 模型服务

  1. 登录上海地域 VPC2 内的 ECS01,并将 EAS 模型服务对应的 Token 添加到环境变量中。

执行以下命令,将环境变量设置追加到 ~/.bashrc 文件中:
# 用对应的调用 Token 代替 <你的EAS的TOKEN>

echo "export EAS_TOKEN=<你的EAS的TOKEN>" >> ~/.bashrc

执行以下命令,刷新环境变量设置

source ~/.bashrc

在这里插入图片描述
2. 使用私网 HTTP / HTTPS 调用模型服务

示意如下,其中,< model_name > 请替换为模型列表接口 <EAS_ENDPOINT>/v1/models 获取的模型名称,< EAS_ENDPOINT > 请替换为 EAS VPC 地址调用的域名。

备注:调用方式可以为 HTTP / HTTPS.

curl -X POST \-H "Content-Type: application/json" \    -H "Authorization: Bearer $EAS_TOKEN" \    -d '{"model": "<model_name>",        "messages": [        {      "role": "system",            "content": "You are a helpful assistant."        },        {            "role": "user",            "content": "hello!"       }        ]    }' \    <EAS_ENDPOINT>/v1/chat/completions

返回成功响应表明私网调用 DeepSeek - R1 通道 已成功建立。
在这里插入图片描述

(可选)步骤五:使用 EAS 专属网关公网调用能力

  1. 为专属网关添加公网访问能力。

单击专属网关名称,在开通相关服务后,在网关详情页面网关访问控制 > 公网页签,打开访问入口按钮,并添加公网访问白名单。
在这里插入图片描述
2. 使用公网 HTTP / HTTPS 调用模型服务

示意如下,< EAS_TOKEN > 请替换为 EAS 的 Token 信息,< model_name > 请替换为模型列表接口 <EAS_ENDPOINT>/v1/models 获取的模型名称,

< EAS_ENDPOINT > 请替换为 EAS 公网调用的地址。

备注:调用方式可以为 HTTP / HTTPS.

curl -X POST \-H "Content-Type: application/json" \-H "Authorization:  <EAS_TOKEN>" \-d '{"model": "<model_name>","messages": [{"role": "system","content": "You are a helpful assistant."},{"role": "user","content": "hello!"}]}' \<EAS_ENDPOINT>/v1/chat/completions

使用本地设备测试,返回成功响应表明公网调用 DeepSeek - R1 通道 已成功建立。
在这里插入图片描述
阿里云通过 PAI+ 专属网关 + 私网连接方案,为企业级用户构建了技术可控、成本优化、安全可靠的 AI 私有化部署调用路径。该方案不仅解决了算力资源紧张与部署复杂度高的痛点,全链路私有化部署和全球低延迟算力网络,也满足了企业对数据主权、全球化业务部署及长期技术自主的需求。凭借乌兰察布算力资源与 CEN 骨干网的协同,企业可快速实现大模型的高效落地,为 AI 技术的规模化应用提供了可信赖的基础设施支撑。

相关文章:

基于PAI+专属网关+私网连接:构建全链路 Deepseek 云上私有化部署与模型调用架构

DeepSeek - R1 是由深度求索公司推出的首款推理模型&#xff0c;该模型在数学、代码和推理任务上的表现优异&#xff0c;市场反馈火爆。在大模型技术商业化进程中&#xff0c;企业级用户普遍面临四大核心挑战&#xff1a; 算力投入成本高昂&#xff1a;构建千亿参数级模型的训…...

【cocos creator 3.x】cocos creator2.x项目升级3.x项目改动点

1、基本改动 基本改动&#xff1a;去掉了cc.&#xff0c;改成在顶部添加导入 项目升级时候直接将cc.去掉&#xff0c;根据提示添加引用 node只保留position,scale,rotation,layer 其余属性如opacity&#xff0c;如果需要使用需要在节点手动添加UIOpacity组件 3d层和ui层分开…...

​​eBay东南亚爆单密码:72小时交付计划如何重构厦门仓+东南亚供应链?​

2024年东南亚电商市场规模预计突破2340亿美元&#xff0c;年复合增长率达18%。eBay最新战略将厦门纳入海外仓核心节点&#xff0c;推出“72小时交付计划”&#xff0c;通过“仓配转”一体化链路&#xff0c;助力中国卖家实现东南亚市场订单履约率提升10%&#xff0c;退货成本降…...

List基础与难度题

1. 向 ArrayList 中添加元素并打印 功能描述&#xff1a; 程序创建一个空的 ArrayList 集合&#xff0c;用于存储字符串类型的元素。向该 ArrayList 中依次添加指定的字符串元素。使用增强型 for 循环遍历 ArrayList 中的所有元素&#xff0c;并将每个元素打印输出到控制台。 …...

Oracle19C低版本一天遭遇两BUG(ORA-04031/ORA-600)

昨天帮朋友看一个系统异常卡顿的案例&#xff0c;在这里分享给大家 环境&#xff1a;Exadata X8M 数据库版本19.11 1.系统报错信息 表象为系统卡顿&#xff0c;页面无法刷出&#xff0c;登陆到主机上看到节点1 系统等待存在大量的 cursor: pin S wait on X等待 查看两个节…...

golang处理时间的包time一次性全面了解

本文旨在对官方time包有个全面学习了解。不钻抠细节&#xff0c;但又有全面了解&#xff0c;重点介绍常用的内容&#xff0c;一些低频的可能这辈子可能都用不上。主打一个花最少时间办最大事。 Duration对象: 两个time实例经过的时间,以长度为int64的纳秒来计数。 常见的durati…...

C++学习:六个月从基础到就业——面向对象编程:重载运算符(下)

C学习&#xff1a;六个月从基础到就业——面向对象编程&#xff1a;重载运算符&#xff08;下&#xff09; 本文是我C学习之旅系列的第十三篇技术文章&#xff0c;是面向对象编程中运算符重载主题的下篇。本篇文章将继续深入探讨高级运算符重载技术、特殊运算符、常见应用场景和…...

【网络安全】谁入侵了我的调制解调器?(二)

文章目录 针对 TR-069 协议 REST API 的攻击思路攻击百万台调制解调器意外发现 Cox 后端 API 的授权绕过漏洞确认我们能够进入任何人的设备访问和更新任何Cox商业客户账户通过泄露的加密密钥覆盖任何人的设备设置执行对任何调制解调器的命令影响最后想说阅读本文前,请先行浏览…...

【4.1.-4.20学习周报】

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 摘要Abstract一、方法介绍1.1HippoRAG 1.2HippoRAG2二、实验2.1实验概况2.2实验代码2.3实验结果 总结 摘要 本博客介绍了论文《From RAG to Memory: Non-Parametri…...

MySQL 临时表介绍

在 MySQL 数据库中&#xff0c;临时表是一种特殊类型的表&#xff0c;它在数据库会话期间存在&#xff0c;会话结束时自动删除。临时表为处理特定的、临时性的数据操作任务提供了一种高效且便捷的方式。 一、临时表的创建 使用CREATE TEMPORARY TABLE语句来创建临时表。其语法…...

Rust : 关于*const () 与type erase

*const () 可以替代泛型&#xff0c;更加灵活。下面举了两个完全不一样的数据结构Foo和Bar&#xff1b;以及不同的函数&#xff0c;来说明。 一、 代码 trait Work {fn process(&self); } struct Foo(String);impl Work for Foo {fn process(&self) {println!("p…...

python学习—合并多个word文档

系列文章目录 python学习—合并TXT文本文件 python学习—统计嵌套文件夹内的文件数量并建立索引表格 python学习—查找指定目录下的指定类型文件 python学习—年会不能停&#xff0c;游戏抽签抽奖 python学习—循环语句-控制流 python学习—合并多个Excel工作簿表格文件 pytho…...

Java LinkedList深度解析:双向链表的实现艺术与实战指南

在Java集合框架中,LinkedList以其独特的双向链表结构和灵活的操作特性,成为处理动态数据的重要工具。本文将从底层实现、核心方法、性能优化到企业级应用场景,全方位解析这一经典数据结构的设计哲学与实战技巧。 一、LinkedList的设计定位与核心特性 1. 双向链表的本质 Lin…...

c#内存泄露的原因和解决办法

内存泄漏的原因 不正确的对象引用&#xff1a;最常见的原因是对象不再需要时未被垃圾回收器回收。例如&#xff0c;如果一个对象被一个不再使用的变量引用&#xff0c;它将不会被垃圾回收。事件订阅者未取消&#xff1a;如果订阅了一个事件但没有在对象不再需要时取消订阅&…...

android如何在生产环境中做到详实的日志收集而不影响性能?

在Android应用的生命周期中,日志收集贯穿于开发、测试到生产环境的每一个阶段。特别是在生产环境中,当应用部署到成千上万的用户设备上时,开发者无法直接访问用户的运行环境,也无法像在开发阶段那样通过调试工具实时查看代码执行情况。这时,日志就成为连接开发者与用户设备…...

MySQL安装实战:从零开始搭建你的数据库环境

MySQL作为全球最流行的开源关系型数据库&#xff0c;是开发者、运维人员及数据管理者的核心工具之一。本文将通过多平台安装指南、关键配置解析及常见问题排查三个维度&#xff0c;手把手带你完成MySQL环境搭建。 一、多平台安装指南 1. Linux系统&#xff08;以Ubuntu为例&am…...

[Python] UV工具入门使用指南——小试牛刀

背景 MCP开发使用到了uv&#xff0c;简单记录一下&#xff1a; 为什么MCP更推荐使用uv进行环境管理&#xff1f; MCP 依赖的 Python 环境可能包含多个模块&#xff0c;uv 通过 pyproject.toml 提供更高效的管理方式&#xff0c;并且可以避免 pip 的一些依赖冲突问题。…...

PclSharp ——pcl的c#nuget包

简介&#xff1a; NuGet Gallery | PclSharp 1.8.1.20180820-beta07 下载.NET Framework 4.5.2 Developer Pack&#xff1a; 下载 .NET Framework 4.5.2 Developer Pack Offline Installer 离线安装nupkg&#xff1a; nupkg是visual studio 的NuGet Package的一个包文件 安…...

多任务响应1(Qt)

多任务响应1 1. 架构概述2. 代码示例3. 说明 当系统的一些任务都是同一个对象产生&#xff0c;但需要交由不同对象进行响应。 比如&#xff1a;系统有多个按键&#xff0c;这些按键的共用一个槽函数&#xff0c;但不同的按键对应不同的功能响应。 推荐采用命令模式分散响应的思…...

1. k8s的简介

Kubernetes&#xff08;k8s&#xff09;简介 1. 产生背景 随着云计算和微服务架构的兴起&#xff0c;传统的单体应用逐渐被拆分为多个小型、松耦合的服务&#xff08;微服务&#xff09;。这种架构虽然提升了开发灵活性和可维护性&#xff0c;但也带来了新的挑战&#xff1a;…...

单片机 | 基于51单片机的倾角测量系统设计

以下是一个基于51单片机的倾角测量系统设计详解,包含原理、公式和完整代码: 一、系统原理 核心器件:MPU6050(集成3轴加速度计+陀螺仪) 主控芯片:STC89C52RC(51单片机) 显示模块:LCD1602液晶 工作原理: 通过MPU6050采集XYZ三轴加速度数据,利用重力加速度分量计算俯仰…...

div(HTML标准元素)和view(微信小程序专用组件)的主要区别体

div&#xff08;HTML标准元素&#xff09;和view&#xff08;微信小程序专用组件&#xff09;的主要区别体现在以下方面&#xff1a; 一、应用场景与开发框架 ‌适用平台不同‌ div是HTML/CSS开发中通用的块级元素&#xff0c;用于Web页面布局‌&#xff1b;view是微信小程序专…...

MGR实现mysql高可用性

一。MGR和PXC的区别 1. PXC的消息广播机制是在节点间循环的&#xff0c;需要所有节点都确认消息&#xff0c;因此只要有一个节点故障&#xff0c;则会导致整个PXC都发生故障。而MGR则是多数派投票模式&#xff0c;个别少数派节点故障时&#xff0c;一般不影响整体的可用性。这…...

新型多机器人协作运输系统,轻松应对复杂路面

受到鱼类、鸟类和蚂蚁等微小生物体协作操纵的启发&#xff0c;研究人员开发了多机器人协作运输系统&#xff08;Multirobot Cooperative Transportation Systems&#xff0c;MRCTS&#xff09;运输单个机器人无法处理的重型超大物体&#xff0c;可用于搜救行动、灾难响应、军事…...

汇编获取二进制

文章目录 AT&Tasm Intel AT&T mov_test.s mov $0,%r8dgcc -c mov_test.s 输出 mov_test.o,objdump -D mov_test.o 查看 mov_test.o: mov_test.o: file format elf64-x86-64Disassembly of section .text:0000000000000000 <.text>:0: 41 b8 00 00 00 00 …...

【秣厉科技】LabVIEW工具包——OpenCV 教程(19):拾遗 - imgproc 基础操作(上)

文章目录 前言imgproc 基础操作&#xff08;上&#xff09;1. 颜色空间2. 直方图3. 二值化4. 腐蚀、膨胀、开闭运算5. 梯度与轮廓6. 简易绘图7. 重映射 总结 前言 需要下载安装OpenCV工具包的朋友&#xff0c;请前往 此处 &#xff1b;系统要求&#xff1a;Windows系统&#x…...

学习笔记:金融经济学 第3讲

学习笔记&#xff1a;金融经济学 第3讲 注&#xff1a;A本金&#xff0c;n时间&#xff08;比如年&#xff09;&#xff0c;r利率一、 计算习惯1. 单息&#xff08;新产生的利息不算进本金重新计算利息&#xff0c;收款额A(1nr) &#xff09;2. 复利(新产生的利息算进本金重新计…...

NVIDIA RTX™ GPU 低成本启动零售 AI 场景开发

零售行业正在探索应用 AI 升级客户体验&#xff0c;同时优化内部流程。面对多重应用场景以及成本优化压力&#xff0c;团队可采用成本相对可控的方案&#xff0c;来应对多重场景的前期项目预演和落地&#xff0c;避免短期内大规模投入造成的资源浪费。 客户体验 AI 场景的研究…...

【网络】IP层的重要知识

目录 1.IP层的作用 2.主机和节点 3.网络层和数据链路层的关系 4.路由控制 4.1.路由控制的过程 4.2. IP地址与路由控制 4.3.路由控制表的聚合 4.4.静态路由和动态路由 4.5.动态路由的基础 5.数据链路的抽象化 5.1.数据链路不同&#xff0c;MTU则相异 5.2.路径MTU发…...

数理逻辑(Mathematical Logic)综论与跨学科应用

李升伟 整理 数理逻辑&#xff08;Mathematical Logic&#xff09;是现代逻辑学与数学交叉的核心学科&#xff0c;以严格的数学方法研究逻辑推理的形式与规律。其发展深刻影响了数学基础、计算机科学、语言哲学等领域。以下从多个维度综论数理逻辑&#xff1a; 1. 核心分支 命…...