当前位置: 首页 > news >正文

DeepSeek模型快速部署教程-搭建自己的DeepSeek

前言:在人工智能技术飞速发展的今天,深度学习模型已成为推动各行各业智能化转型的核心驱动力。DeepSeek 作为一款领先的 AI 模型,凭借其高效的性能和灵活的部署方式,受到了广泛关注。无论是自然语言处理、图像识别,还是智能推荐系统,DeepSeek 都能提供强大的支持。本文将详细介绍 DeepSeek 的特点,并分享两种常见的部署方式:容器云部署和极速部署,帮助用户快速上手并高效利用这一先进技术。无论是技术开发者还是普通用户,都能通过这些方法快速上手并高效利用 DeepSeek 的强大能力。

目录

1.DeepSeek介绍

2.部署方式一:容器云部署DeepSeek 

2.1 容器云配置

2.2 终端连接

2.3 模型配置

3.部署方式二:极速部署DeepSeek 


1.DeepSeek介绍

DeepSeek 是由深度求索(DeepSeek)公司开发的一款高性能人工智能模型,专注于自然语言处理(NLP)、多模态任务以及通用人工智能(AGI)领域。作为一款领先的 AI 模型,DeepSeek 凭借其高效的性能、灵活的部署方式和广泛的应用场景,成为企业和开发者实现智能化转型的重要工具。

DeepSeek 的核心特点

  • 高性能与高效能

    DeepSeek 模型经过深度优化,能够在较低的计算资源下实现高效的推理和训练。无论是处理大规模数据集还是实时推理任务,DeepSeek 都能提供卓越的性能表现。

  • 多模型支持

    DeepSeek 提供了多种模型版本,以满足不同场景的需求。例如:

    • DeepSeek-R1:适用于轻量级任务,适合资源有限的环境。

    • DeepSeek-V3:支持更复杂的任务,具备更强的泛化能力。

    • DeepSeek-MultiModal:支持多模态任务,能够同时处理文本、图像和音频数据。

  • 灵活部署

    DeepSeek 支持多种部署方式,包括容器化部署、极速部署以及本地部署。用户可以根据自身需求选择最适合的方式,快速上手并高效利用模型。

  • 开源生态与工具集成

    DeepSeek 与 Ollama 等轻量级框架深度集成,方便开发者快速部署和扩展。同时,DeepSeek 还提供了丰富的 API 和开发工具,支持与其他系统的无缝对接。

  • 广泛的应用场景

    DeepSeek 适用于多种应用场景,包括但不限于:

    • 自然语言处理:文本生成、情感分析、机器翻译、问答系统等。

    • 多模态任务:图像描述生成、视频内容分析、跨模态检索等。

    • 智能推荐:个性化推荐、广告投放优化等。

    • 科研与教育:辅助科研数据分析、智能教学系统等。

DeepSeek 的技术优势

  • 先进的模型架构

    DeepSeek 基于 Transformer 架构,并结合了最新的深度学习技术,如自注意力机制、稀疏注意力机制等,使其在处理长文本和复杂任务时表现尤为出色。

  • 高效的训练与推理

    DeepSeek 采用了混合精度训练和分布式训练技术,大幅提升了训练效率。同时,模型经过量化优化,能够在推理阶段显著降低计算资源消耗。

  • 多语言支持

    DeepSeek 支持多种语言的处理,包括中文、英文、西班牙语、法语等,能够满足全球化业务的需求。


接下来介绍部署DeepSeek模型,介绍两种常见的部署方式:容器云部署和极速部署

2.部署方式一:容器云部署DeepSeek 

2.1 容器云配置

首先登录蓝耘元生代智算云平台

https://cloud.lanyun.net/#/registerPage?promoterCode=11f606c51e

选择容器云中的去新购 

然后选择合适的GPU ,有RTX4090、RTX4090 6152、RTX3090、RTX3090E5、RTX3090E582、RTX3090C6514、RTX3080等多种类型GPU可供选择。以及多样的CPU及内存和硬盘等类型可选择。

挑选后,点击如下红框处

 然后进行配置公共镜像

如下这里选择的是Miniconda框架-conda3-python版本3.12(ubuntu22.04)-cuda版本12.3

然后点击右下角确定,之后会自动跳转到容器实例页面并进行创建

可以看到刚刚选择的容器实例已运行

2.2 终端连接

接下来使用终端连接

需要下载两个软件:Xshell、Xftp(网上下载教程很多,自行下载)

如下为我使用的版本信息

 

安装完成以上两个软件后,打开Xshell软件,点击如下新建会话,或点击文件新建会话

进入如下界面

 复制服务器的如下SSH登录指令,SSH和密码,后续会使用

例如我的SSH如下

ssh -p 43xxx root@qhdlink.lanyun.net

用户名为root

协议为SSH

主机为qhdlink.lanyun.net

端口号为43xxx

然后将SSH入刚刚在Xshell的新建会话,点击连接

选择为接受并保存,或一次性接受

然后输入用户名为root ,点击确定

 然后粘贴刚刚复制的SSH登录指令的密码,点击确定

如下所示,成功连接上服务器(容器实例),我们会看到我们刚刚租用的实例的一些基本情况  

2.3 模型配置

接下来在这个Xshell界面输入代码进行模型配置

首先进行安装Ollama,Ollama 是一个轻量级AI模型运行框架,支持多个开源模型,我们将用它来运行DeepSeek。

在终端中执行如下指令开启加速:

source /etc/network_turbo

 执行如下命令来安装 Ollama:


curl -fsSL https://ollama.com/install.sh | sh

安装完成后启动 Ollama:


# 在后台运行
nohup ollama start >> ollama.log 2>&1 &# 查看实时日志
tail -f ollama.log

接下来就可安装运行DeepSeek-R1了

ollama run deepseek-r1:1.5b

至此,我们已经成功在蓝耘容器平台上部署了一个DeepSeek-R1:1.5B模型了

耘元生代容器平台支持快速部署DeepSeek多款领先AI模型,只需通过修改Ollama指令即可完成其他DeepSeek模型部署,其余步骤不变。比如要运行一个DeepSeek-V3,执行如下命令即可:

ollama run deepseek-v3

注意:不用时,记得关机容器实例(按小时计费的,可节省成本) 

3.部署方式二:极速部署DeepSeek 

我们也可以直接从应用市场进行部署

点击蓝耘平台的应用市场,可以根据自己的使用场景灵活选择

点击部署即可选择GPU型号进行部署 

自动跳转到如下工作空间后等待创建成功 

然后点击快速应用即可 

随后会跳转到Deepseek登录界面 ,此时需要电子邮箱和密码

 我们返回应用市场,点击查看详情

复制粘贴默认账号密码即可 

【默认账号:lanyunuser@lanyun.net 密码:lanyunuser】

点击登录 即可

 登录成功如下界面

 此外还支持多种DeepSeek模型的切换和微调

相关文章:

DeepSeek模型快速部署教程-搭建自己的DeepSeek

前言:在人工智能技术飞速发展的今天,深度学习模型已成为推动各行各业智能化转型的核心驱动力。DeepSeek 作为一款领先的 AI 模型,凭借其高效的性能和灵活的部署方式,受到了广泛关注。无论是自然语言处理、图像识别,还是…...

Swift CChar元祖转String

iOS有些API是调用C函数,Swift端获得的数据是CChar元祖,需要转成String方便使用,下面的代码以获取手机型号为例 方式一 var systemInfo utsname() uname(&systemInfo) let deviceModel withUnsafePointer(to: systemInfo.machine) { …...

【刷题】leetcode

题目 现有 s e r v e r N u m 台服务器,编号依次为 1 − s e r v e r...

WPF创建自定义类和控件及打包成dll引用

WPF创建自定义类和控件及打包成dll引用 一、前言二、创建自定义类和控件并生成dll文件2.1创建类库项目2.2创建自定义类和控件2.3生成dll文件 三、在其他项目中引用3.1添加dll文件引用3.2cs文件中引用命名空间3.3XAML文件中引用命名空间 一、前言 出于一些代码复用的需求&#…...

Zookeeper(54)如何使用Zookeeper的命令行工具?

使用 Zookeeper 的命令行工具可以方便地进行各种操作,如管理节点、查看状态、设置配置信息等。以下是详细的步骤和代码示例,涵盖如何使用 Zookeeper 的命令行工具。 1. 安装和配置 Zookeeper 首先确保已经安装并配置好 Zookeeper。可以在 Zookeeper 的…...

一周学会Flask3 Python Web开发-http响应状态码

锋哥原创的Flask3 Python Web开发 Flask3视频教程: 2025版 Flask3 Python web开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili 在Flask程序中,客户端发出的请求触发相应的视图函数,获取返回值会作为响应的主体,最后生成…...

【数据挖掘】

数据挖掘 目录:1. 数据转换2. 属性选择3. 独立于方案的选择4. 探索空间5. 具体方案的选择6. 离散化数值属性无监督离散化基于熵的离散化其他离散化方法 k-means算法原理算法步骤优缺点优点缺点 代码示例(使用Python和scikit-learn库)代码解释…...

位操作符 练习

一、异或(^) 参与运算的两个值,如果两个相应bit位相同,则结果为0,否则为1。 即: 0^0 0,1^0 1, 0^1 1,1^1 0 按位异或的3个特点: (1) 0异…...

解决Python升级导致PySpark任务异常方案

背景 上一篇文章中写了 Linux 多Python版本统一和 PySpark 依赖 python 包方案,但是最近升级 Linux 服务器 上 Python 版本(3.6.8 -> 3.7.16,手动编译Python官方的二进制源码)之后,发现之前文章提到 python3 -m v…...

Linux中线程创建,线程退出,线程接合

线程的简单了解 之前我们了解过 task_struct 是用于描述进程的核心数据结构。它包含了一个进程的所有重要信息,并且在进程的生命周期内保持更新。我们想要获取进程相关信息往往从这里得到。 在Linux中,线程的实现方式与进程类似,每个线程都…...

机器视觉检测中,2D面阵相机和线扫相机的区别

2D面阵相机和线扫相机是工业视觉系统中常用的两种相机类型,各有其特点和应用场景。 2D面阵相机 特点: 成像方式:通过二维传感器一次性捕捉整个场景的图像。 分辨率:分辨率由传感器的像素数决定,常见的有百万像素到几千…...

LeetCode 热题 100_N 皇后 (62_51_困难_C++)(递归(回溯))

LeetCode 热题 100_N 皇后(62_51) 题目描述:输入输出样例:题解:解题思路:思路一(递归(回溯)): 代码实现代码实现(思路一(递…...

Winform(C#) 项目保存页面

上一张我们已经实现了TCP和串口页面的数据展示,和保存控件 我们这一章,实现如何去,控制保存。 一、控件展示 CheckBox TextBox Button label Name: checkSaveImage checkDelete txtSaveDays txtSaveImagePath btnSelectIm…...

【LeetCode: LCR 126. 斐波那契数 + 动态规划】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…...

OSPF(开放路径最短优先)

ospf优先级&#xff1a;内部优先级默认为10&#xff0c;外部优先级默认为150 1.ospf的三张表 &#xff08;1&#xff09;邻居表 <记录邻居状态和关系> &#xff08;2&#xff09;拓扑表 <链路状态数据库> &#xff08;3&#xff09;路由表 <对链路状态数据库进…...

JAVA EE初阶 - 预备知识(四)

一、API API 即应用程序编程接口&#xff08;Application Programming Interface&#xff09;&#xff0c;是一组定义、协议和工具&#xff0c;用于不同软件组件、应用程序或系统之间进行交互和通信。以下从多个方面详细介绍 API&#xff1a; 基本概念 接口规范&#xff1a;A…...

如何解决服务器端口被攻击:全面防护与快速响应

服务器端口被攻击是网络安全中常见的问题之一&#xff0c;尤其是当服务器暴露在公共网络上时&#xff0c;容易成为黑客的目标。攻击者可能通过扫描开放端口、利用漏洞或发动拒绝服务&#xff08;DoS/DDoS&#xff09;攻击来破坏服务器的正常运行。本文将详细介绍如何检测、防御…...

golang panic原理

数据结构与底层实现 Goroutine结构体 stack&#xff08;栈内存范围&#xff09; 结构体类型&#xff0c;包含 lo&#xff08;低地址&#xff09;和 hi&#xff08;高地址&#xff09;两个 uintptr 字段&#xff0c;描述 Goroutine 的栈内存区间 [lo, hi)。初始栈大小为 2KB&a…...

scratch猜年龄互动小游戏 2024年12月scratch四级真题 中国电子学会 图形化编程 scratch四级真题和答案解析

scratch猜年龄互动小游戏 2024年12月电子学会图形化编程Scratch等级考试四级真题 一、题目要求 老爷爷的年龄是1-100的随机数,老爷爷询问“请猜猜我的年龄是多少?”,输入年龄,老爷爷会回答"大了"或者"小了,直到最后成功猜出年龄。 1、准备工作 (1)删…...

【Elasticsearch】查询规则_query_rules

1.Query Rules 的定义与作用 Query Rules 是 Elasticsearch 提供的一种功能&#xff0c;允许用户根据预定义的规则动态调整搜索结果。它通过匹配查询的元数据&#xff08;如用户输入、地理位置、用户兴趣等&#xff09;&#xff0c;对搜索结果进行定制化调整&#xff0c;例如固…...

Docker 离线安装指南

参考文章 1、确认操作系统类型及内核版本 Docker依赖于Linux内核的一些特性&#xff0c;不同版本的Docker对内核版本有不同要求。例如&#xff0c;Docker 17.06及之后的版本通常需要Linux内核3.10及以上版本&#xff0c;Docker17.09及更高版本对应Linux内核4.9.x及更高版本。…...

FFmpeg 低延迟同屏方案

引言 在实时互动需求激增的当下&#xff0c;无论是在线教育中的师生同屏演示、远程办公的屏幕共享协作&#xff0c;还是游戏直播的画面实时传输&#xff0c;低延迟同屏已成为保障用户体验的核心指标。FFmpeg 作为一款功能强大的多媒体框架&#xff0c;凭借其灵活的编解码、数据…...

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院查看报告小程序

一、开发环境准备 ​​工具安装​​&#xff1a; 下载安装DevEco Studio 4.0&#xff08;支持HarmonyOS 5&#xff09;配置HarmonyOS SDK 5.0确保Node.js版本≥14 ​​项目初始化​​&#xff1a; ohpm init harmony/hospital-report-app 二、核心功能模块实现 1. 报告列表…...

论文解读:交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架(一)

宇树机器人多姿态起立控制强化学习框架论文解析 论文解读&#xff1a;交大&港大&上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架&#xff08;一&#xff09; 论文解读&#xff1a;交大&港大&上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化…...

UR 协作机器人「三剑客」:精密轻量担当(UR7e)、全能协作主力(UR12e)、重型任务专家(UR15)

UR协作机器人正以其卓越性能在现代制造业自动化中扮演重要角色。UR7e、UR12e和UR15通过创新技术和精准设计满足了不同行业的多样化需求。其中&#xff0c;UR15以其速度、精度及人工智能准备能力成为自动化领域的重要突破。UR7e和UR12e则在负载规格和市场定位上不断优化&#xf…...

浅谈不同二分算法的查找情况

二分算法原理比较简单&#xff0c;但是实际的算法模板却有很多&#xff0c;这一切都源于二分查找问题中的复杂情况和二分算法的边界处理&#xff0c;以下是博主对一些二分算法查找的情况分析。 需要说明的是&#xff0c;以下二分算法都是基于有序序列为升序有序的情况&#xf…...

大语言模型(LLM)中的KV缓存压缩与动态稀疏注意力机制设计

随着大语言模型&#xff08;LLM&#xff09;参数规模的增长&#xff0c;推理阶段的内存占用和计算复杂度成为核心挑战。传统注意力机制的计算复杂度随序列长度呈二次方增长&#xff0c;而KV缓存的内存消耗可能高达数十GB&#xff08;例如Llama2-7B处理100K token时需50GB内存&a…...

【分享】推荐一些办公小工具

1、PDF 在线转换 https://smallpdf.com/cn/pdf-tools 推荐理由&#xff1a;大部分的转换软件需要收费&#xff0c;要么功能不齐全&#xff0c;而开会员又用不了几次浪费钱&#xff0c;借用别人的又不安全。 这个网站它不需要登录或下载安装。而且提供的免费功能就能满足日常…...

Ubuntu Cursor升级成v1.0

0. 当前版本低 使用当前 Cursor v0.50时 GitHub Copilot Chat 打不开&#xff0c;快捷键也不好用&#xff0c;当看到 Cursor 升级后&#xff0c;还是蛮高兴的 1. 下载 Cursor 下载地址&#xff1a;https://www.cursor.com/cn/downloads 点击下载 Linux (x64) &#xff0c;…...

从物理机到云原生:全面解析计算虚拟化技术的演进与应用

前言&#xff1a;我的虚拟化技术探索之旅 我最早接触"虚拟机"的概念是从Java开始的——JVM&#xff08;Java Virtual Machine&#xff09;让"一次编写&#xff0c;到处运行"成为可能。这个软件层面的虚拟化让我着迷&#xff0c;但直到后来接触VMware和Doc…...