最新版DeepSeek保姆级安装教程:本地部署+避坑指南
大家好,我是冰河~~
本文旨在提供一个全面且详细的DeepSeek本地部署指南,帮助大家在自己的设备上成功运行DeepSeek模型。无论你是AI领域的初学者还是经验丰富的开发者,都能通过本文的指导,轻松完成DeepSeek的本地部署。
一、本地部署的适用场景
DeepSeek本地部署适合以下场景:
- 高性能硬件配置:如果你的电脑配置较高,特别是拥有独立显卡和足够的存储空间,那么本地部署将能充分利用这些硬件资源。
- 数据安全需求:对于需要处理敏感数据的用户,本地部署可以避免数据上传至云端,确保数据的安全性和隐私性。
- 高频任务处理:对于需要频繁处理大量或复杂任务的用户,本地部署能提供更高的灵活性和响应速度。
- 成本控制:对于日常使用量大、API调用费用较高的用户,本地部署能显著降低运行成本。
- 个性化需求:本地部署允许用户对模型进行二次开发和定制,满足特定的应用场景和需求。
三、环境准备与依赖安装
1. 硬件要求
- 操作系统:推荐Linux(如Ubuntu 20.04及以上版本)或Windows系统。
- Python版本:需要安装Python 3.8及以上版本。
- GPU支持:需要支持CUDA的NVIDIA GPU,推荐显存16GB及以上。
2.硬件配置
| 模型 | 显存需求 | 内存需求 | 推荐显卡 |
|---|---|---|---|
| 7B | 10-12GB | 16GB | RTX 3060 |
| 14B | 20-24GB | 32GB | RTX 3090 |
| 32B | 40-48GB | 64GB | RTX 4090 |
2. 软件依赖
- CUDA与CUDNN:根据NVIDIA GPU型号和驱动版本,安装合适的CUDA(11.2及以上版本)和CUDNN(8.1及以上版本)。
3. 安装步骤
更新系统(Linux为例)
sudo apt-get update
安装必要依赖
sudo apt-get install -y python3-pip python3-dev python3-venv git
创建并激活虚拟环境
python3 -m venv deepseek-env
source deepseek-env/bin/activate
安装PyTorch
根据CUDA版本选择合适的PyTorch安装命令。例如,CUDA 11.2的安装命令如下:
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu112
四、DeepSeek模型下载与部署
1. 克隆DeepSeek代码库
git clone https://github.com/deepseek-ai/deepseek.git
cd deepseek
2. 安装项目依赖
pip install -r requirements.txt
3. 下载并放置预训练模型
从官方提供的链接下载DeepSeek预训练模型权重,并将其放置在models/目录下。
wget [官方链接] -O models/deepseek_model.pth
4. 配置环境变量
设置模型路径和GPU设备号等环境变量
export MODEL_PATH=models/deepseek_model.pth
export CUDA_VISIBLE_DEVICES=0
5. 运行模型
使用以下命令启动DeepSeek模型进行推理或训练。
python run.py --model_path $MODEL_PATH --input "你的输入文本"
五、简化部署方案:使用Ollama
对于初学者或不希望手动配置环境的用户,可以使用Ollama工具简化DeepSeek的本地部署过程。
1.下载安装Ollama
在本地部署DeepSeek会使用到Ollama,所以,需要现在本地下载安装Ollama。
Ollama官方地址:https://ollama.com

小伙伴们可以根据自己的需要下载MacOS、Linux和Windows版本的Ollama,由于冰河目前使用的是Windows系统,所以,这里我下载的是Windows版本的Ollama。
下载后在本地安装Ollama。
2.下载DeepSeek-R1
(1)定位Models
进入Ollama官网,找到Models。

(2)找到DeepSeek-R1模型

(3)选择对应的模型下载
DeepSeek-R1有很多不同的版本可供下载,例如1.5b、7b、8b、14b、32b、70b或671b,版本越高,模型越大,对于电脑的内存、显卡等资源的配置要求就越高。
这里为了方便安装演示,我先给大家演示如何部署8b的模型。后续带着大家在服务上部署更高版本的模型。
进入DeepSeek-R1模型的详情,选择8b模型,如下所示。

(4)打开电脑终端
以管理员身份打开电脑终端,如下所示。

(5)部署8b模型
首先,如下图所示复制8b模型的代码。

随后,将其粘贴到命令行终端,如下所示。

如果出现下图所示的进度,则说明正在下载模型。

等待一段时间,如果出现success字样,则说明部署成功,如下所示。

部署成功后,我们可以试着在命令行发送一条消息给DeepSeek,这里我发送一个“你好”给DeepSeek。

可以看到,向DeepSeek发送你好后,它也回复了一段内容。
至此,我们就可以和DeepSeek在命令行进行对话了。不过,只是在命令行与DeepSeek对话,那就显得有点不怎么方便了,所以,我们继续部署Chatbox。
3.安装Chatbox
通过部署Chatbox,我们可以使用在网页或者客户端与DeepSeek进行交互。Chatbox的安装步骤如下所示**。**
(1)下载安装Chatbox
Chatbox官网:https://chatboxai.app/zh
直接进入官网下载客户端,如下所示。

下载完成后,双击进行安装即可。
(2)配置DeepSeek-R1模型
打开Chatbox,选择设置—>Ollama API,如下所示。

选择已经安装好的DeepSeek-R1 8b模型,进行保存。

等待部署完成,就可以在Chatbox页面中与DeepSeek进行对话了。
六、安装Open-WebUI
1.安装Docker
安装Open-WebUI前,我们可以先安装Docker。进入Docker官网:https://www.docker.com,下载Docker。

下载后安装到自己电脑即可。
2.安装open-webui
如果是在Linux系统下,则可以打开命令行,输入以下命令安装 Open-WebUI。
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
安装完成后,打开浏览器,访问 http://localhost:3000,注册一个账号并登录,即可进入open-webui。
在界面左上角选择对应的模型,即可开始对话。
如果是Windows系统,则在浏览器搜索Open-WebUI,进入官网,并复制下图所示的命令。

随后打开Windows命令行,输入复制的命令后等待安装完成。
安装完成后,打开浏览器,访问 http://localhost:3000,注册一个账号并登录,即可进入open-webui。
七、常见问题解决方案
| 问题现象 | 解决方案 |
|---|---|
| 显存不足报错 | 使用量化模型或换用更小模型 |
| 响应速度慢 | 设置环境变量OLLAMA_NUM_THREADS=8 |
| 生成内容中断 | 输入/continue继续生成 |
| 中文输出夹杂英文 | 在提问末尾添加「请使用纯中文回答」 |
| 历史记忆混乱 | 输入/forget清除上下文 |
好了,今天就到这儿吧,我是冰河,我们下期见~~
相关文章:
最新版DeepSeek保姆级安装教程:本地部署+避坑指南
大家好,我是冰河~~ 本文旨在提供一个全面且详细的DeepSeek本地部署指南,帮助大家在自己的设备上成功运行DeepSeek模型。无论你是AI领域的初学者还是经验丰富的开发者,都能通过本文的指导,轻松完成DeepSeek的本地部署。 一、本地…...
【学习笔记】Cadence电子设计全流程(三)Capture CIS 原理图绘制(1-8)
【学习笔记】Cadence电子设计全流程(三)Capture CIS 原理图绘制(1) 3.1 原理图设计思路3.2 Cadence 原理图的新建3.3 在原理图中添加元器件3.4 元器件对齐3.5 原理图元器件信号联通(走线)3.6 OrCAD Capture…...
3damx 发动机活塞运动动画
使用HD解算器绑定:点(绑定的最终目标对象)→曲柄→活塞(子控父,反向解算) 点:绑定到轮子上的连接点...
JAVA 集成 ElasticSearch
目录 ElasticSearch Client Java REST Client Dependencies Initialization RequestOptions 测试 ElasticSearch Client 9300端口 :TCP协议,性能较高,ES集群内部节点之间通过9300进行通讯。 Java Transport Client (7.x 已废…...
AMBA-CHI协议详解(十九)
文章目录 4.6 Silent cache state transitions4.7 Cache state transitions at a Requester4.7.1 Read request transactions4.7.2 Dataless request transactions4.7.3 Write request transactions4.7.4 Atomic transactions4.7.5 Other request transactions 4.6 Silent cach…...
如何把windows机器作为SSH客户端免密登录
要在Windows机器上配置免密SSH登录,你需要生成一个SSH密钥对,并将公钥添加到你要登录的服务器的~/.ssh/authorized_keys文件中。以下是具体步骤: 在Windows上生成SSH密钥对 打开PowerShell或命令提示符: 你可以通过搜索栏输入“P…...
sklearn中的决策树-分类树:重要参数
分类树 sklearn.tree.DecisionTreeClassifier sklearn.tree.DecisionTreeClassifier (criterion’gini’ # 不纯度计算方法, splitter’best’ # best & random, max_depthNone # 树最大深度, min_samples_split2 # 当前节点可划分最少样本数, min_samples_leaf1 # 子节点最…...
25林业研究生复试面试问题汇总 林业专业知识问题很全! 林业复试全流程攻略 林业考研复试真题汇总
25 林业考研复试,专业面试咋准备?学姐来支招! 宝子们,一提到林业考研复试面试,是不是就慌得不行,感觉老师会扔出一堆超难的问题?别怕别怕,其实林业考研复试就那么些套路,…...
DeepSeek最新开源动态:核心技术公布
2月21日午间,DeepSeek在社交平台X发文称,从下周开始,他们将开源5个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展。并将这一计划定义为“Open Source Week”。 DeepSeek表示,即将开源的代码库是他们在线…...
Electron通过ffi-napi调用dll导出接口
electron使用ffi-napi环境搭建 附打包好的ffi-napi可以直接放到项目目录下使用,避免以后麻烦 一、安装node.js Node.js官网:https://nodejs.org/zh-cn/download,选择LTS长期稳定版本即可 需要注意Node.js 区分32和64位,32位版…...
【排序算法】六大比较类排序算法——插入排序、选择排序、冒泡排序、希尔排序、快速排序、归并排序【详解】
文章目录 六大比较类排序算法(插入排序、选择排序、冒泡排序、希尔排序、快速排序、归并排序)前言1. 插入排序算法描述代码示例算法分析 2. 选择排序算法描述优化代码示例算法分析 3. 冒泡排序算法描述代码示例算法分析与插入排序对比 4. 希尔排序算法描…...
计算机毕业设计Hadoop+Spark+DeepSeek-R1大模型民宿推荐系统 hive民宿可视化 民宿爬虫 大数据毕业设计(源码+LW文档+PPT+讲解)
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…...
【Java学习】抽象类与接口
面向对象系列四 一、抽象方法 二、抽象类 三、意义检查 1.抽象方法的意义 2.意义检查 体现 四、接口 1.级别层次 2.接口变量 3.意义 4.成员 成员变量: 成员方法: 一、抽象方法 没有方法体即没有任何实现的方法是抽象方法,只有在…...
SpringBoot中实现限流和熔断功能
我们将使用Java的ScheduledExecutorService来实现一个简单的令牌桶算法(Token Bucket Algorithm),并结合一个自定义的服务类来处理第三方API调用。 1. 创建限流器 首先,创建一个简单的限流器类: import java.util.concurrent.*;public class SimpleRateLimiter {...
61.旋转链表--字节跳动
你应该比你现在强得多 题目描述 给定单链表,要求返回向右移动K位后的新链表 输入:head [1,2,3,4,5], k 2 输出:[4,5,1,2,3]思路分析 计算链表的长度 计算实际需要移动的步数 找到新的头节点 断开链表并重新连接 完整代码 /*** Defini…...
verilog笔记
Verilog学习笔记(一)入门和基础语法BY电棍233 由于某些不可抗拒的因素和各种的特殊原因,主要是因为我是微电子专业的,我需要去学习一门名为verilog的硬件解释语言,由于我是在某西部地区的神秘大学上学,这所…...
c++中sleep是什么意思(不是Sleep() )
sleep 函数在 C 语言中用于暂停程序执行指定的秒数,语法为 sleep(unsigned int seconds)。当 seconds 为 0 时,函数立即返回,否则函数将使进程暂停指定的秒数,并返回实际暂停的时间。 sleep 函数在 C 中的含义 sleep 函数是 C 标…...
Uniapp 开发中遇到的坑与注意事项:全面指南
文章目录 1. 引言Uniapp 简介开发中的常见问题本文的目标与结构 2. 环境配置与项目初始化环境配置问题解决方案 项目初始化注意事项解决方案 常见错误与解决方案 3. 页面与组件开发页面生命周期注意事项示例代码 组件通信与复用注意事项示例代码 样式与布局问题注意事项示例代码…...
Dify安装教程:Linux系统本地化安装部署Dify详细教程
1. 本地部署 Dify 应用开发平台 环境:Ubuntu(24.10) docker-ce docker compose 安装 克隆 Dify 源代码至本地环境: git clone https://github.com/langgenius/dify.git 启动 Dify: cd dify/docker cp .env.example...
rtsp rtmp 跟 http 区别
SDP 一SDP介绍 1. SDP的核心功能 会话描述:定义会话的名称、创建者、时间范围、连接地址等全局信息。媒体协商:明确媒体流的类型(如音频、视频)、传输协议(如RTP/UDP)、编码格式(如H.264、Op…...
Flutter 鸿蒙应用启动速度优化实战:优先级并行初始化+懒加载,全方位提升启动体验
Flutter 鸿蒙应用启动速度优化实战:优先级并行初始化懒加载,全方位提升启动体验 欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.csdn.net📄 文章摘要 本文为 Flutter for OpenHarmony 跨平台应用开发任务 40 实战…...
终极QMC音频解密方案:qmc-decoder完整技术指南与跨平台实践
终极QMC音频解密方案:qmc-decoder完整技术指南与跨平台实践 【免费下载链接】qmc-decoder Fastest & best convert qmc 2 mp3 | flac tools 项目地址: https://gitcode.com/gh_mirrors/qm/qmc-decoder 在数字音乐管理领域,QQ音乐QMC加密格式长…...
KrkrzExtract:新一代krkrz引擎资源处理工具完全指南
KrkrzExtract:新一代krkrz引擎资源处理工具完全指南 【免费下载链接】KrkrzExtract The next generation of KrkrExtract 项目地址: https://gitcode.com/gh_mirrors/kr/KrkrzExtract KrkrzExtract是一款专为krkrz引擎设计的新一代资源处理工具,支…...
TensorRT加速Stable Diffusion的8位量化实践
1. 项目概述:TensorRT加速Stable Diffusion的8位量化实践在生成式AI领域,扩散模型已成为文本到图像生成任务的金标准。作为该领域的代表作品,Stable Diffusion XL能够根据文字描述生成分辨率高达10241024的高质量图像。但这类模型在推理过程中…...
英文降AI率全指南:亲测6款工具从80%降至安全线,选对工具少走弯路
毕业疯狂赶稿的痛苦,熬过夜敲过键盘的都懂。 好不容易拼凑出一篇英文初稿,读起来却有一股浓浓的AI味,不仅语感生硬,还容易被打回重修。群里每天都有人焦虑地寻找靠谱的英文降ai率工具。 作为去年刚从泥潭里爬出来的学姐…...
构建高性能AI聊天机器人的核心技术与实践
1. 构建终极AI聊天机器人的核心思路在当今人机交互领域,AI聊天机器人已经从简单的问答工具进化为具备复杂对话能力的智能体。一个真正优秀的聊天机器人需要融合自然语言处理、上下文理解、个性化交互三大核心能力。我通过多个企业级对话系统的开发实践,总…...
终极指南:如何用League Director免费制作专业级《英雄联盟》录像
终极指南:如何用League Director免费制作专业级《英雄联盟》录像 【免费下载链接】leaguedirector League Director is a tool for staging and recording videos from League of Legends replays 项目地址: https://gitcode.com/gh_mirrors/le/leaguedirector …...
Win11Debloat:三步完成Windows 11终极系统优化与隐私保护指南
Win11Debloat:三步完成Windows 11终极系统优化与隐私保护指南 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter…...
2026年数据治理出海:当“全球化运营”遭遇“数据治理壁垒”,谁能提供答案?
引言:数据治理,中国企业全球化的“隐形基建”2026年,中国企业“出海”已从可选项变为必选项。从东南亚的数字支付、中东的智慧城市,到拉美的跨境电商、非洲的通信基建,中国企业的足迹遍布全球。然而,随着全…...
Linux RT 调度器的 preempt_count:RT 任务的抢占控制
前言在工业控制、车载自动驾驶、5G 基站基带处理等强实时场景中,Linux RT 调度器的确定性直接决定系统能否在微秒级时限内完成关键任务。preempt_count作为 RT 抢占控制的核心计数器,既保证临界区数据安全不被打断,又严格遵循 “高优先级 RT …...
