当前位置: 首页 > news >正文

‌最新版DeepSeek保姆级安装教程:本地部署+避坑指南

大家好,我是冰河~~

本文旨在提供一个全面且详细的DeepSeek本地部署指南,帮助大家在自己的设备上成功运行DeepSeek模型。无论你是AI领域的初学者还是经验丰富的开发者,都能通过本文的指导,轻松完成DeepSeek的本地部署。

一、本地部署的适用场景

DeepSeek本地部署适合以下场景:

  • 高性能硬件配置‌:如果你的电脑配置较高,特别是拥有独立显卡和足够的存储空间,那么本地部署将能充分利用这些硬件资源。
  • 数据安全需求‌:对于需要处理敏感数据的用户,本地部署可以避免数据上传至云端,确保数据的安全性和隐私性。
  • 高频任务处理‌:对于需要频繁处理大量或复杂任务的用户,本地部署能提供更高的灵活性和响应速度。
  • 成本控制‌:对于日常使用量大、API调用费用较高的用户,本地部署能显著降低运行成本。
  • 个性化需求‌:本地部署允许用户对模型进行二次开发和定制,满足特定的应用场景和需求。

三、环境准备与依赖安装

1. 硬件要求

  • 操作系统‌:推荐Linux(如Ubuntu 20.04及以上版本)或Windows系统。
  • Python版本‌:需要安装Python 3.8及以上版本。
  • GPU支持‌:需要支持CUDA的NVIDIA GPU,推荐显存16GB及以上。

2.硬件配置

模型显存需求内存需求推荐显卡
7B10-12GB16GBRTX 3060
14B20-24GB32GBRTX 3090
32B40-48GB64GBRTX 4090

2. 软件依赖

  • CUDA与CUDNN‌:根据NVIDIA GPU型号和驱动版本,安装合适的CUDA(11.2及以上版本)和CUDNN(8.1及以上版本)。

3. 安装步骤

更新系统(Linux为例)
sudo apt-get update
安装必要依赖
sudo apt-get install -y python3-pip python3-dev python3-venv git
创建并激活虚拟环境
python3 -m venv deepseek-env
source deepseek-env/bin/activate
安装PyTorch

根据CUDA版本选择合适的PyTorch安装命令。例如,CUDA 11.2的安装命令如下:

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu112

四、DeepSeek模型下载与部署

1. 克隆DeepSeek代码库

git clone https://github.com/deepseek-ai/deepseek.git
cd deepseek

2. 安装项目依赖

pip install -r requirements.txt

3. 下载并放置预训练模型

从官方提供的链接下载DeepSeek预训练模型权重,并将其放置在models/目录下。

wget [官方链接] -O models/deepseek_model.pth

4. 配置环境变量

设置模型路径和GPU设备号等环境变量

export MODEL_PATH=models/deepseek_model.pth
export CUDA_VISIBLE_DEVICES=0

5. 运行模型

使用以下命令启动DeepSeek模型进行推理或训练。

python run.py --model_path $MODEL_PATH --input "你的输入文本"

五、简化部署方案:使用Ollama

对于初学者或不希望手动配置环境的用户,可以使用Ollama工具简化DeepSeek的本地部署过程。

1.下载安装Ollama

在本地部署DeepSeek会使用到Ollama,所以,需要现在本地下载安装Ollama。

Ollama官方地址:https://ollama.com

小伙伴们可以根据自己的需要下载MacOS、Linux和Windows版本的Ollama,由于冰河目前使用的是Windows系统,所以,这里我下载的是Windows版本的Ollama。

下载后在本地安装Ollama。

2.下载DeepSeek-R1

(1)定位Models

进入Ollama官网,找到Models。

(2)找到DeepSeek-R1模型

(3)选择对应的模型下载

DeepSeek-R1有很多不同的版本可供下载,例如1.5b、7b、8b、14b、32b、70b或671b,版本越高,模型越大,对于电脑的内存、显卡等资源的配置要求就越高。

这里为了方便安装演示,我先给大家演示如何部署8b的模型。后续带着大家在服务上部署更高版本的模型。

进入DeepSeek-R1模型的详情,选择8b模型,如下所示。

(4)打开电脑终端

以管理员身份打开电脑终端,如下所示。

(5)部署8b模型

首先,如下图所示复制8b模型的代码。

随后,将其粘贴到命令行终端,如下所示。

如果出现下图所示的进度,则说明正在下载模型。

等待一段时间,如果出现success字样,则说明部署成功,如下所示。

部署成功后,我们可以试着在命令行发送一条消息给DeepSeek,这里我发送一个“你好”给DeepSeek。

可以看到,向DeepSeek发送你好后,它也回复了一段内容。

至此,我们就可以和DeepSeek在命令行进行对话了。不过,只是在命令行与DeepSeek对话,那就显得有点不怎么方便了,所以,我们继续部署Chatbox。

3.安装Chatbox

通过部署Chatbox,我们可以使用在网页或者客户端与DeepSeek进行交互。Chatbox的安装步骤如下所示**。**

(1)下载安装Chatbox

Chatbox官网:https://chatboxai.app/zh

直接进入官网下载客户端,如下所示。

下载完成后,双击进行安装即可。

(2)配置DeepSeek-R1模型

打开Chatbox,选择设置—>Ollama API,如下所示。

选择已经安装好的DeepSeek-R1 8b模型,进行保存。

等待部署完成,就可以在Chatbox页面中与DeepSeek进行对话了。

六、安装Open-WebUI

1.安装Docker

安装Open-WebUI前,我们可以先安装Docker。进入Docker官网:https://www.docker.com,下载Docker。

在这里插入图片描述

下载后安装到自己电脑即可。

2.安装open-webui

如果是在Linux系统下,则可以打开命令行,输入以下命令安装 Open-WebUI。

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

安装完成后,打开浏览器,访问 http://localhost:3000,注册一个账号并登录,即可进入open-webui。

在界面左上角选择对应的模型,即可开始对话。

如果是Windows系统,则在浏览器搜索Open-WebUI,进入官网,并复制下图所示的命令。

在这里插入图片描述

随后打开Windows命令行,输入复制的命令后等待安装完成。

安装完成后,打开浏览器,访问 http://localhost:3000,注册一个账号并登录,即可进入open-webui。

七、常见问题解决方案

问题现象解决方案
显存不足报错使用量化模型或换用更小模型
响应速度慢设置环境变量OLLAMA_NUM_THREADS=8
生成内容中断输入/continue继续生成
中文输出夹杂英文在提问末尾添加「请使用纯中文回答」
历史记忆混乱输入/forget清除上下文

好了,今天就到这儿吧,我是冰河,我们下期见~~

相关文章:

‌最新版DeepSeek保姆级安装教程:本地部署+避坑指南

大家好,我是冰河~~ 本文旨在提供一个全面且详细的DeepSeek本地部署指南,帮助大家在自己的设备上成功运行DeepSeek模型。无论你是AI领域的初学者还是经验丰富的开发者,都能通过本文的指导,轻松完成DeepSeek的本地部署。 一、本地…...

【学习笔记】Cadence电子设计全流程(三)Capture CIS 原理图绘制(1-8)

【学习笔记】Cadence电子设计全流程(三)Capture CIS 原理图绘制(1) 3.1 原理图设计思路3.2 Cadence 原理图的新建3.3 在原理图中添加元器件3.4 元器件对齐3.5 原理图元器件信号联通(走线)3.6 OrCAD Capture…...

3damx 发动机活塞运动动画

使用HD解算器绑定:点(绑定的最终目标对象)→曲柄→活塞(子控父,反向解算) 点:绑定到轮子上的连接点...

JAVA 集成 ElasticSearch

目录 ElasticSearch Client Java REST Client Dependencies Initialization RequestOptions 测试 ElasticSearch Client 9300端口 :TCP协议,性能较高,ES集群内部节点之间通过9300进行通讯。 Java Transport Client (7.x 已废…...

AMBA-CHI协议详解(十九)

文章目录 4.6 Silent cache state transitions4.7 Cache state transitions at a Requester4.7.1 Read request transactions4.7.2 Dataless request transactions4.7.3 Write request transactions4.7.4 Atomic transactions4.7.5 Other request transactions 4.6 Silent cach…...

如何把windows机器作为SSH客户端免密登录

要在Windows机器上配置免密SSH登录,你需要生成一个SSH密钥对,并将公钥添加到你要登录的服务器的~/.ssh/authorized_keys文件中。以下是具体步骤: 在Windows上生成SSH密钥对 打开PowerShell或命令提示符: 你可以通过搜索栏输入“P…...

sklearn中的决策树-分类树:重要参数

分类树 sklearn.tree.DecisionTreeClassifier sklearn.tree.DecisionTreeClassifier (criterion’gini’ # 不纯度计算方法, splitter’best’ # best & random, max_depthNone # 树最大深度, min_samples_split2 # 当前节点可划分最少样本数, min_samples_leaf1 # 子节点最…...

25林业研究生复试面试问题汇总 林业专业知识问题很全! 林业复试全流程攻略 林业考研复试真题汇总

25 林业考研复试,专业面试咋准备?学姐来支招! 宝子们,一提到林业考研复试面试,是不是就慌得不行,感觉老师会扔出一堆超难的问题?别怕别怕,其实林业考研复试就那么些套路,…...

DeepSeek最新开源动态:核心技术公布

2月21日午间,DeepSeek在社交平台X发文称,从下周开始,他们将开源5个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展。并将这一计划定义为“Open Source Week”。 DeepSeek表示,即将开源的代码库是他们在线…...

Electron通过ffi-napi调用dll导出接口

electron使用ffi-napi环境搭建 附打包好的ffi-napi可以直接放到项目目录下使用,避免以后麻烦 一、安装node.js Node.js官网:https://nodejs.org/zh-cn/download,选择LTS长期稳定版本即可 需要注意Node.js 区分32和64位,32位版…...

【排序算法】六大比较类排序算法——插入排序、选择排序、冒泡排序、希尔排序、快速排序、归并排序【详解】

文章目录 六大比较类排序算法(插入排序、选择排序、冒泡排序、希尔排序、快速排序、归并排序)前言1. 插入排序算法描述代码示例算法分析 2. 选择排序算法描述优化代码示例算法分析 3. 冒泡排序算法描述代码示例算法分析与插入排序对比 4. 希尔排序算法描…...

计算机毕业设计Hadoop+Spark+DeepSeek-R1大模型民宿推荐系统 hive民宿可视化 民宿爬虫 大数据毕业设计(源码+LW文档+PPT+讲解)

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…...

【Java学习】抽象类与接口

面向对象系列四 一、抽象方法 二、抽象类 三、意义检查 1.抽象方法的意义 2.意义检查 体现 四、接口 1.级别层次 2.接口变量 3.意义 4.成员 成员变量: 成员方法: 一、抽象方法 没有方法体即没有任何实现的方法是抽象方法,只有在…...

SpringBoot中实现限流和熔断功能

我们将使用Java的ScheduledExecutorService来实现一个简单的令牌桶算法(Token Bucket Algorithm),并结合一个自定义的服务类来处理第三方API调用。 1. 创建限流器 首先,创建一个简单的限流器类: import java.util.concurrent.*;public class SimpleRateLimiter {...

61.旋转链表--字节跳动

你应该比你现在强得多 题目描述 给定单链表,要求返回向右移动K位后的新链表 输入:head [1,2,3,4,5], k 2 输出:[4,5,1,2,3]思路分析 计算链表的长度 计算实际需要移动的步数 找到新的头节点 断开链表并重新连接 完整代码 /*** Defini…...

verilog笔记

Verilog学习笔记(一)入门和基础语法BY电棍233 由于某些不可抗拒的因素和各种的特殊原因,主要是因为我是微电子专业的,我需要去学习一门名为verilog的硬件解释语言,由于我是在某西部地区的神秘大学上学,这所…...

c++中sleep是什么意思(不是Sleep() )

sleep 函数在 C 语言中用于暂停程序执行指定的秒数,语法为 sleep(unsigned int seconds)。当 seconds 为 0 时,函数立即返回,否则函数将使进程暂停指定的秒数,并返回实际暂停的时间。 sleep 函数在 C 中的含义 sleep 函数是 C 标…...

Uniapp 开发中遇到的坑与注意事项:全面指南

文章目录 1. 引言Uniapp 简介开发中的常见问题本文的目标与结构 2. 环境配置与项目初始化环境配置问题解决方案 项目初始化注意事项解决方案 常见错误与解决方案 3. 页面与组件开发页面生命周期注意事项示例代码 组件通信与复用注意事项示例代码 样式与布局问题注意事项示例代码…...

Dify安装教程:Linux系统本地化安装部署Dify详细教程

1. 本地部署 Dify 应用开发平台 环境:Ubuntu(24.10) docker-ce docker compose 安装 克隆 Dify 源代码至本地环境: git clone https://github.com/langgenius/dify.git 启动 Dify: cd dify/docker cp .env.example...

rtsp rtmp 跟 http 区别

SDP 一SDP介绍 1. SDP的核心功能 会话描述:定义会话的名称、创建者、时间范围、连接地址等全局信息。媒体协商:明确媒体流的类型(如音频、视频)、传输协议(如RTP/UDP)、编码格式(如H.264、Op…...

Qianfan-OCR实战落地:HR部门简历自动解析+技能标签提取系统

Qianfan-OCR实战落地:HR部门简历自动解析技能标签提取系统 1. 项目背景与价值 在人力资源管理中,简历筛选是耗时且重复性高的工作。传统方式需要HR人工阅读每份简历,提取关键信息并分类归档,效率低下且容易出错。Qianfan-OCR作为…...

GraalVM Native Image内存暴涨?3步精准定位堆外泄漏+4个编译期调优参数,上线前必做!

第一章:GraalVM Native Image内存暴涨的典型现象与认知误区当开发者首次将 Spring Boot 应用通过 native-image 构建为原生镜像后,常在运行时观察到 RSS(Resident Set Size)远超预期——例如一个仅含 WebMvc 的轻量服务&#xff0…...

Raspberry Pi RP2350 A4步进版本解析与安全增强

1. Raspberry Pi RP2350 A4步进版本深度解析作为一名长期跟踪Raspberry Pi硬件发展的嵌入式开发者,我最近详细研究了RP2350微控制器的A4步进版本更新。这次迭代不仅修复了关键硬件缺陷,还引入了多项安全增强特性,对于嵌入式系统开发者而言意义…...

LosslessCut:3个核心功能重塑你的视频剪辑工作流

LosslessCut:3个核心功能重塑你的视频剪辑工作流 【免费下载链接】lossless-cut The swiss army knife of lossless video/audio editing 项目地址: https://gitcode.com/gh_mirrors/lo/lossless-cut 还在为视频剪辑的繁琐流程和画质损失而烦恼吗&#xff1f…...

UEFI电源管理探秘:从S3睡眠到唤醒的完整旅程

1. 电源管理基础:SX与GX状态解析 现代计算机的电源管理远比我们想象的复杂。想象一下你的笔记本电脑合上盖子时发生了什么——屏幕熄灭、风扇停转,但内存中的数据依然保持。这就是S3睡眠状态的典型应用场景。电源管理状态主要分为SX(Sleep St…...

Edge浏览器油猴插件安装与脚本管理保姆级教程(含离线备份与迁移指南)

Edge浏览器油猴插件全场景管理指南:从安装到跨设备无缝迁移 油猴插件(Tampermonkey)作为浏览器脚本管理的瑞士军刀,早已成为效率工具爱好者的标配。但大多数教程止步于基础安装,对于多设备同步、离线环境部署、脚本批…...

ROS开发效率翻倍:告别屏幕切换,用SSH+VSCode远程连接ROS小车并调试Rviz

ROS开发效率革命:VSCodeSSH全链路远程调试实战 想象一下这样的场景:你正在调试一台ROS移动机器人,左手是SSH终端窗口,右手是本地IDE编辑器,中间还要不断切换Rviz可视化界面——这种碎片化的工作流是否让你效率低下&…...

Scroll Reverser:终极指南!解决macOS多设备滚动方向混乱的免费神器

Scroll Reverser:终极指南!解决macOS多设备滚动方向混乱的免费神器 【免费下载链接】Scroll-Reverser Per-device scrolling prefs on macOS. 项目地址: https://gitcode.com/gh_mirrors/sc/Scroll-Reverser 你是否在Mac上同时使用触控板和鼠标时…...

模型持久化本身不会提升准确率:揭秘训练集复用导致的“虚假精度”陷阱

模型持久化(如使用 joblib 保存 decisiontreeclassifier)仅用于部署和复用,不改变模型性能;所谓“准确率从57%升至92%”实为误用——第三次运行时用训练数据直接预测,导致严重过拟合评估,结果完全不可信。 …...

如何实现SQL日期加减运算_利用DATE_ADD函数处理周期

...