当前位置：首页 > news >正文

DeepSeek R1本地部署教程

news 2026/2/9 14:48:33

尽管许多卖课博主声称能轻松运行满血版DeepSeek R1，但满血版R1模型参数高达671B，仅模型文件就需要404GB存储空间，运行时更需要约1300GB显存。

对于没有卡的普通玩家来说，运行的条件苛刻，且门槛极高。基于此，我们不妨将目光转向DeepSeek R1四款分别对应Qwen和Llama的蒸馏小模型：

DeepSeek-R1-Distill-Llama-8B
DeepSeek-R1-Distill-Qwen-14B
DeepSeek-R1-Distill-Qwen-32B
DeepSeek-R1-Distill-Llama-70B

海外博主已经整理出相关配置供大家参考，注意，只要GPU等于或超过VRAM要求，模型仍然可以在规格较低的GPU上运行。但是设置不是最佳的，并且可能需要进行一些调整。

DeepSeek-R1 671B: Complete Hardware Requirements - DEV Community

本地部署R1小模型，两种方法，一学就会

我们这次手上体验的设备正是M1 Ultra 128GB内存的Mac Studio。关于主流本地部署DeepSeek的教程，两种方法，一学就会。

LM Studio

首先登场的是小白极简版本，在官网（lmstudio.ai）根据个人电脑型号下载LM Studio，接着为了方便使用，建议点击右下角修改语言为简体中文。

然后搜索deepseek-r1选择合适的版本下载，作为示例，我选择使用阿里Qwen模型为基座蒸馏出来的7B小模型。

配置完成后，即可一键启动。

使用LM Studio的好处就是不用代码、界面友好，但跑大型模型的时候对性能要求高，因此更适合新手入门使用基础功能。

Ollama

当然，对于追求更深层次体验的用户，我们也准备了进阶方案。

首先从官网（ollama.com）获取并安装Ollama。

启动后打开命令行工具。Mac用户键盘Command+空格打开“终端”工具，Windows用户键盘运行Win+R，输入cmd打开“命令提示符”工具。

在窗口中输入代码指令（ollama run deepseek-r1:7b）即可开始下载。请注意英文状态输入，检查空格和横杠，冒号后输入所需要的版本名称。

配置完成后就能在命令行窗口开始对话。

这个方法对性能要求很低，但需要熟悉命令行操作，模型的兼容性也有限，更适合进阶开发者实现高级操作。

如果你想要比较好看的交互界面，不妨在Chrome浏览器安装插件，搜索安装PageAssist。

选择本地已安装的模型，开始使用。

右上角设置里修改好语言，主页选择模型就可以开始对话，而且支持基础的联网搜索，玩法也更多样。

能跑是能跑，但……

我们这次体验则用到了LM Studio。

凭借其出色的优化能力，LM Studio使得模型能够在消费级硬件上高效运行。比如LM Studio支持GPU卸载技术，可以将模型分块加载到GPU中，从而在显存有限的情况下实现加速。

如同调教赛车，每个参数都会影响最终的表现，在体验之前，建议在LM Studio的设置中，根据需求调整推理参数的能力，以优化模型的生成质量和计算资源分配。

温度（Temperature）：控制生成文本的随机性。

上下文溢出处理（Context Overflow Handling）：决定如何处理超长输入。

CPU线程：影响生成速度和资源占用。

采样策略：通过多种采样方法和惩罚机制，确保生成文本的合理性和多样性。

DeepSeek研究员Daya Guo在X平台分享了他们内部的调教指南，最大生成长度锁定在32768个token，温度值维持在0.6，top-p值定格在0.95。每个测试都生成64个响应样本。

详细的配置建议如下：

1.将温度设置在0.5-0.7之间（建议设置为0.6），以防止模型输出无尽的重复或不连贯的内容。

2.避免添加system prompt，所有指令应包含在用户提示中。

3.对于数学问题，建议在提示中包含指令，例如：“请逐步推理，并将最终答案放在\boxed{}中。”

4.在评估模型性能时，建议进行多次测试，并取结果的平均值。

5.此外，我们注意到DeepSeek-R1系列模型在响应某些查询时，可能会绕过思维模式（即输出“”），这可能会影响模型的性能。为了确保模型进行充分的推理，我们建议在每次输出的开始，强制模型以“”开始其响应。

DeepSeek官方给出的蒸馏版模型的评测对比

更大的参数量并不一定能带来更好的效果，在我们体验的这几款小模型中，相邻参数量模型的实力差距整体倒也没有那么等级森严。我们也做了一些简单的测试。

“deekseeeek里有多少个e?”

8B模型的响应速度很快，基本能跑到60 token/s，但答得快不意味着答得对，差之毫厘，谬以千里。思考过程显示，模型更像是基于知识库里的“DeepSeek”单词作出回答。

14B模型也没答对。直到32B模型的出场，才终于看到了靠谱的答案。70B模型展示出更缜密的推理过程，但同样回答错误。

“请帮我写一版京剧的《哈利波特与魔法石》”

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Llama-70B

就该问题的回答质量来说，32B和70B各有千秋，32B在剧本场景的细节把控更完美，而70B则交出了一份角色饱满、剧情完整的答卷。

“在一天的24小时之中，时钟的时针、分针和秒针完全重合在一起的时候有几次？都分别是什么时间？你怎样算出来的？”

8B-70B的回答

“某人在北半球某地乘飞机依次向正东、正北、正西、正南各飞行2000千米。最后，他能回到原地吗？”

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Llama-70B

当然，这几款模型中，参数越小的模型的回答准确率往往越低，即便思考过程摸着门道了，但后续也因不坚定而出错，遇上数学计算领域，不同量级模型的实力差距则会比较明显。

本地部署有三大优势，敏感数据无需上传云端；断网也能流畅使用；以及免除API调用费用，长文本任务更省钱，尤其适合企业、开发者及对隐私敏感的用户。

但不支持联网也有其弊端，如果你不喂给它“资料”，不及时更新知识库，那它的信息认知水平也会停滞不前。比方说知识库截止到2024年，那它就没法回答你最新的AI新闻。

本地部署最常用的功能当属打造自己的知识库，方法则是在安装LM Studio之后，增加与Anything LLM联动的部署步骤。

考虑到效果和适用性，我们使用了32B模型作为联动模型，结果显示效果也很一般，其中最大的挑战来自上下文窗口的限制。

依次输入只有4000字的文章和1000字左右的文章，前者回答依旧很迷糊，后者则能胜任，但处理1000字左右的文章稍显鸡肋，所以当个玩具还行，生产力还差点意思。

另外需要特别强调的是，一方面，撬开这四款模型的嘴难度极高，另一方面，我们也不建议大家去尝试“越狱”。网上虽然流传着许多所谓容易“越狱”的新版本模型，但出于安全和伦理考虑，我们并不建议随意部署。

不过，既然到这一步了，不妨再本着一窍通百窍通的原则，尝试下载和部署一些经过正规渠道发布的小模型。

那除了本地部署R1蒸馏小模型，满血版R1有没有穷鬼套餐呢？

Hugging Face的工程师马修·卡里根前不久在X平台展示了运行完整DeepSeek-R1模型，Q8量化，无蒸馏的硬件+软件设置，成本大约为6000美元。

附上完整配置链接：https://x.com/carrigmat/status/1884244369907278106

言归正传，所以我们真的需要本地部署一个蒸馏版的DeepSeek R1吗？

我的建议是不要将这几款R1蒸馏小模型想象成特斯拉，它充其量更像是五菱宏光，能跑是能跑，但要么性能表现相去甚远，要么缺胳膊少腿。

在本地部署最常用的自定义知识库能力的体验中，效果就不尽如人意。面对具体问题时，它无法准确“按图索骥”，或者干脆胡编乱造，准确率堪忧。

对绝大多数用户来说，老老实实用官方版或者使用第三方平台才是目前最优解，它不需要投入昂贵的硬件成本，也不用担心性能受限。

甚至折腾了半天，你会发现与其投入大量时间、精力和金钱去折腾本地部署这些小模型，不如下班后吃顿好的。

而对于企业用户、开发者或对数据隐私有特殊需求的用户，本地部署依然是一个值得考虑的选择，但前提是你清楚自己为什么需要它，以及它存在的各种局限性。

附上小白QA问答：

‍问:我能在普通的电脑上部署DeepSeek吗？

答:DeepSeek的完整版对电脑要求较高，但是，如果你只是想用它进行简单的操作，可以选择一些蒸馏小模型，不过仍需量力而行。

问：什么是DeepSeek R1的蒸馏版模型？

答:蒸馏版模型是DeepSeek R1的简化版本，硬件要求更低，运行起来速度也更快。

问:我能在没有网络的情况下使用DeepSeek吗？

答:如果你选择本地部署DeepSeek，那么在没有互联网的情况下也能使用它。如果你通过云端或第三方平台使用，就需要网络连接才能访问。

问:使用DeepSeek时，我的个人数据是否安全？

答:如果你选择本地部署DeepSeek，那么你的数据不会上传到云端，更加安全。如果使用在线版本，确保选择可信的服务平台，保护个人隐私。‍

DeepSeek R1本地部署教程

尽管许多卖课博主声称能轻松运行满血版DeepSeek R1，但满血版R1模型参数高达671B，仅模型文件就需要404GB存储空间，运行时更需要约1300GB显存。对于没有卡的普通玩家来说，运行的条件苛刻，且门槛极高。基于此&#xff0…...

编程日记 2025/2/15 12:42:34

CEF132编译指南 MacOS 篇 - 获取 CEF 源码 (五)

1. 引言在完成了所有必要工具的安装和配置之后，我们正式进入获取 CEF132 源码的阶段。对于 macOS 平台，CEF 的源码获取过程需要特别注意不同芯片架构（Intel 和 Apple Silicon）的区别以及版本管理。本篇将作为 CEF132 编译指南系…...

编程日记 2025/2/15 12:41:33

TypeScript装饰器 ------- 学习笔记分享

目录一. 简介二. 类装饰器 1. 基本语法 2. 应用举例 3. 关于返回值 4. 关于构造类型 5. 替换被装饰的类三. 装饰器工厂四. 装饰器组合五. 属性装饰器 1. 基本语法 2. 关于属性遮蔽 3. 应用举例六. 方法装饰器 1. 基本语法 2. 应用举例七. 访问器装饰器 …...

编程日记 2025/2/15 12:40:29

FPGA实现UltraScale GTH光口视频转USB3.0传输，基于FT601+Aurora 8b/10b编解码架构，提供2套工程源码和技术支持

目录 1、前言工程概述免责声明 2、相关方案推荐我已有的所有工程源码总目录----方便你快速找到自己喜欢的项目我这里已有的 GT 高速接口解决方案本博已有的FPGA驱动USB通信方案 3、工程详细设计方案工程设计原理框图输入Sensor之-->OV5640摄像头动态彩条输入视频之-->ADV…...

编程日记 2025/2/15 12:38:26

蓝桥杯篇---实时时钟 DS1302

文章目录前言特点简介1.低功耗2.时钟/日历功能3.32字节的额外RAM4.串行接口 DS1302 引脚说明1.VCC12.VCC23.GND4.CE5.I/O6.SCLK DS1302 寄存器1.秒寄存器2.分钟寄存器3.小时寄存器4.日寄存器5.月寄存器6.星期寄存器7.年寄存器8.控制寄存器 DS1302 与 IAP25F2K61S2 的连接1.CE连…...

编程日记 2025/2/15 12:37:22

C语言蓝桥杯1003: [编程入门]密码破译

要将"China"译成密码，译码规律是：用原来字母后面的第4个字母代替原来的字母． 例如，字母"A"后面第4个字母是"E"．"E"代替"A"。因此，"China"应译…...

编程日记 2025/2/15 12:36:20

【MySQL在Centos 7环境安装】

文章目录一. 卸载不必要的环境二. 检查系统安装包三. 卸载这些默认安装包四. 获取mysql官⽅yum源五. 安装mysql yum 源，对⽐前后yum源六. 看看能不能正常⼯作七. 安装mysql服务八. .查看配置⽂件和数据存储位置九. 启动服务并查看服务是否存在十. 登陆⽅法十一. 设…...

编程日记 2025/2/15 12:35:19

科技引领未来，中建海龙C-MiC 2.0技术树立模块化建筑新标杆

在建筑行业追求高效与品质的征程中，中建海龙科技有限公司（简称“中建海龙”）以其卓越的创新能力和强大的技术实力，不断书写着装配式建筑领域的新篇章。1 月 10 日，由深圳安居集团规划，中建海龙与中海建筑共…...

编程日记 2025/2/15 12:34:17

玩转观察者模式

文章目录什么是观察者模式解决方案结构适用场景实现方式观察者模式优缺点优点：缺点：什么是观察者模式观察者模式通俗点解释就是你在观察别人，别人有什么变化，你就做出什么调整。观察者模式是一种行为设计模式，允许你定义一种订阅机制，可在对象事件发生时通知多个“观察…...

编程日记 2025/2/15 12:33:15

Baklib知识中台构建企业智能运营核心架构

内容概要在数字化转型的浪潮中，企业对于知识的系统化管理需求日益迫切。Baklib作为新一代的知识中台，通过构建智能运营核心架构，为企业提供了一套从知识汇聚到场景化落地的完整解决方案。其核心价值在于将分散的知识资源整合为统一的资产池…...

编程日记 2025/2/15 12:31:09

Anaconda +Jupyter Notebook安装（2025最新版）

Anaconda安装（2025最新版） Anaconda简介安装1：下载anaconda安装包2： 安装anaconda3：配置环境变量4：检查是否安装成功5：更改镜像源6：更新包7：检查 Jupyter Notebook一.Jup…...

编程日记 2025/2/15 12:29:05

正成为现代城市发展的必然趋势的智慧交通开源了

智慧交通视觉监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。通过人流密集检测…...

编程日记 2025/2/15 12:28:04

手撕Transformer编码器：从Self-Attention到Positional Encoding的PyTorch逐行实现

Transformer 编码器深度解读代码实战 1. 编码器核心作用 Transformer 编码器的核心任务是将输入序列（如文本、语音）转换为富含上下文语义的高维特征表示。它通过多层自注意力（Self-Attention）和前馈网络（FFN&#x…...

编程日记 2025/2/15 12:26:00

Webpack和Vite插件的开发与使用

在现代开发中一般各公司都有自己的监控平台，对前端而言如果浏览器报错的话就可以通过埋点收集错误日志，再结合sourcemap文件可以帮助我们定位到错误代码，帮助我们排查问题。这里就记录一下之前在webpack和vite两个环境中的插件开发&#xff0…...

编程日记 2025/2/15 12:24:56

HTTP的状态码

HTTP 状态码当浏览者访问一个网页时，浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前，此网页所在的服务器会返回一个包含 HTTP 状态码的信息头（server header）用以响应浏览器的请求。常见的HTTP状态码 …...

编程日记 2025/2/15 12:23:53

Python函数-装饰器

装饰器写好的函数，不做任何修改，就可以改变执行内容，在其头或尾部加入新的流程代码本质上就是使用函数嵌套，在内部嵌套定义的函数中调用原函数，从而可读在前或后加入新的代码使用的关键： 将原函数作为参数…...

编程日记 2025/2/15 12:21:49

【数据可视化-17】基于pyecharts的印度犯罪数据可视化分析

🧑 博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN…...

编程日记 2025/2/15 12:20:46

HTTP请求报文头和相应报文头

一、HTTP请求报文头 HTTP请求报文由请求行、请求头和请求体组成。请求头包含客户端向服务器发送的附加信息。 1.1 请求行格式: 方法请求URI HTTP/版本示例: GET /index.html HTTP/1.1 方法: 请求类型，如GET、POST、PUT、DELETE等。请求URI: 请求的资源…...

编程日记 2025/2/15 12:19:45

#include<bits/stdc.h> using namespace std; int a[100][100],v[100][100];//访问数组 n,m<100 struct point {int x;int y;int step; }; queue<point> r;//申请队列 int dx[4]{0,1,0,-1};//四个方向右下左上 int dy[4]{1,0,-1,0}; int main() { /* 5 4 1 …...

编程日记 2025/2/15 12:17:33

《Qt C++ 与 OpenCV：解锁视频播放程序设计的奥秘》

引言：探索视频播放程序设计之旅在当今数字化时代，多媒体应用已渗透到我们生活的方方面面，从日常的视频娱乐到专业的视频监控、视频会议系统，视频播放程序作为多媒体应用的核心组成部分，扮演着至关重要的角色。无论是在个人电脑、移动设备还是智能电视等平台上，用户都期望…...

编程新知 2026/2/7 13:17:38

【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现（服务端执行命令请求的过程 - 初始化服务器）

服务端执行命令请求的过程【专栏简介】【技术大纲】【专栏目标】【目标人群】1. Redis爱好者与社区成员2. 后端开发和系统架构师3. 计算机专业的本科生及研究生初始化服务器1. 初始化服务器状态结构初始化RedisServer变量 2. 加载相关系统配置和用户配置参数定制化配置参数案…...

编程新知 2026/2/2 0:45:02

学校招生小程序源码介绍

基于ThinkPHPFastAdminUniApp开发的学校招生小程序源码，专为学校招生场景量身打造，功能实用且操作便捷。从技术架构来看，ThinkPHP提供稳定可靠的后台服务，FastAdmin加速开发流程，UniApp则保障小程序在多端有良好的兼…...

编程新知 2026/1/26 14:19:52

MySQL 8.0 OCP 英文题库解析（十三）

Oracle 为庆祝 MySQL 30 周年，截止到 2025.07.31 之前。所有人均可以免费考取原价245美元的MySQL OCP 认证。从今天开始，将英文题库免费公布出来，并进行解析，帮助大家在一个月之内轻松通过OCP认证。本期公布试题111~120 试题1…...

编程新知 2026/1/31 7:25:57

k8s业务程序联调工具-KtConnect

概述原理工具作用是建立了一个从本地到集群的单向VPN，根据VPN原理，打通两个内网必然需要借助一个公共中继节点，ktconnect工具巧妙的利用k8s原生的portforward能力，简化了建立连接的过程，apiserver间接起到了中继节…...

编程新知 2026/2/1 4:14:14

今日学习：Spring线程池|并发修改异常|链路丢失|登录续期|VIP过期策略|数值类缓存

文章目录优雅版线程池ThreadPoolTaskExecutor和ThreadPoolTaskExecutor的装饰器并发修改异常并发修改异常简介实现机制设计原因及意义使用线程池造成的链路丢失问题线程池导致的链路丢失问题发生原因常见解决方法更好的解决方法设计精妙之处登录续期登录续期常见实现方式特…...

编程新知 2026/1/27 16:41:02

佰力博科技与您探讨热释电测量的几种方法

热释电的测量主要涉及热释电系数的测定，这是表征热释电材料性能的重要参数。热释电系数的测量方法主要包括静态法、动态法和积分电荷法。其中，积分电荷法最为常用，其原理是通过测量在电容器上积累的热释电电荷，从而确定热释电系数…...

编程新知 2026/1/23 11:53:19

HarmonyOS运动开发：如何用mpchart绘制运动配速图表

##鸿蒙核心技术##运动开发##Sensor Service Kit（传感器服务）# 前言在运动类应用中，运动数据的可视化是提升用户体验的重要环节。通过直观的图表展示运动过程中的关键数据，如配速、距离、卡路里消耗等，用户可以更清晰…...

编程新知 2026/2/2 7:49:59

并发编程 - go版

1.并发编程基础概念进程和线程 A. 进程是程序在操作系统中的一次执行过程，系统进行资源分配和调度的一个独立单位。B. 线程是进程的一个执行实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。C.一个进程可以创建和撤销多个线程;同一个进程中…...

编程新知 2026/1/31 6:50:52

Caliper 配置文件解析：fisco-bcos.json

config.yaml 文件 config.yaml 是 Caliper 的主配置文件，通常包含以下内容： test:name: fisco-bcos-test # 测试名称description: Performance test of FISCO-BCOS # 测试描述workers:type: local # 工作进程类型number: 5 # 工作进程数量monitor:type: - docker- pro…...

编程新知 2025/10/24 15:14:02

DeepSeek R1本地部署教程

DeepSeek-R1 671B: Complete Hardware Requirements - DEV Community

DeepSeek官方给出的蒸馏版模型的评测对比

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Llama-70B

8B-70B的回答

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Llama-70B

相关文章：

DeepSeek R1本地部署教程

CEF132编译指南 MacOS 篇 - 获取 CEF 源码 (五)

TypeScript装饰器 ------- 学习笔记分享

FPGA实现UltraScale GTH光口视频转USB3.0传输，基于FT601+Aurora 8b/10b编解码架构，提供2套工程源码和技术支持

蓝桥杯篇---实时时钟 DS1302

C语言蓝桥杯1003: [编程入门]密码破译

【MySQL在Centos 7环境安装】

科技引领未来，中建海龙C-MiC 2.0技术树立模块化建筑新标杆

玩转观察者模式

Baklib知识中台构建企业智能运营核心架构

Anaconda +Jupyter Notebook安装（2025最新版）

正成为现代城市发展的必然趋势的智慧交通开源了

手撕Transformer编码器：从Self-Attention到Positional Encoding的PyTorch逐行实现

Webpack和Vite插件的开发与使用

HTTP的状态码

Python函数-装饰器

【数据可视化-17】基于pyecharts的印度犯罪数据可视化分析

HTTP请求报文头和相应报文头

19.4.9 数据库方式操作Excel

BFS 走迷宫

《Qt C++ 与 OpenCV：解锁视频播放程序设计的奥秘》

【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现（服务端执行命令请求的过程 - 初始化服务器）

学校招生小程序源码介绍

MySQL 8.0 OCP 英文题库解析（十三）

k8s业务程序联调工具-KtConnect

今日学习：Spring线程池|并发修改异常|链路丢失|登录续期|VIP过期策略|数值类缓存

佰力博科技与您探讨热释电测量的几种方法

HarmonyOS运动开发：如何用mpchart绘制运动配速图表

并发编程 - go版

Caliper 配置文件解析：fisco-bcos.json