DeepSeek R1本地部署教程
尽管许多卖课博主声称能轻松运行满血版DeepSeek R1,但满血版R1模型参数高达671B,仅模型文件就需要404GB存储空间,运行时更需要约1300GB显存。
对于没有卡的普通玩家来说,运行的条件苛刻,且门槛极高。基于此,我们不妨将目光转向DeepSeek R1四款分别对应Qwen和Llama的蒸馏小模型:
-
DeepSeek-R1-Distill-Llama-8B
-
DeepSeek-R1-Distill-Qwen-14B
-
DeepSeek-R1-Distill-Qwen-32B
-
DeepSeek-R1-Distill-Llama-70B
海外博主已经整理出相关配置供大家参考,注意,只要GPU等于或超过VRAM要求,模型仍然可以在规格较低的GPU上运行。但是设置不是最佳的,并且可能需要进行一些调整。
DeepSeek-R1 671B: Complete Hardware Requirements - DEV Community
本地部署R1小模型,两种方法,一学就会
我们这次手上体验的设备正是M1 Ultra 128GB内存的Mac Studio。关于主流本地部署DeepSeek的教程,两种方法,一学就会。
LM Studio
首先登场的是小白极简版本,在官网(lmstudio.ai)根据个人电脑型号下载LM Studio,接着为了方便使用,建议点击右下角修改语言为简体中文。
然后搜索deepseek-r1选择合适的版本下载,作为示例,我选择使用阿里Qwen模型为基座蒸馏出来的7B小模型。
配置完成后,即可一键启动。
使用LM Studio的好处就是不用代码、界面友好,但跑大型模型的时候对性能要求高,因此更适合新手入门使用基础功能。
Ollama
当然,对于追求更深层次体验的用户,我们也准备了进阶方案。
首先从官网(ollama.com)获取并安装Ollama。
启动后打开命令行工具。Mac用户键盘Command+空格打开“终端”工具,Windows用户键盘运行Win+R,输入cmd打开“命令提示符”工具。
在窗口中输入代码指令(ollama run deepseek-r1:7b)即可开始下载。请注意英文状态输入,检查空格和横杠,冒号后输入所需要的版本名称。
配置完成后就能在命令行窗口开始对话。
这个方法对性能要求很低,但需要熟悉命令行操作,模型的兼容性也有限,更适合进阶开发者实现高级操作。
如果你想要比较好看的交互界面,不妨在Chrome浏览器安装插件,搜索安装PageAssist。
选择本地已安装的模型,开始使用。
右上角设置里修改好语言,主页选择模型就可以开始对话,而且支持基础的联网搜索,玩法也更多样。
能跑是能跑,但……
我们这次体验则用到了LM Studio。
凭借其出色的优化能力,LM Studio使得模型能够在消费级硬件上高效运行。比如LM Studio支持GPU卸载技术,可以将模型分块加载到GPU中,从而在显存有限的情况下实现加速。
如同调教赛车,每个参数都会影响最终的表现,在体验之前,建议在LM Studio的设置中,根据需求调整推理参数的能力,以优化模型的生成质量和计算资源分配。
-
温度(Temperature):控制生成文本的随机性。
-
上下文溢出处理(Context Overflow Handling):决定如何处理超长输入。
-
CPU线程:影响生成速度和资源占用。
-
采样策略:通过多种采样方法和惩罚机制,确保生成文本的合理性和多样性。
DeepSeek研究员Daya Guo在X平台分享了他们内部的调教指南,最大生成长度锁定在32768个token,温度值维持在0.6,top-p值定格在0.95。每个测试都生成64个响应样本。
详细的配置建议如下:
1.将温度设置在0.5-0.7之间(建议设置为0.6),以防止模型输出无尽的重复或不连贯的内容。
2.避免添加system prompt,所有指令应包含在用户提示中。
3.对于数学问题,建议在提示中包含指令,例如:“请逐步推理,并将最终答案放在\boxed{}中。”
4.在评估模型性能时,建议进行多次测试,并取结果的平均值。
5.此外,我们注意到DeepSeek-R1系列模型在响应某些查询时,可能会绕过思维模式(即输出“”),这可能会影响模型的性能。为了确保模型进行充分的推理,我们建议在每次输出的开始,强制模型以“”开始其响应。
DeepSeek官方给出的蒸馏版模型的评测对比
更大的参数量并不一定能带来更好的效果,在我们体验的这几款小模型中,相邻参数量模型的实力差距整体倒也没有那么等级森严。我们也做了一些简单的测试。
“deekseeeek里有多少个e?”
8B模型的响应速度很快,基本能跑到60 token/s,但答得快不意味着答得对,差之毫厘,谬以千里。思考过程显示,模型更像是基于知识库里的“DeepSeek”单词作出回答。
14B模型也没答对。直到32B模型的出场,才终于看到了靠谱的答案。70B模型展示出更缜密的推理过程,但同样回答错误。
“请帮我写一版京剧的《哈利波特与魔法石》”
DeepSeek-R1-Distill-Qwen-32B
DeepSeek-R1-Distill-Llama-70B
就该问题的回答质量来说,32B和70B各有千秋,32B在剧本场景的细节把控更完美,而70B则交出了一份角色饱满、剧情完整的答卷。
“在一天的24小时之中,时钟的时针、分针和秒针完全重合在一起的时候有几次?都分别是什么时间?你怎样算出来的?”
8B-70B的回答
“某人在北半球某地乘飞机依次向正东、正北、正西、正南各飞行2000千米。最后,他能回到原地吗?”
DeepSeek-R1-Distill-Qwen-32B
DeepSeek-R1-Distill-Llama-70B
当然,这几款模型中,参数越小的模型的回答准确率往往越低,即便思考过程摸着门道了,但后续也因不坚定而出错,遇上数学计算领域,不同量级模型的实力差距则会比较明显。
本地部署有三大优势,敏感数据无需上传云端;断网也能流畅使用;以及免除API调用费用,长文本任务更省钱,尤其适合企业、开发者及对隐私敏感的用户。
但不支持联网也有其弊端,如果你不喂给它“资料”,不及时更新知识库,那它的信息认知水平也会停滞不前。比方说知识库截止到2024年,那它就没法回答你最新的AI新闻。
本地部署最常用的功能当属打造自己的知识库,方法则是在安装LM Studio之后,增加与Anything LLM联动的部署步骤。
考虑到效果和适用性,我们使用了32B模型作为联动模型,结果显示效果也很一般,其中最大的挑战来自上下文窗口的限制。
依次输入只有4000字的文章和1000字左右的文章,前者回答依旧很迷糊,后者则能胜任,但处理1000字左右的文章稍显鸡肋,所以当个玩具还行,生产力还差点意思。
另外需要特别强调的是,一方面,撬开这四款模型的嘴难度极高,另一方面,我们也不建议大家去尝试“越狱”。网上虽然流传着许多所谓容易“越狱”的新版本模型,但出于安全和伦理考虑,我们并不建议随意部署。
不过,既然到这一步了,不妨再本着一窍通百窍通的原则,尝试下载和部署一些经过正规渠道发布的小模型。
那除了本地部署R1蒸馏小模型,满血版R1有没有穷鬼套餐呢?
Hugging Face的工程师马修·卡里根前不久在X平台展示了运行完整DeepSeek-R1模型,Q8量化,无蒸馏的硬件+软件设置,成本大约为6000美元。
附上完整配置链接:https://x.com/carrigmat/status/1884244369907278106
言归正传,所以我们真的需要本地部署一个蒸馏版的DeepSeek R1吗?
我的建议是不要将这几款R1蒸馏小模型想象成特斯拉,它充其量更像是五菱宏光,能跑是能跑,但要么性能表现相去甚远,要么缺胳膊少腿。
在本地部署最常用的自定义知识库能力的体验中,效果就不尽如人意。面对具体问题时,它无法准确“按图索骥”,或者干脆胡编乱造,准确率堪忧。
对绝大多数用户来说,老老实实用官方版或者使用第三方平台才是目前最优解,它不需要投入昂贵的硬件成本,也不用担心性能受限。
甚至折腾了半天,你会发现与其投入大量时间、精力和金钱去折腾本地部署这些小模型,不如下班后吃顿好的。
而对于企业用户、开发者或对数据隐私有特殊需求的用户,本地部署依然是一个值得考虑的选择,但前提是你清楚自己为什么需要它,以及它存在的各种局限性。
附上小白QA问答:
问:我能在普通的电脑上部署DeepSeek吗?
答:DeepSeek的完整版对电脑要求较高,但是,如果你只是想用它进行简单的操作,可以选择一些蒸馏小模型,不过仍需量力而行。
问:什么是DeepSeek R1的蒸馏版模型?
答:蒸馏版模型是DeepSeek R1的简化版本,硬件要求更低,运行起来速度也更快。
问:我能在没有网络的情况下使用DeepSeek吗?
答:如果你选择本地部署DeepSeek,那么在没有互联网的情况下也能使用它。如果你通过云端或第三方平台使用,就需要网络连接才能访问。
问:使用DeepSeek时,我的个人数据是否安全?
答:如果你选择本地部署DeepSeek,那么你的数据不会上传到云端,更加安全。如果使用在线版本,确保选择可信的服务平台,保护个人隐私。
相关文章:

DeepSeek R1本地部署教程
尽管许多卖课博主声称能轻松运行满血版DeepSeek R1,但满血版R1模型参数高达671B,仅模型文件就需要404GB存储空间,运行时更需要约1300GB显存。 对于没有卡的普通玩家来说,运行的条件苛刻,且门槛极高。基于此࿰…...

CEF132编译指南 MacOS 篇 - 获取 CEF 源码 (五)
1. 引言 在完成了所有必要工具的安装和配置之后,我们正式进入获取 CEF132 源码的阶段。对于 macOS 平台,CEF 的源码获取过程需要特别注意不同芯片架构(Intel 和 Apple Silicon)的区别以及版本管理。本篇将作为 CEF132 编译指南系…...

TypeScript装饰器 ------- 学习笔记分享
目录 一. 简介 二. 类装饰器 1. 基本语法 2. 应用举例 3. 关于返回值 4. 关于构造类型 5. 替换被装饰的类 三. 装饰器工厂 四. 装饰器组合 五. 属性装饰器 1. 基本语法 2. 关于属性遮蔽 3. 应用举例 六. 方法装饰器 1. 基本语法 2. 应用举例 七. 访问器装饰器 …...

FPGA实现UltraScale GTH光口视频转USB3.0传输,基于FT601+Aurora 8b/10b编解码架构,提供2套工程源码和技术支持
目录 1、前言工程概述免责声明 2、相关方案推荐我已有的所有工程源码总目录----方便你快速找到自己喜欢的项目我这里已有的 GT 高速接口解决方案本博已有的FPGA驱动USB通信方案 3、工程详细设计方案工程设计原理框图输入Sensor之-->OV5640摄像头动态彩条输入视频之-->ADV…...
蓝桥杯篇---实时时钟 DS1302
文章目录 前言特点简介1.低功耗2.时钟/日历功能3.32字节的额外RAM4.串行接口 DS1302 引脚说明1.VCC12.VCC23.GND4.CE5.I/O6.SCLK DS1302 寄存器1.秒寄存器2.分钟寄存器3.小时寄存器4.日寄存器5.月寄存器6.星期寄存器7.年寄存器8.控制寄存器 DS1302 与 IAP25F2K61S2 的连接1.CE连…...

C语言蓝桥杯1003: [编程入门]密码破译
要将"China"译成密码,译码规律是:用原来字母后面的第4个字母代替原来的字母. 例如,字母"A"后面第4个字母是"E"."E"代替"A"。因此,"China"应译…...

【MySQL在Centos 7环境安装】
文章目录 一. 卸载不必要的环境二. 检查系统安装包三. 卸载这些默认安装包四. 获取mysql官⽅yum源五. 安装mysql yum 源,对⽐前后yum源六. 看看能不能正常⼯作七. 安装mysql服务八. .查看配置⽂件和数据存储位置九. 启动服务并查看服务是否存在十. 登陆⽅法十一. 设…...

科技引领未来,中建海龙C-MiC 2.0技术树立模块化建筑新标杆
在建筑行业追求高效与品质的征程中,中建海龙科技有限公司(简称“中建海龙”)以其卓越的创新能力和强大的技术实力,不断书写着装配式建筑领域的新篇章。1 月 10 日,由深圳安居集团规划,中建海龙与中海建筑共…...

玩转观察者模式
文章目录 什么是观察者模式解决方案结构适用场景实现方式观察者模式优缺点优点:缺点:什么是观察者模式 观察者模式通俗点解释就是你在观察别人,别人有什么变化,你就做出什么调整。观察者模式是一种行为设计模式,允许你定义一种订阅机制,可在对象事件发生时通知多个“观察…...

Baklib知识中台构建企业智能运营核心架构
内容概要 在数字化转型的浪潮中,企业对于知识的系统化管理需求日益迫切。Baklib作为新一代的知识中台,通过构建智能运营核心架构,为企业提供了一套从知识汇聚到场景化落地的完整解决方案。其核心价值在于将分散的知识资源整合为统一的资产池…...

Anaconda +Jupyter Notebook安装(2025最新版)
Anaconda安装(2025最新版) Anaconda简介安装1:下载anaconda安装包2: 安装anaconda3:配置环境变量4:检查是否安装成功5:更改镜像源6:更新包7:检查 Jupyter Notebook一.Jup…...

正成为现代城市发展的必然趋势的智慧交通开源了
智慧交通视觉监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒,省去繁琐重复的适配流程,实现芯片、算法、应用的全流程组合,从而大大减少企业级应用约95%的开发成本。通过人流密集检测…...
手撕Transformer编码器:从Self-Attention到Positional Encoding的PyTorch逐行实现
Transformer 编码器深度解读 代码实战 1. 编码器核心作用 Transformer 编码器的核心任务是将输入序列(如文本、语音)转换为富含上下文语义的高维特征表示。它通过多层自注意力(Self-Attention)和前馈网络(FFN&#x…...

Webpack和Vite插件的开发与使用
在现代开发中一般各公司都有自己的监控平台,对前端而言如果浏览器报错的话就可以通过埋点收集错误日志,再结合sourcemap文件可以帮助我们定位到错误代码,帮助我们排查问题。这里就记录一下之前在webpack和vite两个环境中的插件开发࿰…...
HTTP的状态码
HTTP 状态码 当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含 HTTP 状态码的信息头(server header)用以响应浏览器的请求。 常见的HTTP状态码 …...
Python函数-装饰器
装饰器 写好的函数,不做任何修改,就可以改变执行内容,在其头或尾部加入新的流程代码本质上就是使用函数嵌套,在内部嵌套定义的函数中调用原函数,从而可读在前或后加入新的代码使用的关键: 将原函数作为参数…...

【数据可视化-17】基于pyecharts的印度犯罪数据可视化分析
🧑 博主简介:曾任某智慧城市类企业算法总监,目前在美国市场的物流公司从事高级算法工程师一职,深耕人工智能领域,精通python数据挖掘、可视化、机器学习等,发表过AI相关的专利并多次在AI类比赛中获奖。CSDN…...
HTTP请求报文头和相应报文头
一、HTTP请求报文头 HTTP请求报文由请求行、请求头和请求体组成。请求头包含客户端向服务器发送的附加信息。 1.1 请求行 格式: 方法 请求URI HTTP/版本示例: GET /index.html HTTP/1.1 方法: 请求类型,如GET、POST、PUT、DELETE等。 请求URI: 请求的资源…...

19.4.9 数据库方式操作Excel
版权声明:本文为博主原创文章,转载请在显著位置标明本文出处以及作者网名,未经作者允许不得用于商业目的。 本节所说的操作Excel操作是讲如何把Excel作为数据库来操作。 通过COM来操作Excel操作,请参看第21.2节 在第19.3.4节【…...

BFS 走迷宫
#include<bits/stdc.h> using namespace std; int a[100][100],v[100][100];//访问数组 n,m<100 struct point {int x;int y;int step; }; queue<point> r;//申请队列 int dx[4]{0,1,0,-1};//四个方向 右下左上 int dy[4]{1,0,-1,0}; int main() { /* 5 4 1 …...
MySQL 隔离级别:脏读、幻读及不可重复读的原理与示例
一、MySQL 隔离级别 MySQL 提供了四种隔离级别,用于控制事务之间的并发访问以及数据的可见性,不同隔离级别对脏读、幻读、不可重复读这几种并发数据问题有着不同的处理方式,具体如下: 隔离级别脏读不可重复读幻读性能特点及锁机制读未提交(READ UNCOMMITTED)允许出现允许…...
【位运算】消失的两个数字(hard)
消失的两个数字(hard) 题⽬描述:解法(位运算):Java 算法代码:更简便代码 题⽬链接:⾯试题 17.19. 消失的两个数字 题⽬描述: 给定⼀个数组,包含从 1 到 N 所有…...

【网络安全产品大调研系列】2. 体验漏洞扫描
前言 2023 年漏洞扫描服务市场规模预计为 3.06(十亿美元)。漏洞扫描服务市场行业预计将从 2024 年的 3.48(十亿美元)增长到 2032 年的 9.54(十亿美元)。预测期内漏洞扫描服务市场 CAGR(增长率&…...
【解密LSTM、GRU如何解决传统RNN梯度消失问题】
解密LSTM与GRU:如何让RNN变得更聪明? 在深度学习的世界里,循环神经网络(RNN)以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而,传统RNN存在的一个严重问题——梯度消失&#…...
2024年赣州旅游投资集团社会招聘笔试真
2024年赣州旅游投资集团社会招聘笔试真 题 ( 满 分 1 0 0 分 时 间 1 2 0 分 钟 ) 一、单选题(每题只有一个正确答案,答错、不答或多答均不得分) 1.纪要的特点不包括()。 A.概括重点 B.指导传达 C. 客观纪实 D.有言必录 【答案】: D 2.1864年,()预言了电磁波的存在,并指出…...

【快手拥抱开源】通过快手团队开源的 KwaiCoder-AutoThink-preview 解锁大语言模型的潜力
引言: 在人工智能快速发展的浪潮中,快手Kwaipilot团队推出的 KwaiCoder-AutoThink-preview 具有里程碑意义——这是首个公开的AutoThink大语言模型(LLM)。该模型代表着该领域的重大突破,通过独特方式融合思考与非思考…...

江苏艾立泰跨国资源接力:废料变黄金的绿色供应链革命
在华东塑料包装行业面临限塑令深度调整的背景下,江苏艾立泰以一场跨国资源接力的创新实践,重新定义了绿色供应链的边界。 跨国回收网络:废料变黄金的全球棋局 艾立泰在欧洲、东南亚建立再生塑料回收点,将海外废弃包装箱通过标准…...

DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
前一阵子在百度 AI 开发者大会上,看到基于小智 AI DIY 玩具的演示,感觉有点意思,想着自己也来试试。 如果只是想烧录现成的固件,乐鑫官方除了提供了 Windows 版本的 Flash 下载工具 之外,还提供了基于网页版的 ESP LA…...

零基础设计模式——行为型模式 - 责任链模式
第四部分:行为型模式 - 责任链模式 (Chain of Responsibility Pattern) 欢迎来到行为型模式的学习!行为型模式关注对象之间的职责分配、算法封装和对象间的交互。我们将学习的第一个行为型模式是责任链模式。 核心思想:使多个对象都有机会处…...

NFT模式:数字资产确权与链游经济系统构建
NFT模式:数字资产确权与链游经济系统构建 ——从技术架构到可持续生态的范式革命 一、确权技术革新:构建可信数字资产基石 1. 区块链底层架构的进化 跨链互操作协议:基于LayerZero协议实现以太坊、Solana等公链资产互通,通过零知…...