当前位置：首页 > article >正文

DeepSeek r1本地安装全指南

article 2026/5/9 0:10:03

环境基本要求

硬件配置

需要本地跑模型，兼顾质量、性能、速度以及满足日常开发需要，我们需要准备以下硬件：

CPU：I9
内存：128GB
硬盘：3-4TB 最新SSD，C盘确保有400GB，其它都可划成D盘；
GPU：4080S即可（有条件的上4090D或者双卡），但是4080S已经足足够用了；
风扇：华硕七彩，10个 + 大功能水冷；
机箱：别用什么海景房，什么火山岩，不实用，太小，建议直接就是买那种大号的半透明机箱一个就行了，又大散热又好，什么海景房火山岩都不如搞7彩风扇好看；

软件配置

操作系统：Win11/Linux CentOS8.2/Ubuntu 24+
安装nvidia驱动，安装nvidia cuda核心，安装nvidia cudnn
python 3.10+
chatbox（用于作GUI聊天对话界面用）

确保nvidia的驱动在安装后你还必须要有nvidia cuda核心

一般互联网开发人员不知道这是什么，我们这样来装它。

先打开你的nvidia驱动装完后右下角的nvidia control panel找到以下这样的一个界面

一般4080s+以上都是12.6.65及以上，我们记成12.6.0。

于是打开以下网址下载nvidia cuda核心：

https://developer.nvidia.com/cuda-12-6-0-download-archive?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exe_local

在此下载cuda 12.6。

确保nvidia CUDNN被安装

一定要先装完了cuda核心后，再要装cudnn。

https://developer.nvidia.com/rdp/cudnn-archive#a-collapse897-120

我们进入nvidia开发者中心里下载它。

cuDNN下载完成后，是一个压缩包，解压完成后。请严格按照下面步骤去做，它解压后包含bin,include,lib三个目录。

把cuda\bin\cudnn64_7.dll复制到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin 目录下.
把\cuda\ include\cudnn.h复制到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\include 目录下.
把\cuda\lib\x64\cudnn.lib复制到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64 目录下.

安装Ollama

接着我们下载Ollama，https://ollama.com/。

下载完后直接安装它。

安装完后右下角会有这么一个图标。

安装完后即启动了，你也可以设置成开机不启动。

配置ollama

我我们使用ollama安装deek seek前，一定要先做配置，如果不配置，它会在安装时把很多模型文件一股脑的装到你的：

Windows 目录：C:\Users%username%.ollama\models
MacOS 目录：~/.ollama/models
Linux 目录：/usr/share/ollama/.ollama/models

这样的话你的C盘或者是启动盘就吃紧了，到时麻烦可就大了。

`必配参数与解释`

OLLAMA_MODELS

模型文件存放目录，默认目录为当前用户目录我们把它指向了D盘的d:\ollama_models。

OLLAMA_HOST

Ollama 服务监听的网络地址，默认为127.0.0.1，如果允许其他电脑访问 Ollama（如：局域网中的其他电脑），建议设置成0.0.0.0，从而允许其他网络访问

OLLAMA_PORT

Ollama 服务监听的默认端口，默认为11434，如果端口有冲突，可以修改设置成其他端口（如：8080等）

OLLAMA_ORIGINS

HTTP 客户端请求来源，半角逗号分隔列表，若本地使用无严格要求，可以设置成星号，代表不受限制

OLLAMA_KEEP_ALIVE

大模型加载到内存中后的存活时间，默认为5m即 5 分钟（如：纯数字如 300 代表 300 秒，0 代表处理请求响应后立即卸载模型，任何负数则表示一直存活）；我们可设置成24h，即模型在内存中保持 24 小时，提高访问速度

OLLAMA_NUM_PARALLEL

请求处理并发数量，默认为1，即单并发串行处理请求，可根据实际情况进行调整

OLLAMA_MAX_QUEUE

请求队列长度，默认值为512，可以根据情况设置，超过队列长度请求被抛弃

OLLAMA_DEBUG

输出 Debug 日志标识，应用研发阶段可以设置成1，即输出详细日志信息，便于排查问题

OLLAMA_MAX_LOADED_MODELS

最多同时加载到内存中模型的数量，默认为1，即只能有 1 个模型在内存中

配置完成后，启动一个terminal或者是命令行，然后以下几条常用ollama命令供参考

Ollama常用命令

列出当前系统装了哪些模型

ollama list

NAME ID SIZE MODIFIED

gemma2:9b c19987e1e6e2 5.4 GB 7 days ago

qwen2:7b e0d4e1163c58 4.4 GB 10 days ago

安装和运行一个模型

ollama run deepseek-r1:14b

如果这个模型不存在，它就会先下载这个模型至ollama_models指向的那个目录并作下载，如上条命令就是安装和运行deep seek r1 14b的。

查看己安装的模型

ollama ps

删除一个模型

ollama rm

如：

ollama rm gemma2:9b

安装完后Deek Seek使用ChatBox来做验证

下载网址

https://chatboxai.app/zh

建议安装1.9.6版。

配置

我们使用了一个生产的复杂场景，3层推理分别试了让GPT3.5 TURBO16K以及GPT4O，还有QWEN2 7B以及Deep Seek r1 14b分别作了回答。

无论是从GPU性能开销、回答正确性来看，Deep Seek秒杀了Gpt4O，不得不说Deep Seek是我们的国产之光。

这下，我们实现了AI自由了。

附、其它ollama支持的模型

模型	参数	大小	使用命令
Llama 3.1	8B	4.7GB	ollama run llama3.1
Llama 3.1	70B	40GB	ollama run llama3.1:70b
Llama 3.1	405B	231GB	ollama run llama3.1:405b
Gemma 2	9B	5.5GB	ollama run gemma2
Gemma 2	27B	16GB	ollama run gemma2:27b
qwen2	7B	4.4GB	ollama run qwen2
qwen2	72B	41GB	ollama run qwen2:72b
glm4	9B	5.5GB	ollama run glm4

DeepSeek r1本地安装全指南

环境基本要求硬件配置需要本地跑模型，兼顾质量、性能、速度以及满足日常开发需要，我们需要准备以下硬件： CPU：I9内存：128GB硬盘：3-4TB 最新SSD，C盘确保有400GB，其它都可划成D盘…...

编程日记 2026/5/6 16:41:30

《 C++ 点滴漫谈：二十五》空指针，隐秘而危险的杀手：程序崩溃的真凶就在你眼前！

摘要本博客全面解析了 C 中指针与空值的相关知识，从基础概念到现代 C 的改进展开，涵盖了空指针的定义、表示方式、使用场景以及常见注意事项。同时，深入探讨了 nullptr 的引入及智能指针在提升代码安全性和简化内存管理方面的优势。通过实际…...

编程日记 2026/2/25 3:36:54

陆游的《诗人苦学说》：从藻绘到“功夫在诗外”（中英双语）mastery lies beyond poetry

陆游的《诗人苦学说》：从藻绘到“功夫在诗外” 今天看万维钢的《万万没想到》一书，看到陆游的功夫在诗外的句子，特意去查找这首诗的原文。故而有此文。我国学人还往往过分强调“功夫在诗外”这句陆游的名言，认为提升综合素质是一…...

编程日记 2026/3/4 8:46:28

shell编程（1）——shell介绍

1、shell编程 shell是操作系统的终端命令行，可以理解为人机交互的一种方式，软件系统提供给用户操作的命令行界面，解释执行用户输入的命令或程序。程序员常见的就是命令行终端，通过命令来和操作系统交互。shell脚本：是…...

编程日记 2026/5/5 3:49:58

基于VMware的ubuntu与vscode建立ssh连接

1.首先安装openssh服务 sudo apt update sudo apt install openssh-server -y 2.启动并检查ssh服务状态到这里可以按q退出之后输入命令 ： ip a 红色挡住的部分就是我们要的地址，这里就不展示了哈 3.配置vscode 打开vscode 搜索并安装：…...

编程日记 2026/5/6 20:44:47

【LLM-agent】(task2)用llama-index搭建AI Agent

note LlamaIndex 实现 Agent 需要导入 ReActAgent 和 Function Tool，循环执行：推理、行动、观察、优化推理、重复进行。可以在 arize_phoenix 中看到 agent 的具体提示词，工具被装换成了提示词ReActAgent 使得业务自动向代码转换成为可能&am…...

编程日记 2026/5/6 14:58:57

【Redis】Redis 经典面试题解析：深入理解 Redis 的核心概念与应用

Redis 是一个高性能的键值存储系统，广泛应用于缓存、消息队列、排行榜等场景。在面试中，Redis 是一个高频话题，尤其是其核心概念、数据结构、持久化机制和高可用性方案。 1. Redis 是什么？它的主要特点是什么？ 答案&a…...

编程日记 2026/5/6 22:16:33

FastExcel使用详解

文章目录 FastExcel使用详解一、引言二、环境准备与依赖引入1、Maven 依赖引入2、实体类定义三、核心操作：读写 Excel1、读取 Excel1.1 自定义监听器1.2 读取文件 2、写入 Excel2.1 简单写入2.2 模板写入四、Spring Boot 集成示例1、文件上传（导入&…...

编程日记 2026/4/29 17:51:57

文章目录前言1.SDK API功能介绍1.1 Device组件下的API测试1.1.1 相机工作模式设置（TY_TRIGGER_PARAM_EX）1.1.2 TY_INT_FRAME_PER_TRIGGER1.1.3 TY_INT_PACKET_DELAY1.1.4 TY_INT_PACKET_SIZE1.1.5 TY_BOOL_GVSP_RESEND1.1.6 TY_BOOL_TRIGGER_OUT_IO1.1.…...

编程日记 2026/5/7 18:43:25

解决MacOS安装软件时提示“打不开xxx软件，因为Apple无法检查其是否包含恶意软件”的问题

macOS 系统中如何开启“任何来源”以解决安装报错问题？ 大家好！今天我们来聊聊在使用 macOS 系统时，遇到安装应用软件时出现报错的情况。这种情况常常发生在安装一些来自第三方开发者的应用时，因为 macOS 会默认阻止不明开发者的…...

编程日记 2026/5/5 18:57:04

网站快速收录：利用网站评论系统增加曝光

本文转自：百万收录网原文链接：https://www.baiwanshoulu.com/40.html 利用网站评论系统增加曝光，是提升网站快速收录的有效途径之一。以下是一些详细策略，旨在通过优化和利用评论系统来增强网站的可见性和互动性： 一…...

编程日记 2026/3/2 19:20:43

实验十 Servlet(一)

实验十 Servlet(一) 【实验目的】 1．了解Servlet运行原理 2．掌握Servlet实现方式【实验内容】 1、参考课堂例子，客户端通过login.jsp发出登录请求，请求提交到loginServlet处理。如果用户名和密码相同则视为登录成功&#xff0c…...

编程日记 2026/5/8 6:03:18

MyBatis-Plus笔记-快速入门

大家在日常开发中应该能发现，单表的CRUD功能代码重复度很高，也没有什么难度。而这部分代码量往往比较大，开发起来比较费时。因此，目前企业中都会使用一些组件来简化或省略单表的CRUD开发工作。目前在国内使用较多的一个组件就是…...

编程日记 2026/5/7 17:58:55

Node.js MySQL：深度解析与最佳实践

Node.js MySQL：深度解析与最佳实践引言 Node.js作为一种流行的JavaScript运行时环境，以其轻量级、高性能和事件驱动模型受到开发者的青睐。MySQL则是一款功能强大的关系型数据库管理系统，广泛应用于各种规模的应用程序中。本文将深入探讨Node.js与MySQL的集成，分析其优势…...

编程日记 2026/3/4 21:59:49

《超自然》：科学与灵性融合的自我转变之路

在现代社会中，许多人开始探寻自我成长、身心疗愈与灵性提升的可能性。Bestselling author Dr. Joe Dispenza 的《超自然：普通人如何创造非凡人生》正是在这样的大背景下问世的。书中既融合了量子物理、神经科学和表观遗传学的前沿理论，又吸收…...

编程日记 2026/5/8 14:20:23

JAVA内置类使用方法记录

Array数组普通数组是基本类型，例如int[] 就像是；一个装着元素排列整齐的盒子，他没有size()，length()等方法，但是存在length属性。 Array.sort() 这是专门排序数组的方法，但是前提是你必须给数组存储的元素…...

编程日记 2026/4/25 3:54:28

《Origin画百图》之脊线图

1.数据准备：将数据设置为y 2.选择绘图>统计图>脊线图 3.生成基础图形，并不好看，接下来对图形属性进行设置 4.双击图形>选择图案>颜色选择按点>Y值 5.这里发现颜色有色阶，过度并不平滑，需要对色阶进行更…...

编程日记 2026/5/1 19:57:32

w189电商平台的设计与实现

🙊作者简介：多年一线开发工作经验，原创团队，分享技术代码帮助学生学习，独立完成自己的网站项目。代码可以查看文章末尾⬇️联系方式获取，记得注明来意哦~🌹赠送计算机毕业设计600个选题excel文…...

编程日记 2026/5/6 19:29:40

c++ string类 +底层模拟实现

提醒: 本片博客只是小编的听课笔记，介意勿看。基础包含在头文件<string>，才能使用string类似函数接口。 string常见构造类 string s1; cin>>s1;//无参构造 string s2(s1);//拷贝构造 string s1("jfksa");//传参构造三种…...

编程日记 2026/4/14 1:49:50

让banner.txt可以自动读取项目版本

文章目录 1.sunrays-dependencies1.配置插件2.pluginManagement统一指定版本 2.common-log4j2-starter1.banner.txt使用$ 符号取出2.查看效果 1.sunrays-dependencies 1.配置插件 <plugin><groupId>org.apache.mave…...

编程日记 2026/5/3 18:05:07

深度解析：网站快速收录与网站安全性的关系

本文转自：百万收录网原文链接：https://www.baiwanshoulu.com/58.html 网站快速收录与网站安全性之间存在着密切的关系。以下是对这一关系的深度解析： 一、网站安全性对收录的影响搜索引擎惩罚： 如果一个网站存在安全隐患&am…...

编程日记 2026/3/1 22:54:49

96，【4】 buuctf web [BJDCTF2020]EzPHP

进入靶场查看源代码 GFXEIM3YFZYGQ4A 一看就是编码后的 1nD3x.php 访问得到源代码 <?php // 高亮显示当前 PHP 文件的源代码，用于调试或展示代码结构 highlight_file(__FILE__); // 关闭所有 PHP 错误报告，防止错误信息泄露可能的安全漏洞 erro…...

编程日记 2026/5/8 9:25:18

个人笔记（很没营养，纯备忘录）

1.输入电阻和输出电阻指在一个可划分为3部分的电路中，中间部分电路相当于前面电路的负载有输入端电阻，称输入电阻，相对于后面部分等效为电源有输出端内阻，称输出电阻理所当然的希望输出电阻对负载影响小，输入电阻能完…...

编程日记 2026/3/5 22:02:02

基于SpringBoot的智慧康老疗养院管理系统的设计与实现(源码+SQL脚本+LW+部署讲解等)

专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌。技术范围：SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：…...

编程日记 2026/5/4 0:58:09

音视频多媒体编解码器基础-codec

如果要从事编解码多媒体的工作，需要准备哪些更为基础的内容，这里帮你总结完。因为数据类型不同所以编解码算法不同，分为图像、视频和音频三大类；因为流程不同，可以分为编码和解码两部分；因为编码器实现不…...

编程日记 2026/5/7 10:44:28

小白零基础--CPP多线程

进程进程就是运行中的程序线程进程中的进程 1、C11 Thread线程库基础 #include <iostream> #include <thread> #include<string>void printthread(std::string msg){std::cout<<msg<<std::endl;for (int i 0; i < 1000; i){std::cout<…...

编程日记 2026/5/3 8:03:34

Java线程认识和Object的一些方法ObjectMonitor

专栏系列文章地址：https://blog.csdn.net/qq_26437925/article/details/145290162 本文目标： 要对Java线程有整体了解，深入认识到里面的一些方法和Object对象方法的区别。认识到Java对象的ObjectMonitor，这有助于后面的Synchron…...

编程日记 2026/5/7 0:06:06

LeetCode：300.最长递增子序列

跟着carl学算法，本系列博客仅做个人记录，建议大家都去看carl本人的博客，写的真的很好的！ 代码随想录 LeetCode：300.最长递增子序列给你一个整数数组 nums ，找到其中最长严格递增子序列的长度。子序列是由…...

编程日记 2026/4/29 5:50:41

pytorch实现长短期记忆网络 (LSTM)

人工智能例子汇总：AI常见的算法和例子-CSDN博客 LSTM 通过记忆单元（cell） 和三个门控机制（遗忘门、输入门、输出门）来控制信息流： 记忆单元（Cell State） 负责存储长期信息&…...

编程日记 2026/5/8 9:01:28

AI学习指南HuggingFace篇-模型部署与推理

一、引言将训练好的模型部署为API并实现推理是将AI模型应用于实际场景的关键步骤。Hugging Face提供了多种工具和框架，支持快速部署和优化模型推理。本文将介绍如何将Hugging Face模型部署为API，探讨模型部署的常见方法和优化技巧，帮助读者将模型应用于实际场景。二、模型…...

编程日记 2026/3/13 22:59:21