当前位置：首页 > news >正文

DeepSeek r1本地安装全指南

news 2025/9/14 23:46:58

环境基本要求

硬件配置

需要本地跑模型，兼顾质量、性能、速度以及满足日常开发需要，我们需要准备以下硬件：

CPU：I9
内存：128GB
硬盘：3-4TB 最新SSD，C盘确保有400GB，其它都可划成D盘；
GPU：4080S即可（有条件的上4090D或者双卡），但是4080S已经足足够用了；
风扇：华硕七彩，10个 + 大功能水冷；
机箱：别用什么海景房，什么火山岩，不实用，太小，建议直接就是买那种大号的半透明机箱一个就行了，又大散热又好，什么海景房火山岩都不如搞7彩风扇好看；

软件配置

操作系统：Win11/Linux CentOS8.2/Ubuntu 24+
安装nvidia驱动，安装nvidia cuda核心，安装nvidia cudnn
python 3.10+
chatbox（用于作GUI聊天对话界面用）

确保nvidia的驱动在安装后你还必须要有nvidia cuda核心

一般互联网开发人员不知道这是什么，我们这样来装它。

先打开你的nvidia驱动装完后右下角的nvidia control panel找到以下这样的一个界面

一般4080s+以上都是12.6.65及以上，我们记成12.6.0。

于是打开以下网址下载nvidia cuda核心：

https://developer.nvidia.com/cuda-12-6-0-download-archive?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exe_local

在此下载cuda 12.6。

确保nvidia CUDNN被安装

一定要先装完了cuda核心后，再要装cudnn。

https://developer.nvidia.com/rdp/cudnn-archive#a-collapse897-120

我们进入nvidia开发者中心里下载它。

cuDNN下载完成后，是一个压缩包，解压完成后。请严格按照下面步骤去做，它解压后包含bin,include,lib三个目录。

把cuda\bin\cudnn64_7.dll复制到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin 目录下.
把\cuda\ include\cudnn.h复制到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\include 目录下.
把\cuda\lib\x64\cudnn.lib复制到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64 目录下.

安装Ollama

接着我们下载Ollama，https://ollama.com/。

下载完后直接安装它。

安装完后右下角会有这么一个图标。

安装完后即启动了，你也可以设置成开机不启动。

配置ollama

我我们使用ollama安装deek seek前，一定要先做配置，如果不配置，它会在安装时把很多模型文件一股脑的装到你的：

Windows 目录：C:\Users%username%.ollama\models
MacOS 目录：~/.ollama/models
Linux 目录：/usr/share/ollama/.ollama/models

这样的话你的C盘或者是启动盘就吃紧了，到时麻烦可就大了。

`必配参数与解释`

OLLAMA_MODELS

模型文件存放目录，默认目录为当前用户目录我们把它指向了D盘的d:\ollama_models。

OLLAMA_HOST

Ollama 服务监听的网络地址，默认为127.0.0.1，如果允许其他电脑访问 Ollama（如：局域网中的其他电脑），建议设置成0.0.0.0，从而允许其他网络访问

OLLAMA_PORT

Ollama 服务监听的默认端口，默认为11434，如果端口有冲突，可以修改设置成其他端口（如：8080等）

OLLAMA_ORIGINS

HTTP 客户端请求来源，半角逗号分隔列表，若本地使用无严格要求，可以设置成星号，代表不受限制

OLLAMA_KEEP_ALIVE

大模型加载到内存中后的存活时间，默认为5m即 5 分钟（如：纯数字如 300 代表 300 秒，0 代表处理请求响应后立即卸载模型，任何负数则表示一直存活）；我们可设置成24h，即模型在内存中保持 24 小时，提高访问速度

OLLAMA_NUM_PARALLEL

请求处理并发数量，默认为1，即单并发串行处理请求，可根据实际情况进行调整

OLLAMA_MAX_QUEUE

请求队列长度，默认值为512，可以根据情况设置，超过队列长度请求被抛弃

OLLAMA_DEBUG

输出 Debug 日志标识，应用研发阶段可以设置成1，即输出详细日志信息，便于排查问题

OLLAMA_MAX_LOADED_MODELS

最多同时加载到内存中模型的数量，默认为1，即只能有 1 个模型在内存中

配置完成后，启动一个terminal或者是命令行，然后以下几条常用ollama命令供参考

Ollama常用命令

列出当前系统装了哪些模型

ollama list

NAME ID SIZE MODIFIED

gemma2:9b c19987e1e6e2 5.4 GB 7 days ago

qwen2:7b e0d4e1163c58 4.4 GB 10 days ago

安装和运行一个模型

ollama run deepseek-r1:14b

如果这个模型不存在，它就会先下载这个模型至ollama_models指向的那个目录并作下载，如上条命令就是安装和运行deep seek r1 14b的。

查看己安装的模型

ollama ps

删除一个模型

ollama rm

如：

ollama rm gemma2:9b

安装完后Deek Seek使用ChatBox来做验证

下载网址

https://chatboxai.app/zh

建议安装1.9.6版。

配置

我们使用了一个生产的复杂场景，3层推理分别试了让GPT3.5 TURBO16K以及GPT4O，还有QWEN2 7B以及Deep Seek r1 14b分别作了回答。

无论是从GPU性能开销、回答正确性来看，Deep Seek秒杀了Gpt4O，不得不说Deep Seek是我们的国产之光。

这下，我们实现了AI自由了。

附、其它ollama支持的模型

模型	参数	大小	使用命令
Llama 3.1	8B	4.7GB	ollama run llama3.1
Llama 3.1	70B	40GB	ollama run llama3.1:70b
Llama 3.1	405B	231GB	ollama run llama3.1:405b
Gemma 2	9B	5.5GB	ollama run gemma2
Gemma 2	27B	16GB	ollama run gemma2:27b
qwen2	7B	4.4GB	ollama run qwen2
qwen2	72B	41GB	ollama run qwen2:72b
glm4	9B	5.5GB	ollama run glm4

DeepSeek r1本地安装全指南

环境基本要求硬件配置需要本地跑模型，兼顾质量、性能、速度以及满足日常开发需要，我们需要准备以下硬件： CPU：I9内存：128GB硬盘：3-4TB 最新SSD，C盘确保有400GB，其它都可划成D盘…...

编程日记 2025/2/1 3:06:59

LitGPT - 20多个高性能LLM，具有预训练、微调和大规模部署的recipes

文章目录一、关于 LitGPT二、快速启动安装LitGPT高级安装选项从20多个LLM中进行选择三、工作流程1、所有工作流程2、微调LLM3、部署LLM4、评估LLM5、测试LLM6、预训练LLM7、继续预训练LLM 四、最先进的功能五、训练方法示例六、项目亮点教程一、关于 LitGPT LitGPT 用于 …...

编程日记 2025/2/1 3:05:55

deepseek R1 14b显存占用

RTX2080ti 11G显卡，模型7b速度挺快，试试14B也不错。 7B显存使用5.6G，14B显存刚好够，出文字速度差不多。打算自己写个移动宽带的IPTV播放器，不知道怎么下手，就先问他了。...

编程日记 2025/2/1 3:03:53

无用知识研究：对std::common_type以及问号表达式类型的理解

先说结论： 如果问号表达式能编译通过，那么std::common_type就能通过。因为common_type的底层依赖的就是?: common_type的实现里，利用了问号表达式：ternary conditional operator (?:) https://stackoverflow.com/questions/14…...

编程日记 2025/2/1 2:56:43

MapReduce概述

目录 1. MapReduce概述2. MapReduce的功能2.1 数据划分和计算任务调度2.2 数据/代码互定位2.3 系统优化2.4 出错检测和恢复 3. MapReduce处理流程4. MapReduce编程基础参考 1. MapReduce概述 MapReduce是面向大数据并行处理的计算模型、框架和平台: 1. 基于集群的高性能并行…...

编程日记 2025/2/1 2:51:29

循环神经网络（RNN）+pytorch实现情感分析

目录一、背景引入二、网络介绍 2.1 输入层 2.2 循环层 2.3 输出层 2.4 举例 2.5 深层网络三、网络的训练 3.1 训练过程举例 1）输出层 2）循环层 3.2 BPTT 算法 1）输出层 2）循环层 3）算法流程四、循…...

编程日记 2025/2/1 2:50:27

Mac cursor设置jdk、Maven版本

基本配置 – Cursor 使用文档首先是系统用户级别的设置参数，运行cursor，按下ctrlshiftp，输入Open User Settings(JSON)，在弹出的下拉菜单中选中下面这样的： 在打开的json编辑器中追加下面的内容： {"…...

编程日记 2025/2/1 2:45:19

WPS数据分析000005

目录一、数据录入技巧二、一维表三、填充柄向下自动填充自动填充选项日期填充星期自定义自定义序列 1-10000序列四、智能填充五、数据有效性出错警告输入信息下拉列表六、记录单七、导入数据编辑八、查找录入会员功能 Xlookup函数 VL…...

编程日记 2025/2/1 2:34:57

CTF从入门到精通

文章目录背景知识CTF赛制背景知识 CTF赛制 1.web安全:通过浏览器访问题目服务器上的网站，寻找网站漏洞(sql注入，xss（钓鱼链接）,文件上传，包含漏洞，xxe，ssrf，命令执行&#xff0c…...

编程日记 2025/2/1 2:32:52

Flutter使用Flavor实现切换环境和多渠道打包

在Android开发中通常我们使用flavor进行多渠道打包，flutter开发中同样有这种方式，不过需要在原生中配置具体方案其实flutter官网个了相关示例（https://docs.flutter.dev/deployment/flavors）,我这里记录一下自己的操作 Android …...

编程日记 2025/2/1 2:29:48

Springboot如何使用面向切面编程AOP?

Springboot如何使用面向切面编程AOP? 在 Spring Boot 中使用面向切面编程（AOP）非常简单，Spring Boot 提供了对 AOP 的自动配置支持。以下是详细的步骤和示例，帮助你快速上手 Spring Boot 中的 AOP。 1. 添加依赖首先&#xff…...

编程日记 2025/2/1 2:27:43

51单片机（STC89C52）开发：点亮一个小灯

软件安装： 安装开发板CH340驱动。安装KEILC51开发软件：C51V901.exe。下载软件：PZ-ISP.exe 创建项目： 新建main.c 将main.c加入至项目中： main.c:点亮一个小灯 #include "reg52.h"sbit LED1P2^0; //P2的…...

编程日记 2025/2/1 2:26:39

基于MinIO的对象存储增删改查

MinIO是一个高性能的分布式对象存储服务。Python的minio库可操作MinIO，包括创建/列出存储桶、上传/下载/删除文件及列出文件。查看帮助信息 minio.exe --help minio.exe server --help …...

编程日记 2025/2/1 2:25:35

Ubuntu Server 安装 XFCE4桌面

Ubuntu Server没有桌面环境，一些软件有桌面环境使用起来才更加方便，所以我尝试安装桌面环境。常用的桌面环境有：GNOME、KDE Plasma、XFCE4等。这里我选择安装XFCE4桌面环境，主要因为它是一个极轻量级的桌面环境，适合内…...

编程日记 2025/2/1 2:23:29

MySQL 存储函数：数据库的自定义函数

在数据库开发中，存储函数（Stored Function）是一种非常有用的工具。它允许我们创建自定义的函数，这些函数可以在 SQL 查询中像内置函数一样使用，用于实现特定的逻辑和计算。本文将深入探讨 MySQL 存储函数的概念、与存储…...

编程日记 2025/2/1 2:22:26

代码随想录_栈与队列

栈与队列 232.用栈实现队列 232. 用栈实现队列使用栈实现队列的下列操作： push(x) – 将一个元素放入队列的尾部。 pop() – 从队列首部移除元素。 peek() – 返回队列首部的元素。 empty() – 返回队列是否为空。思路: 定义两个栈: 入队栈, 出队栈, 控制出入…...

编程日记 2025/2/1 2:18:19

【微服务与分布式实践】探索 Sentinel

参数设置熔断时长、最小请求数、最大RT ms、比例阈值、异常数熔断策略慢调⽤⽐例当单位统计时⻓内请求数⽬⼤于设置的最⼩请求数⽬，并且慢调⽤的⽐例⼤于阈值，则接下来的熔断时⻓内请求会⾃动被熔断异常⽐例当单位统计时⻓内请求数⽬⼤于设置…...

编程日记 2025/2/1 2:15:16

深入研究异常处理机制

一、原理探究 C异常处理本节内容针对 Linux 下的 C 异常处理机制，重点在于研究如何在异常处理流程中利用溢出漏洞，所以不对异常处理及 unwind 的过程做详细分析，只做简单介绍异常机制中主要的三个关键字：throw 抛出异常&#x…...

编程日记 2025/2/1 2:14:10

【memgpt】letta 课程4：基于latta框架构建MemGpt代理并与之交互

Lab 3: Building Agents with memory 基于latta框架构建MemGpt代理并与之交互理解代理状态，例如作为系统提示符、工具和agent的内存查看和编辑代理存档内存MemGPT 代理是有状态的 agents的设计思路每个步骤都要定义代理行为 Letta agents persist information over time and…...

编程日记 2025/2/1 2:13:05

讯飞智作 AI 配音技术浅析（二）：深度学习与神经网络

讯飞智作 AI 配音技术依赖于深度学习与神经网络，特别是 Tacotron、WaveNet 和 Transformer-TTS 模型。这些模型通过复杂的神经网络架构和数学公式，实现了从文本到自然语音的高效转换。一、Tacotron 模型 Tacotron 是一种端到端的语音合成模型&#xff…...

编程日记 2025/2/1 2:06:59

五年级数学知识边界总结思考-下册

目录一、背景二、过程1.观察物体小学五年级下册“观察物体”知识点详解：由来、作用与意义**一、知识点核心内容****二、知识点的由来：从生活实践到数学抽象****三、知识的作用：解决实际问题的工具****四、学习的意义：培养核心素养…...

编程新知 2025/6/20 13:47:44

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院查看报告小程序

一、开发环境准备工具安装： 下载安装DevEco Studio 4.0（支持HarmonyOS 5）配置HarmonyOS SDK 5.0确保Node.js版本≥14 项目初始化： ohpm init harmony/hospital-report-app 二、核心功能模块实现 1. 报告列表…...

编程新知 2025/7/22 6:12:57

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个生活电费的缴纳和查询小程序

一、项目初始化与配置 1. 创建项目 ohpm init harmony/utility-payment-app 2. 配置权限 // module.json5 {"requestPermissions": [{"name": "ohos.permission.INTERNET"},{"name": "ohos.permission.GET_NETWORK_INFO"…...

编程新知 2025/8/12 6:01:40

C++ 求圆面积的程序（Program to find area of a circle）

给定半径r，求圆的面积。圆的面积应精确到小数点后5位。例子： 输入：r 5 输出：78.53982 解释：由于面积 PI * r * r 3.14159265358979323846 * 5 * 5 78.53982，因为我们只保留小数点后 5 位数字。输…...

编程新知 2025/9/13 0:44:14

今日科技热点速览

🔥 今日科技热点速览 🎮 任天堂Switch 2 正式发售任天堂新一代游戏主机 Switch 2 今日正式上线发售，主打更强图形性能与沉浸式体验，支持多模态交互，受到全球玩家热捧。 🤖 人工智能持续突破 DeepSeek-R1&…...

编程新知 2025/9/13 8:59:33

QT： `long long` 类型转换为 `QString` 2025.6.5

在 Qt 中，将 long long 类型转换为 QString 可以通过以下两种常用方法实现： 方法 1：使用 QString::number() 直接调用 QString 的静态方法 number()，将数值转换为字符串： long long value 1234567890123456789LL; …...

编程新知 2025/9/2 5:40:06

【JavaWeb】Docker项目部署

引言之前学习了Linux操作系统的常见命令，在Linux上安装软件，以及如何在Linux上部署一个单体项目，大多数同学都会有相同的感受，那就是麻烦。核心体现在三点： 命令太多了，记不住软件安装包名字复杂&…...

编程新知 2025/9/12 23:22:13

如何在最短时间内提升打ctf（web)的水平？

刚刚刷完2遍 bugku 的 web 题，前来答题。每个人对刷题理解是不同，有的人是看了writeup就等于刷了，有的人是收藏了writeup就等于刷了，有的人是跟着writeup做了一遍就等于刷了，还有的人是独立思考做了一遍就等于刷了。…...

编程新知 2025/9/13 0:08:55

学习STC51单片机32（芯片为STC89C52RCRC）OLED显示屏2

每日一言今天的每一份坚持，都是在为未来积攒底气。案例：OLED显示一个A 这边观察到一个点，怎么雪花了就是都是乱七八糟的占满了屏幕。。解释 ： 如果代码里信号切换太快（比如 SDA 刚变，SCL 立刻变&#…...

编程新知 2025/9/7 8:51:23

Golang——6、指针和结构体

指针和结构体 1、指针1.1、指针地址和指针类型1.2、指针取值1.3、new和make 2、结构体2.1、type关键字的使用2.2、结构体的定义和初始化2.3、结构体方法和接收者2.4、给任意类型添加方法2.5、结构体的匿名字段2.6、嵌套结构体2.7、嵌套匿名结构体2.8、结构体的继承 3、结构体与…...

编程新知 2025/9/2 19:29:30