当前位置：首页 > news >正文

全流程安装DeepSeek开源模型

news 2026/2/9 5:01:54

配置要求

我的电脑配置为：

CPU：i7 12代
GPU：3080
内存：32g
磁盘：1T

以上配置运行情况：

运行ollama run deepseek-r1:7b模型无压力，CPU/GPU使用率在 10% 左右。
运行ollama run deepseek-r1:32b模型输出明显变慢，大概 1 秒 2 ~4个 Token，CPU/GPU使用率在 70% 左右。

ChatGpt给出的部署推荐配置如下：

1. DeepSeek-R1 系列（轻量级部署）

适用于个人开发者、小型研究团队或资源有限的服务器。

模型版本	参数量	显存需求	推荐配置
DeepSeek-R1-1.5B	1.5B	8GB+	RTX 3060 (12GB) / RTX 4060 Ti (16GB)
DeepSeek-R1-7B	7B	24GB+	RTX 3090 / 4090 (24GB) / A6000 (48GB)
DeepSeek-R1-14B	14B	40GB+	RTX 4090 (24GB, 量化后可跑) / A100 (40GB)
DeepSeek-R1-32B	32B	80GB+	A100 80GB / H100 (80GB)
DeepSeek-R1-70B	70B	128GB+	2×A100 80GB (或更大GPU集群)

建议：

7B及以下的模型可以在高端消费级显卡上运行（如4090），但需要使用 4-bit/8-bit 量化降低显存占用（可用
bitsandbytes）。
14B以上的模型推荐使用专业级显卡（A100, H100），或者多卡并行方案。

2. DeepSeek-V3 系列（高性能部署）

适用于企业、学术机构或大规模推理应用。

模型版本	参数量	显存需求	推荐配置
DeepSeek-V3 (37B 激活参数)	37B	128GB+	A100 80GB ×2 / H100 80GB
DeepSeek-V3 (671B 总参数)	671B	1.5TB+	H100 80GB ×16+ (或更大GPU集群)

建议：

DeepSeek-V3 37B 可以在多张 A100 80GB 上运行（如 2×A100 80GB），建议采用 TPU 或多卡并行（FSDP, ZeRO）进行优化。
DeepSeek-V3 671B 需要云端或超算集群，适用于数据中心或高端AI研究实验室。

实测 3080的 gpu也可以运行 32b模型，只是输出会慢一些，大概 1 秒 2 ~4个 Token。

安装Ollama

安装DeepSeek首先需要安装一个Ollama，这个软件相当于运行DeepSeek模型的底层，没有这个底层就没办法跑DeepSeek AI模型。

下载地址：

https://ollama.com/

点击下载windows版本：

在这里插入图片描述

点击Install

在这里插入图片描述
默认在c盘，不能修改，需要5G的磁盘大小。

安装好了以后在开始菜单可以查看有没有Ollama应用
在这里插入图片描述

选择大模型

直接命令安装：

DeepSeek提供的模型如下

版本：1.5b，适用于一般文字编辑使用（需要1.1GB空余空间）
ollama run deepseek-r1:1.5b版本：7b，DeepSeek的第一代推理模型，性能与OpenAl-01相当，包括从基于Llama和Qwen的DeepSeek-R1中提取的六个密集模型（需要
4.7GB空余空间）
ollama run deepseek-r1:7b版本：8b，（需要4.9GB空余空间）
ollama run deepseek-r1:8b版本：14b，（需要9GB空余空间）
ollama run deepseek-r1:14b版本：32b，（需要20GB空余空间）
ollama run deepseek-r1:32b版本：70b，（需要43GB空余空间）
ollama run deepseek-r1:70b版本：671b，（需要404GB空余空间）
ollama run deepseek-r1:671b

官网选择模型：

打开地址：

https://ollama.com/search

选择Models

在这里插入图片描述

选择deepseek-r1模型，左侧选择模型参数，右侧复制安装命令

在这里插入图片描述

安装大模型

打开终端，如果选择复制7b版本，可以复制如下命令：

ollama run deepseek-r1:7b

在终端内执行

在这里插入图片描述

等待下载完成

在这里插入图片描述

下载结束之后就有一小会儿出现【verifying sha256 digest】，是在检查完整性之类的东西，请耐心等待（模型越大等待时间越长）

在这里插入图片描述
成功之后会提示success

对话

安装成功后会可以直接输入问题按回车提问。

在这里插入图片描述
当然，终端的展示效果还是不太好，这时候就需要安装一下openWebUi，需要docker环境，如果没有安装docker的安装一个docker。

终端执行以下命令：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

在这里插入图片描述

等待docker启动成功

在这里插入图片描述

安装完成后通过如下地址访问openWebUi：

http://localhost:3000

在这里插入图片描述

第一次进入需要设置一下管理员的账号密码。
在这里插入图片描述
随后进入主页，左侧会展示当前我们运行的模型。然后你就可以尽情的问他了。

备注

查看当前本地ollama有的模型命令：

ollama list

在这里插入图片描述
运行已有模型命令：

ollama run 模型名称

示例：

>ollama run deepseek-r1:7b

在这里插入图片描述

可供下载的模型：

版本：1.5b，适用于一般文字编辑使用（需要1.1GB空余空间）
ollama run deepseek-r1:1.5b版本：7b，DeepSeek的第一代推理模型，性能与OpenAl-01相当，包括从基于Llama和Qwen的DeepSeek-R1中提取的六个密集模型（需要
4.7GB空余空间）
ollama run deepseek-r1:7b版本：8b，（需要4.9GB空余空间）
ollama run deepseek-r1:8b版本：14b，（需要9GB空余空间）
ollama run deepseek-r1:14b版本：32b，（需要20GB空余空间）
ollama run deepseek-r1:32b版本：70b，（需要43GB空余空间）
ollama run deepseek-r1:70b版本：671b，（需要404GB空余空间）
ollama run deepseek-r1:671b

全流程安装DeepSeek开源模型

目录配置要求安装Ollama选择大模型安装大模型对话备注配置要求我的电脑配置为： CPU：i7 12代 GPU：3080 内存：32g 磁盘：1T以上配置运行情况： 运行ollama run deepseek-r1:7b模型无压力，CPU/…...

编程日记 2025/2/9 16:39:23

人工智能领域-CNN 卷积神经网络性能调优

在自动驾驶领域，对卷积神经网络（CNN）进行性能调优至关重要，以下从数据处理、模型架构、训练过程、超参数调整和模型部署优化等多个方面为你详细介绍调优方法，并给出相应的代码示例。 1. 数据处理数据增强&#xff1…...

编程日记 2025/2/9 16:38:19

人工智能A*算法与CNN结合- CNN 增加卷积层的数量，并对卷积核大小进行调整

以下是一个增强版的将 A* 算法与卷积神经网络（CNN）结合的代码实现，其中 CNN 增加了卷积层的数量，并对卷积核大小进行了调整。整体思路依然是先利用 A* 算法生成训练数据，再用这些数据训练 CNN 模型，最后使用…...

编程日记 2025/2/9 16:37:16

机器学习中常用的评价指标

一、分类任务常用指标 1. 准确率（Accuracy） 定义：正确预测样本数占总样本数的比例。优点：直观易懂，适用于类别平衡的数据。缺点：对类别不平衡数据敏感（如欺诈检测中99%的负样本）。…...

编程日记 2025/2/9 16:34:13

Windows安装cwgo，一直安装的是linux平台的

Windows安装cwgo，一直安装的是linux平台的查看 go env ，发现 GOOSlinux 临时修改 GOOS ，set GOOSwindows ，再安装。此时，安装的就是 windows 的可执行文件。安装之后再将 GOOS 修改回来即可。...

编程日记 2025/2/9 16:30:07

GitHub Pages + Jekyll 博客搭建指南(静态网站)

目录 🚀 静态网站及其生成工具指南🌍 什么是静态网站？📌 静态网站的优势⚖️ 静态网站 VS 动态网站 🚀 常见的静态网站生成器对比🛠️ 使用 GitHub Pages Jekyll 搭建个人博客📌 1. 创建 GitHu…...

编程日记 2025/2/9 16:29:05

21.[前端开发]Day21-HTML5新增内容-CSS函数-BFC-媒体查询

王者荣耀-网页缩小的问题处理为什么会产生这个问题？怎么去解决可以给body设置最小宽度 1 HTML5新增元素 HTML5语义化元素 HTML5其他新增元素 2 Video、Audio元素 HTML5新增元素 - video video支持的视频格式 video的兼容性写法 HTML5新增元素 - audio audio…...

编程日记 2025/2/9 16:28:03

C++SLT（五）——list

目录一、list的介绍二、list的使用list的定义方式三、list的插入和删除push_back和pop_backpush_front和pop_frontinserterase 四、list的迭代器使用五、list的元素获取六、list的大小控制七、list的操作函数sort和reversemergeremoveremove_ifuniqueassignswap 一、list的介…...

编程日记 2025/2/9 16:22:56

网络安全ITP是什么网络安全产品ips

DS/IPS都是专门针对计算机病毒和黑客入侵而设计的网络安全设备 1、含义不同 IDS ：入侵检测系统（发现非法入侵只能报警不能自己过滤） 做一个形象的比喻：假如防火墙是一幢大楼的门锁，那么IDS就是这幢大楼里的监视系统…...

编程日记 2025/2/9 16:20:54

评估大模型（LLM）摘要生成能力：方法、挑战与策略

大语言模型（LLMs）有着强大的摘要生成能力，为信息快速提取和处理提供了便利。从新闻文章的快速概览到学术文献的要点提炼，LLMs 生成的摘要广泛应用于各个场景。然而，准确评估这些摘要的质量却颇具挑战。如何确定一个摘要…...

编程日记 2025/2/9 16:19:53

《PYTHON语言程序设计》(2018版)1.20修改这道题，利用类的方式(二) 接近成功....(上)

在类的外面建立4个顶点 turtle.speed(20)ran1_x1 random.randint(-69, -60) ran1_y1 random.randint(-5, 10) ran1_x2 random.randint(-69, -60) ran1_y2 random.randint(75, 80) ran1_x3 random.randint(79, 90) ran1_y3 random.randint(70, 85) ran1_x4 random.randin…...

编程日记 2025/2/9 16:16:50

USB子系统学习（四）使用libusb读取鼠标数据

文章目录 1、声明2、HID协议2.1、描述符2.2、鼠标数据格式 3、应用程序4、编译应用程序5、测试 1、声明本文是在学习韦东山《驱动大全》USB子系统时，为梳理知识点和自己回看而记录，全部内容高度复制粘贴。韦老师的《驱动大全》：商品详情 …...

编程日记 2025/2/9 16:15:49

【产品小白】用户调研的需求是否都采纳？

在用户调研中，并非所有需求都应被直接采纳，而应通过系统分析转化为符合产品战略的有效决策。以下是关键思考框架： 1. 用户需求 ≠ 产品需求矛盾性：用户个体需求可能相互冲突（如A功能的去留），需…...

编程日记 2025/2/9 16:12:46

软件测试就业

文章目录 2.6 初识一、软件测试理论二、软件的生产过程三、软件测试概述四、软件测试目的五、软件开发与软件测试的区别？六、学习内容 2.7 理解一、软件测试的定义二、软件测试的生命周期三、软件测试的原则四、软件测试分类五、软件的开发与测试模型1.软件开发模型…...

编程日记 2025/2/9 16:08:39

qt部分核心机制

作业 1> 手动将登录项目实现，不要使用拖拽编程并且，当点击登录按钮时，后台会判断账号和密码是否相等，如果相等给出登录成功的提示，并且关闭当前界面，发射一个跳转信号，如果登录失败&#…...

编程日记 2025/2/9 16:07:38

【RocketMQ】RocketMq之ConsumeQueue深入研究

目录一：RocketMq 整体文件存储介绍二：ConsumeQueue 的文件结构三：ConsumeQueue 写入和查询流程一：RocketMq 整体文件存储介绍存储⽂件主要分为三个部分： CommitLog：存储消息的元数据。所有消息都会…...

编程日记 2025/2/9 16:04:32

如今物联网的快速发展对hmi的更新有哪些积极影响

一、功能更加丰富物联网的快速发展使得 HMI（人机界面）能够连接更多的设备和系统，从而实现更加丰富的功能。例如，通过与传感器网络的连接，HMI 可以实时显示设备的运行状态、环境参数等信息，为用户提供更加…...

编程日记 2025/2/9 16:03:29

linux 性能60秒分析

linux 60秒分析需要运行的工具是 1、uptime 2、dmesg | tail 3、vmstat 1 4、mpstat -P ALL 1 5、pidstat 1 6、iostat -xz 1 7、free -m 8、sar -n DEV 1 9、sar -n TCP,ETCP 1 10、topuptime 快速检查平均负载 [rootaaaaaa ~]# uptime15:17:20 up 3 days, 14 min, 7 us…...

编程日记 2025/2/9 16:02:28

Redisson全面解析:从使用方法到工作原理的深度探索

文章目录写在文章开头详解Redisson基本数据类型基础配置字符串操作列表操作映射集阻塞队列延迟队列更多关于Redisson详解Redisson 中的原子类详解redisson中的发布订阅模型小结参考写在文章开头 Redisson是基于原生redis操作指令上进一步的封装，屏蔽了redis数据结构的实现细…...

编程日记 2025/2/9 16:01:27

neo4j-解决导入数据后出现：Database ‘xxxx‘ is unavailable. Run :sysinfo for more info.

目录问题描述解决方法重新导入问题描述最近在linux上部署了neo4j，参照之前写的博客:neo4j-数据的导出和导入_neo4j数据导入导出-CSDN博客进行了数据导出、导入操作。但是在进行导入后，重新登录网页版neo4j，发现对应的数据库状态变…...

编程日记 2025/2/9 16:00:26

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造，完美适配AGV和无人叉车。同时，集成以太网与语音合成技术，为各类高级系统（如MES、调度系统、库位管理、立库等）提供高效便捷的语音交互体验。 L…...

编程新知 2026/2/8 4:23:14

接口测试中缓存处理策略

在接口测试中，缓存处理策略是一个关键环节，直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性，避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明： 一、缓存处理的核…...

编程新知 2026/2/8 4:37:27

未来机器人的大脑：如何用神经网络模拟器实现更智能的决策？

编辑：陈萍萍的公主一点人工一点智能未来机器人的大脑：如何用神经网络模拟器实现更智能的决策？RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战，在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…...

编程新知 2026/2/7 23:18:28

MFC内存泄露

1、泄露代码示例 void X::SetApplicationBtn() {CMFCRibbonApplicationButton* pBtn GetApplicationButton();// 获取 Ribbon Bar 指针// 创建自定义按钮CCustomRibbonAppButton* pCustomButton new CCustomRibbonAppButton();pCustomButton->SetImage(IDB_BITMAP_Jdp26)…...

编程新知 2026/1/22 15:14:25

CMake基础：构建流程详解

目录 1.CMake构建过程的基本流程 2.CMake构建的具体步骤 2.1.创建构建目录 2.2.使用 CMake 生成构建文件 2.3.编译和构建 2.4.清理构建文件 2.5.重新配置和构建 3.跨平台构建示例 4.工具链与交叉编译 5.CMake构建后的项目结构解析 5.1.CMake构建后的目录结构 5.2.构…...

编程新知 2026/2/2 7:39:34

深入解析C++中的extern关键字：跨文件共享变量与函数的终极指南

🚀 C extern 关键字深度解析：跨文件编程的终极指南 📅 更新时间：2025年6月5日 🏷️ 标签：C | extern关键字 | 多文件编程 | 链接与声明 | 现代C 文章目录前言🔥一、extern 是什么？&…...

编程新知 2026/2/1 6:50:07

人机融合智能 | “人智交互”跨学科新领域

本文系统地提出基于“以人为中心AI(HCAI)”理念的人-人工智能交互(人智交互)这一跨学科新领域及框架,定义人智交互领域的理念、基本理论和关键问题、方法、开发流程和参与团队等,阐述提出人智交互新领域的意义。然后,提出人智交互研究的三种新范式取向以及它们的意义。最后,总结…...

编程新知 2026/1/25 13:33:35

Ubuntu系统复制（U盘-电脑硬盘）

所需环境电脑自带硬盘：1块 (1T) U盘1：Ubuntu系统引导盘（用于“U盘2”复制到“电脑自带硬盘”） U盘2：Ubuntu系统盘（1T，用于被复制） ！！！建议“电脑…...

编程新知 2026/2/7 17:43:28

车载诊断架构 --- ZEVonUDS（J1979-3）简介第一篇

我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：做到欲望极简，了解自己的真实欲望，不受外在潮流的影响，不盲从，不跟风。把自己的精力全部用在自己。一是去掉多余，凡事找规律，基础是诚信；二是…...

编程新知 2026/1/26 21:09:29

Java数组Arrays操作全攻略

Arrays类的概述 Java中的Arrays类位于java.util包中，提供了一系列静态方法用于操作数组（如排序、搜索、填充、比较等）。这些方法适用于基本类型数组和对象数组。常用成员方法及代码示例排序（sort） 对数组进行升序…...

编程新知 2026/1/22 13:36:20

目录

配置要求

安装Ollama

选择大模型

安装大模型

对话

备注

相关文章：