零基础都可以本地部署Deepseek R1
文章目录
- 一、硬件配置需求
- 二、详细部署步骤
- 1. 安装 Ollama 工具
- 2. 部署 DeepSeek-R1 模型
- 3. API使用
- 4. 配置图形化交互界面(可选)
- 5. 使用与注意事项
一、硬件配置需求
不同版本的 DeepSeek-R1 模型参数量不同,对硬件资源的要求也不尽相同。常见版本及推荐配置大致如下(仅供参考,实际需求应根据使用场景和性能预期调整):
| 模型版本 | CPU配置 | 内存要求 | 硬盘空间 | 显卡配置 | 适用场景 |
|---|---|---|---|---|---|
| DeepSeek-R1-1.5B | 最低4核(推荐Intel/AMD多核处理器) | 8GB+ | 3GB+ | 非必需(纯CPU推理),若GPU加速可选4GB+显存(如GTX 1650) | 低资源设备部署,如树莓派、旧款笔记本、嵌入式系统或物联网设备 |
| DeepSeek-R1-7B | 8核以上(推荐现代多核CPU) | 16GB+ | 8GB+ | 推荐8GB+显存(如RTX 3070/4060) | 中小型企业本地开发测试、中等复杂度NLP任务,例如文本摘要、翻译、轻量级多轮对话系统 |
| DeepSeek-R1-8B | 8核以上(推荐现代多核CPU) | 16GB+ | 8GB+ | 推荐8GB+显存(如RTX 3070/4060) | 需更高精度的轻量级任务(如代码生成、逻辑推理) |
| DeepSeek-R1-14B | 12核以上 | 32GB+ | 15GB+ | 16GB+显存(如RTX 4090或A5000) | 企业级复杂任务、长文本理解与生成 |
| DeepSeek-R1-32B | 16核以上(如AMD Ryzen 9或Intel i9) | 64GB+ | 30GB+ | 24GB+显存(如A100 40GB或双卡RTX 3090) | 高精度专业领域任务、多模态任务预处理 |
| DeepSeek-R1-70B | 32核以上(服务器级CPU) | 128GB+ | 70GB+ | 多卡并行(如2xA100 80GB或4xRTX 4090) | 科研机构/大型企业、高复杂度生成任务 |
| DeepSeek-R1-671B | 64核以上(服务器集群) | 512GB+ | 300GB+ | 多节点分布式训练(如8xA100/H100) | 超大规模AI研究、通用人工智能(AGI)探索 |
对于大多数家用或工作站级别的电脑,运行 1.5b 至 7b 版本已基本满足体验需求,而更高参数的版本则适合服务器或高端工作站使用。
二、详细部署步骤
以下介绍基于 Windows 环境的一个典型部署流程,其他系统(如 Linux 或 macOS)基本类似,主要区别在安装包和命令行工具上。
1. 安装 Ollama 工具
Ollama 是一个用于管理和运行本地大模型的命令行工具,可从其官网下载安装包。步骤如下:
-
下载
访问 Ollama 官网并选择与你操作系统匹配的版本进行下载。
-
安装
运行下载的安装程序(例如 Windows 下双击 .exe 文件),完成安装后打开 CMD 或 PowerShell,输入以下命令验证安装成功:
ollama -v若返回版本号(例如 0.5.7),则说明安装成功。

2. 部署 DeepSeek-R1 模型
-
选择模型版本
在 Ollama 官网首页或其模型库中点击左上角的 “Models”,找到 “deepseek-r1” 模型。页面中会展示多个版本(1.5b、7b、8b、14b 等),你需要根据自己的硬件配置选择合适版本。例如,若你的 GPU 为 RTX 3060 12GB,建议选用 1.5b 至 14b 版本。 -
复制运行命令
页面中会提供类似下面的命令:ollama run deepseek-r1:1.5b复制对应版本的命令。
-
下载与安装
打开 CMD 或 PowerShell,粘贴并运行上面的命令。此时工具会自动下载模型文件并安装。下载过程中注意网络状况,若下载速度较慢,可适时中断后重启命令。 -
验证模型运行
下载完成后,在同一命令行窗口中,你可以直接输入问题(例如输入“上海在哪”),若模型能够返回答案,则说明部署成功。
3. API使用
ollama API官方文档
ollama运行后默认的路径是http://localhost:11434
curl -X POST "http://localhost:11434/api/generate" \-H "Content-Type: application/json" \-d '{"model": "deepseek-r1:1.5b","prompt": "上海在哪","stream":false #如需流式返回,取消该参数默认为流式}'
{"model": "deepseek-r1:1.5b","created_at": "2025-02-08T14:13:30.203344Z","response": "\u003cthink\u003e\n\n\u003c/think\u003e\n\n上海是中国的一个直辖市,位于中国的东部沿海地区。具体位置是 longitude 121°38'东,latitude 31°25'北。它的城市、工业中心和国际都市特征使其在世界范围内拥有重要的影响力。","done": true,"done_reason": "stop","context": [151644,100633,109333,151645,151648,271,151649,271,100633,105196,104111,116866,3837,103987,105538,106565,107815,100361,1773,100398,81812,20412,20515,220,16,17,16,11616,18,23,6,67364,3837,23718,220,18,16,11616,17,20,6,48309,1773,104121,99490,5373,100159,99488,33108,99876,101478,104363,102989,18493,99489,104589,103926,100799,102484,1773],"total_duration": 1758949417,"load_duration": 570749542,"prompt_eval_count": 5,"prompt_eval_duration": 755000000,"eval_count": 57,"eval_duration": 431000000
}

\u003cthink\u003e\n\n\u003c/think\u003es其实就是和 标签,里边是思考推理的内容,比较简单的问题无需推理,所以这里为空。我们问一个相对较难的问题来试试:

如果去掉stream为false后的流式返回如下:

直到done为true,done reason为stop为止

4. 配置图形化交互界面(可选)
虽然直接在命令行中对话已经能验证模型运行,但为了更友好地交互,你可以安装图形化界面工具:
-
下载 Chatbox:访问 Chatbox 官网 下载并安装该软件。
-
在 Chatbox 的设置中,选择使用本地模型,并将模型提供方设置为 Ollama API;在模型列表中选择你刚安装的 DeepSeek-R1 模型即可。

然后即可对话

5. 使用与注意事项
-
每次使用时:若需要使用模型,只需先启动 Ollama(通常在安装时会自动后台运行),然后通过命令行或图形界面调用模型。你可以使用命令
ollama list查看已安装的模型列表,并通过ollama run <模型名称>重新启动对话会话。 -
资源消耗:注意大模型运行时对 CPU、内存和 GPU 的负载较高,建议在使用过程中避免同时进行高负载任务。
-
升级与卸载
如果以后不再使用模型,需要按照相关说明清理模型文件和环境变量,避免占用过多磁盘空间。
相关文章:
零基础都可以本地部署Deepseek R1
文章目录 一、硬件配置需求二、详细部署步骤1. 安装 Ollama 工具2. 部署 DeepSeek-R1 模型3. API使用4. 配置图形化交互界面(可选)5. 使用与注意事项 一、硬件配置需求 不同版本的 DeepSeek-R1 模型参数量不同,对硬件资源的要求也不尽相同。…...
掌握Spring @SessionAttribute:跨请求数据共享的艺术
SessionAttribute注解在Spring中的作用,就像是一个“数据中转站”。 在Web应用中,我们经常需要在多个请求之间共享数据。比如,用户登录后,我们需要在多个页面或请求中保持用户的登录状态。这时,SessionAttribute注解就…...
视频采集卡接口
采集卡的正面有MIC IN、LINE IN以及AUDIO OUT三个接口, MIC IN为麦克风输入,我们如果要给采集到的视频实时配音或者是在直播的时候进行讲解,就可以在这里插入一个麦克风, LINE IN为音频线路输入,可以外接播放背景音乐…...
64【32与64位程序的区别】
很多人可能有一个观念,那就是64位的程序NB,有技术含量,但是要说nb在哪,很多人又说不上来,本节来对这个问题做一个探讨 下图中左边的是加载的64程序,右边的是32位程序, 在上一节课我们已经理解…...
ai智能DeepSeek 在 Cursor 中的配置与应用实践
DeepSeek 是一款高效的深度搜索引擎,能够为开发者提供更智能、更精准的搜索体验。在数据量大、查询复杂的场景中,DeepSeek 能够帮助提升查询的响应速度和精确度。本文将介绍 DeepSeek 在 Cursor 中的配置与应用,帮助开发者理解如何在实际开发…...
Deepseek的起源与发展
文章目录 前言一、Deepseek的起源二、DeepSeek的发展脉络三、Deepseek的突破与优势(1)功能强大:核心能力与应用场景(2)性能优势:效率与效果的革命性提升四、Deepseek开源引发关注前言 DeepSeek 在网络安全领域带来的新机遇,DeepSeek 从崭露头角到引领 AI 领域的重大变革,已…...
ubuntu conda运行kivy时报“No matching FB config found”
错误描述:本人使用ubuntu自带的python环境运行kivy是没有问题的,就是在使用conda时发生了错误,去网上寻找报错原因,却一直没有头绪(这个问题有诸多问题导致的,不敢说用我的这个方法100%能好) 1…...
1-1二分查找
二分查找 1 基础版1.1 算法描述1.2 算法流程图1.3 算法实现1.3.1 Java实现 2 改动版2.1 算法描述2.2 算法流程图2.3 算法实现2.3.1 Java实现 2.4 改进点分析2.4.1 区间定义差异2.4.2 核心改进原理2.4.3 数学等价性证明 3 平衡版3.1 算法描述3.2 算法流程图3.3 算法实现3.3.1 Ja…...
【如何掌握CSP-J 信奥赛中的深搜算法】
CSP-J 信奥赛中的深搜(深度优先搜索)算法是一个重要知识点,以下是一些学习深搜算法的建议: 理解基础概念 定义与原理:深度优先搜索是一种用于遍历或搜索图、树等数据结构的算法。它从起始节点开始,沿着一条…...
Unity笔试常考
线程同步的几种方式 1.信号量pv操作 2.互斥加锁 3.条件变量 五层网络协议指的是哪五层 1.应用层 2.运输层 3.网络层 4.链路层 5.物理层 TCP和UDP区别 tcp 面向连接,保证发送顺序,速度慢,必须在线,三次握手,4次挥手…...
知识图谱智能应用系统:基于人工智能的知识提取架构
在知识图谱智能应用系统中,知识提取是将非结构化数据(如文本、文档)转化为结构化知识的关键步骤。通过人工智能技术,系统能够自动识别文本中的实体、关系、属性和事件,并将其转化为可用于知识图谱构建的三元组数据。以下是对知识提取架构的详细描述,包括环境准备、数据标…...
Qt:Qt基础介绍
目录 Qt背景介绍 什么是Qt Qt的发展史 Qt支持的平台 Qt版本 Qt的优点 Qt的应用场景 Qt的成功案例 Qt的发展前景及就业分析 Qt背景介绍 什么是Qt Qt是⼀个跨平台的C图形用户界面应用程序框架。它为应用程序开发者提供了建立艺术级图形界面所需的所有功能。它是完全面向…...
【deepSeek R1】Ollama 更改模型安装位置 以及应用安装位置
【deepSeek R1】Ollama 更改模型安装位置 以及应用安装位置 本地版部署deepSeek R1 可以参考文章 3分钟教你搭建属于自己的本地大模型 DeepSeek R1 Ollama 是一个开源工具,旨在帮助用户轻松在本地计算机上运行、部署和管理大型语言模型(LLMs)…...
让office集成deepseek,支持office和WPS办公软件!(体验感受)
导读 AIGC:AIGC是一种新的人工智能技术,它的全称是Artificial Intelligence Generative Content,即人工智能生成内容。 它是一种基于机器学习和自然语言处理的技术,能够自动产生文本、图像、音频等多种类型的内容。这些内容可以是新闻文章、…...
DKG(Distributed Key Generation)协议
一、DKG是什么 DKG(分布式密钥生成)提供了一种去中心化的方法,使各个参与方在不相互信任的情况下生成共享密钥,以确保安全通信和多方参与的机密性。 DKG技术的关键思想是使用多方计算(secure multiparty computation)和秘钥共享(secret sharing)的概念。 秘钥共享 则…...
动态规划问题——青蛙跳台阶案例分析
问题描述: 一只青蛙要跳上n级台阶,它每次可以跳 1级或者2级。问:青蛙有多少种不同的跳法可以跳完这些台阶? 举个例子: 假设台阶数 n 3 ,我们来看看青蛙有多少种跳法。 可能的跳法: 1. 跳1级…...
Spring(26) spring-security-oauth2 官方表结构解析
目录 一、什么是 spring-security-oauth2?二、spring-security-oauth2 的表结构2.1 oauth_client_details 客户端详细信息表2.2 oauth_access_token 认证授权Token记录表2.3 oauth_refresh_token 刷新授权Token记录表2.4 oauth_code 授权Code记录表 一、什么是 spri…...
MySQL 数据库编程-C++
目录 1 数据库基本知识 1.1 MYSQL常见命令 1.2 SQL注入 1.3 ORM框架 1 数据库基本知识 MySQL 为关系型数据库(Relational Database Management System), 这种所谓的"关系型"可以理解为"表格"的概念, 一个关系型数据库由一个或数个表格组成:…...
【大数据技术】搭建完全分布式高可用大数据集群(Flume)
搭建完全分布式高可用大数据集群(Flume) apache-flume-1.11.0-bin.tar.gz注:请在阅读本篇文章前,将以上资源下载下来。 写在前面 本文主要介绍搭建完全分布式高可用集群 Flume 的详细步骤。 注意: 统一约定将软件安装包存放于虚拟机的/software目录下,软件安装至/opt目…...
疯狂前端面试题(二)
一、Webpack的理解 Webpack 是一个现代 JavaScript 应用程序的静态模块打包工具。Webpack 能够将各种资源(JavaScript、CSS、图片、字体等)视为模块,并通过依赖关系图将这些模块打包成一个或多个最终的输出文件(通常是一个或几个…...
kafka专栏解读
kafka专栏文章的编写将根据kafka架构进行编写,即先编辑kafka生产者相关的内容,再编写kafka服务端的内容(这部分是核心,内容较多,包含kafka分区管理、日志存储、延时操作、控制器、可靠性等),最后…...
深入探究 C++17 std::is_invocable
文章目录 一、引言二、std::is_invocable 概述代码示例输出结果 三、std::is_invocable 的工作原理简化实现示例 四、std::is_invocable 的相关变体1. std::is_invocable_r2. std::is_nothrow_invocable 和 std::is_nothrow_invocable_r 五、使用场景1. 模板元编程2. 泛型算法 …...
OpenCV:图像修复
目录 简述 1. 原理说明 1.1 Navier-Stokes方法(INPAINT_NS) 1.2 快速行进方法(INPAINT_TELEA) 2. 实现步骤 2.1 输入图像和掩膜(Mask) 2.2 调用cv2.inpaint()函数 2.3 完整代码示例 2.4 运行结果 …...
【项目日记(四)】thread cache 层
前言 前面我们对整个项目的框架进行了介绍,本期开始我们将进行第一层线程缓存层(thread cache)的详细介绍与实现。 目录 前言 一、thread cache 的整体设计 二、内存对齐规则和哈希映射关系 2.1 如何对齐? 2.2 这样设计对齐规则的好处?…...
人工智能图像分割之Mask2former源码解读
环境搭建: (1)首先本代码是下载的mmdetection-2022.9的,所以它的版本要配置好,本源码配置例如mmcv1.7,python3.7,pytorch1.13,cuda11.7。pytorch与python,cuda版本匹配可参考:https://www.jb51.net/python/3308342lx.htm。 (2)还有一个是先要安装一个vs2022版本或…...
uniapp 编译生成鸿蒙正式app步骤
1,在最新版本DevEco-Studio工具新建一个空项目并生成p12和csr文件(构建-生成私钥和证书请求文件) 2,华为开发者平台 根据上面生成的csr文件新增cer和p7b文件,分发布和测试 3,在最新版本DevEco-Studio工具 文…...
2024最新版Java面试题及答案,【来自于各大厂】
发现网上很多Java面试题都没有答案,所以花了很长时间搜集整理出来了这套Java面试题大全~ 篇幅限制就只能给大家展示小册部分内容了,需要完整版的及Java面试宝典小伙伴点赞转发,关注我后在【翻到最下方,文尾点击名片】即可免费获取…...
Excel 融合 deepseek
效果展示 代码实现 Function QhBaiDuYunAIReq(question, _Optional Authorization "Bearer ", _Optional Qhurl "https://qianfan.baidubce.com/v2/chat/completions")Dim XMLHTTP As ObjectDim url As Stringurl Qhurl 这里替换为你实际的URLDim postD…...
【填坑】新能源汽车三电设计之常用半导体器件系统性介绍
# 在新能源汽车的三电(电池、电机、电控)系统中,半导体器件扮演着至关重要的角色。它们如同系统的“大脑”和“神经末梢”,精确地控制着电能的流向与转换,确保新能源汽车高效、稳定且安全地运行。今天,就让…...
SpringCloud面试题----Nacos和Eureka的区别
功能特性 服务发现 Nacos:支持基于 DNS 和 RPC 的服务发现,提供了更为灵活的服务发现机制,能满足不同场景下的服务发现需求。Eureka:主要基于 HTTP 的 RESTful 接口进行服务发现,客户端通过向 Eureka Server 发送 HT…...
