当前位置: 首页 > news >正文

零基础都可以本地部署Deepseek R1

文章目录

    • 一、硬件配置需求
    • 二、详细部署步骤
      • 1. 安装 Ollama 工具
      • 2. 部署 DeepSeek-R1 模型
      • 3. API使用
      • 4. 配置图形化交互界面(可选)
      • 5. 使用与注意事项

一、硬件配置需求

不同版本的 DeepSeek-R1 模型参数量不同,对硬件资源的要求也不尽相同。常见版本及推荐配置大致如下(仅供参考,实际需求应根据使用场景和性能预期调整):

模型版本CPU配置内存要求硬盘空间显卡配置适用场景
DeepSeek-R1-1.5B最低4核(推荐Intel/AMD多核处理器)8GB+3GB+非必需(纯CPU推理),若GPU加速可选4GB+显存(如GTX 1650)低资源设备部署,如树莓派、旧款笔记本、嵌入式系统或物联网设备
DeepSeek-R1-7B8核以上(推荐现代多核CPU)16GB+8GB+推荐8GB+显存(如RTX 3070/4060)中小型企业本地开发测试、中等复杂度NLP任务,例如文本摘要、翻译、轻量级多轮对话系统
DeepSeek-R1-8B8核以上(推荐现代多核CPU)16GB+8GB+推荐8GB+显存(如RTX 3070/4060)需更高精度的轻量级任务(如代码生成、逻辑推理)
DeepSeek-R1-14B12核以上32GB+15GB+16GB+显存(如RTX 4090或A5000)企业级复杂任务、长文本理解与生成
DeepSeek-R1-32B16核以上(如AMD Ryzen 9或Intel i9)64GB+30GB+24GB+显存(如A100 40GB或双卡RTX 3090)高精度专业领域任务、多模态任务预处理
DeepSeek-R1-70B32核以上(服务器级CPU)128GB+70GB+多卡并行(如2xA100 80GB或4xRTX 4090)科研机构/大型企业、高复杂度生成任务
DeepSeek-R1-671B64核以上(服务器集群)512GB+300GB+多节点分布式训练(如8xA100/H100)超大规模AI研究、通用人工智能(AGI)探索

对于大多数家用或工作站级别的电脑,运行 1.5b 至 7b 版本已基本满足体验需求,而更高参数的版本则适合服务器或高端工作站使用。

二、详细部署步骤

以下介绍基于 Windows 环境的一个典型部署流程,其他系统(如 Linux 或 macOS)基本类似,主要区别在安装包和命令行工具上。

1. 安装 Ollama 工具

Ollama 是一个用于管理和运行本地大模型的命令行工具,可从其官网下载安装包。步骤如下:

  • 下载

    访问 Ollama 官网并选择与你操作系统匹配的版本进行下载。

  • 安装

    运行下载的安装程序(例如 Windows 下双击 .exe 文件),完成安装后打开 CMD 或 PowerShell,输入以下命令验证安装成功:

    ollama -v
    

    若返回版本号(例如 0.5.7),则说明安装成功。

    在这里插入图片描述

2. 部署 DeepSeek-R1 模型

  • 选择模型版本
    在 Ollama 官网首页或其模型库中点击左上角的 “Models”,找到 “deepseek-r1” 模型。页面中会展示多个版本(1.5b、7b、8b、14b 等),你需要根据自己的硬件配置选择合适版本。例如,若你的 GPU 为 RTX 3060 12GB,建议选用 1.5b 至 14b 版本。

  • 复制运行命令
    页面中会提供类似下面的命令:

    ollama run deepseek-r1:1.5b
    

    复制对应版本的命令。

  • 下载与安装
    打开 CMD 或 PowerShell,粘贴并运行上面的命令。此时工具会自动下载模型文件并安装。下载过程中注意网络状况,若下载速度较慢,可适时中断后重启命令。

  • 验证模型运行
    下载完成后,在同一命令行窗口中,你可以直接输入问题(例如输入“上海在哪”),若模型能够返回答案,则说明部署成功。

    在这里插入图片描述

3. API使用

ollama API官方文档

ollama运行后默认的路径是http://localhost:11434

curl -X POST "http://localhost:11434/api/generate" \-H "Content-Type: application/json" \-d '{"model": "deepseek-r1:1.5b","prompt": "上海在哪","stream":false #如需流式返回,取消该参数默认为流式}'
{"model": "deepseek-r1:1.5b","created_at": "2025-02-08T14:13:30.203344Z","response": "\u003cthink\u003e\n\n\u003c/think\u003e\n\n上海是中国的一个直辖市,位于中国的东部沿海地区。具体位置是 longitude 121°38'东,latitude 31°25'北。它的城市、工业中心和国际都市特征使其在世界范围内拥有重要的影响力。","done": true,"done_reason": "stop","context": [151644,100633,109333,151645,151648,271,151649,271,100633,105196,104111,116866,3837,103987,105538,106565,107815,100361,1773,100398,81812,20412,20515,220,16,17,16,11616,18,23,6,67364,3837,23718,220,18,16,11616,17,20,6,48309,1773,104121,99490,5373,100159,99488,33108,99876,101478,104363,102989,18493,99489,104589,103926,100799,102484,1773],"total_duration": 1758949417,"load_duration": 570749542,"prompt_eval_count": 5,"prompt_eval_duration": 755000000,"eval_count": 57,"eval_duration": 431000000
}

在这里插入图片描述

\u003cthink\u003e\n\n\u003c/think\u003es其实就是 标签,里边是思考推理的内容,比较简单的问题无需推理,所以这里为空。我们问一个相对较难的问题来试试:

在这里插入图片描述

如果去掉stream为false后的流式返回如下:

在这里插入图片描述

直到done为true,done reason为stop为止

在这里插入图片描述

4. 配置图形化交互界面(可选)

虽然直接在命令行中对话已经能验证模型运行,但为了更友好地交互,你可以安装图形化界面工具:

  • 下载 Chatbox:访问 Chatbox 官网 下载并安装该软件。

  • 在 Chatbox 的设置中,选择使用本地模型,并将模型提供方设置为 Ollama API;在模型列表中选择你刚安装的 DeepSeek-R1 模型即可。
    在这里插入图片描述

    然后即可对话

在这里插入图片描述

5. 使用与注意事项

  • 每次使用时:若需要使用模型,只需先启动 Ollama(通常在安装时会自动后台运行),然后通过命令行或图形界面调用模型。你可以使用命令 ollama list 查看已安装的模型列表,并通过 ollama run <模型名称> 重新启动对话会话。

  • 资源消耗:注意大模型运行时对 CPU、内存和 GPU 的负载较高,建议在使用过程中避免同时进行高负载任务。

  • 升级与卸载

    如果以后不再使用模型,需要按照相关说明清理模型文件和环境变量,避免占用过多磁盘空间。

相关文章:

零基础都可以本地部署Deepseek R1

文章目录 一、硬件配置需求二、详细部署步骤1. 安装 Ollama 工具2. 部署 DeepSeek-R1 模型3. API使用4. 配置图形化交互界面&#xff08;可选&#xff09;5. 使用与注意事项 一、硬件配置需求 不同版本的 DeepSeek-R1 模型参数量不同&#xff0c;对硬件资源的要求也不尽相同。…...

通过Ollama本地部署DeepSeek R1以及简单使用的教程(超详细)

本文介绍了在Windows环境下&#xff0c;通过Ollama来本地部署DeepSeek R1。该问包含了Ollama的下载、安装、安装目录迁移、大模型存储位置修改、下载DeepSeek以及通过Web UI来对话等相关内容。 1、&#x1f947;下载Ollama 首先我们到Ollama官网去下载安装包&#xff0c;此处我…...

css实现长尾箭头(夹角小于45度的)

1. 长尾夹角小于45度的箭头 代码 //h5<div class"singleArrow"></div>//css .singleArrow {width: 150px;height: 1px;position: relative;background-color: #15ff00;/* transform: rotate(-40deg); */ /* 旋转角度 */}.singleArrow::after{ // 成品-有…...

封装descriptions组件,描述,灵活

效果 1、组件1&#xff0c;dade-descriptions.vue <template><table><tbody><slot></slot></tbody> </table> </template><script> </script><style scoped>table {width: 100%;border-collapse: coll…...

OC-Block

关于OC中的block作为属性时&#xff0c;为什么要要用copy修饰 property (nonatomic, copy) void (^completionBlock)(void);很多文章包括AI都会给出类似结论 Block 默认分配在栈上&#xff0c;如果没有 copy&#xff0c;当方法退出后&#xff0c;Block 会被销毁。使用 copy 修…...

关于知识蒸馏的概念原理以及常见方法

1. 概念与原理 知识蒸馏的基本定义 知识蒸馏(Knowledge Distillation) 是一种将模型压缩与迁移学习结合的技术:它利用预先训练好的大模型(通常参数量大、精度高、计算开销大)指导一个更轻量(参数量小、推理速度快)的学生模型进行训练,从而在保持模型精度的同时显著减少…...

C++轻量级桌面GUI库FLTK

C轻量级桌面GUI库FLTK Screenshots - Fast Light Toolkit (FLTK) 这里写个备忘录,可以参考一下....

C++20导出模块及使用

1.模块声明 .ixx文件为导入模块文件 math_operations.ixx export module math_operations;//模块导出 //导出命名空间 export namespace math_ {//导出命名空间中函数int add(int a, int b);int sub(int a, int b);int mul(int a, int b);int div(int a, int b); } .cppm文件…...

PID 算法简介(C语言)

一、简介: PID是比例、积分、微分三个环节的组合,用来进行反馈控制。每个部分都有对应的系数,也就是Kp、Ki、Kd。PID 算法实现这三个部分的计算,然后综合起来得到控制输出。 二、PID控制器结构体: PID控制器结构体:包含PID参数(Kp, Ki, Kd);存储积分项和上一次误差;…...

Java中的继承及相关概念

在 Java 中&#xff0c;继承是一种允许一个类继承另一个类的特性。通过继承&#xff0c;子类可以获取父类的属性和方法&#xff0c;这有助于减少代码冗余并提高代码的可维护性。以下是关于文件内容的相关分析和知识点总结&#xff1a; 一、继承的核心概念 1.继承的语法 Java …...

语言月赛 202308【小粉兔做麻辣兔头】题解(AC)

》》》点我查看「视频」详解》》》 [语言月赛 202308] 小粉兔做麻辣兔头 题目描述 粉兔喜欢吃麻辣兔头&#xff0c;麻辣兔头的辣度分为若干级&#xff0c;用数字表示&#xff0c;数字越大&#xff0c;兔头越辣。为了庆祝粉兔专题赛 #1 的顺利举行&#xff0c;粉兔要做一些麻…...

云原生后端|实践?

云原生&#xff08;Cloud Native&#xff09;是一种构建和运行应用程序的方法&#xff0c;它充分利用云计算的优势&#xff0c;包括弹性、可扩展性、高可用性和自动化运维。云原生后端开发通常涉及微服务架构、容器化、持续集成/持续部署&#xff08;CI/CD&#xff09;、服务网…...

GrassWebProxy

GrassWebProxy第一版&#xff1a; using System; using System.Collections.Generic; using System.Linq; using System.Net.Sockets; using System.Net; using System.Text; using System.Threading; using System.Threading.Tasks; using System.IO; using Newtonsoft.Json;…...

6.Python函数:函数定义、函数的类型、函数参数、函数返回值、函数嵌套、局部变量、全局变量、递归函数、匿名函数

1. 函数定义 Python函数通过def关键字定义。一个函数通常包括函数名、参数列表和函数体。 def greet(name):return f"Hello, {name}!"2. 函数的类型 Python中的函数主要有以下几种类型&#xff1a; 普通函数&#xff1a;具有明确的输入参数和返回值。递归函数&am…...

青少年编程与数学 02-008 Pyhon语言编程基础 22课题、类的定义和使用

青少年编程与数学 02-008 Pyhon语言编程基础 22课题、类的定义和使用 一、类类的定义和使用示例 二、定义1. 类定义语法2. 属性和方法3. 构造器和初始化4. 实例化5. 类变量和实例变量6. 类方法和静态方法7. 继承8. 多态总结 三、使用1. 创建类的实例2. 访问属性3. 调用方法4. 修…...

CosyVoice /F5-TTS /GPT-SoVITS /Fish-Speech 开源语音克隆与文本转语音(TTS)项目的对比整理

四个主流开源语音克隆与文本转语音&#xff08;TTS&#xff09;项目的对比整理&#xff0c;基于公开资料与实测反馈总结&#xff1a; 项目CosyVoice F5-TTS GPT-SoVITS Fish-Speech 核心技术双向流式语音合成&#xff0c;支持离线与流式一体化建模基于流匹配的ConvNeXt文本表示…...

MySQL基于binlog和gtid主从搭建方案

MySQL基于binlog和gtid主从搭建方案 一.主库配置 1.1 确认 binlog 是否开启 SHOW VARIABLES LIKE %log_bin%; 1.2 创建日志目录并设置权限 mkdir -p /opt/mysql/log_bin chown -R mysql:mysql /usr/local/mysql chmod -R 755 /usr/local/mysql 1.3 修改 my.cnf 配置文件 …...

5 计算机网络

5 计算机网络 5.1 OSI/RM七层模型 5.2 TCP/IP协议簇 5.2.1:常见协议基础 一、 TCP是可靠的&#xff0c;效率低的&#xff1b; 1.HTTP协议端口默认80&#xff0c;HTTPSSL之后成为HTTPS协议默认端口443。 2.对于0~1023一般是默认的公共端口不需要注册&#xff0c;1024以后的则需…...

Vim跳转文件及文件行结束符EOL

跳转文件 gf 从当前窗口打开那个文件的内容&#xff0c;操作方式&#xff1a;让光标停在文件名上&#xff0c;输入gf。 Ctrlo 从打开的文件返回之前的窗口 Ctrlwf 可以在分割的窗口打开跳转的文件&#xff0c;不过在我的实验不是次次都成功。 统一行尾格式 文本文件里存放的…...

智能理解 PPT 内容,快速生成讲解视频

当我们想根据一版 PPT 制作出相对应的解锁视频时&#xff0c;从撰写解锁词&#xff0c;录制音频到剪辑视频&#xff0c;每一个环节都需要投入大量的时间和精力&#xff0c;本方案将依托于阿里云函数计算 FC 和百炼模型服务&#xff0c;实现从 PPT 到视频的全自动转换&#xff0…...

uniapp 对接腾讯云IM群组成员管理(增删改查)

UniApp 实战&#xff1a;腾讯云IM群组成员管理&#xff08;增删改查&#xff09; 一、前言 在社交类App开发中&#xff0c;群组成员管理是核心功能之一。本文将基于UniApp框架&#xff0c;结合腾讯云IM SDK&#xff0c;详细讲解如何实现群组成员的增删改查全流程。 权限校验…...

el-switch文字内置

el-switch文字内置 效果 vue <div style"color:#ffffff;font-size:14px;float:left;margin-bottom:5px;margin-right:5px;">自动加载</div> <el-switch v-model"value" active-color"#3E99FB" inactive-color"#DCDFE6"…...

零基础设计模式——行为型模式 - 责任链模式

第四部分&#xff1a;行为型模式 - 责任链模式 (Chain of Responsibility Pattern) 欢迎来到行为型模式的学习&#xff01;行为型模式关注对象之间的职责分配、算法封装和对象间的交互。我们将学习的第一个行为型模式是责任链模式。 核心思想&#xff1a;使多个对象都有机会处…...

Python基于历史模拟方法实现投资组合风险管理的VaR与ES模型项目实战

说明&#xff1a;这是一个机器学习实战项目&#xff08;附带数据代码文档&#xff09;&#xff0c;如需数据代码文档可以直接到文章最后关注获取。 1.项目背景 在金融市场日益复杂和波动加剧的背景下&#xff0c;风险管理成为金融机构和个人投资者关注的核心议题之一。VaR&…...

Linux系统部署KES

1、安装准备 1.版本说明V008R006C009B0014 V008&#xff1a;是version产品的大版本。 R006&#xff1a;是release产品特性版本。 C009&#xff1a;是通用版 B0014&#xff1a;是build开发过程中的构建版本2.硬件要求 #安全版和企业版 内存&#xff1a;1GB 以上 硬盘&#xf…...

WEB3全栈开发——面试专业技能点P4数据库

一、mysql2 原生驱动及其连接机制 概念介绍 mysql2 是 Node.js 环境中广泛使用的 MySQL 客户端库&#xff0c;基于 mysql 库改进而来&#xff0c;具有更好的性能、Promise 支持、流式查询、二进制数据处理能力等。 主要特点&#xff1a; 支持 Promise / async-await&#xf…...

从实验室到产业:IndexTTS 在六大核心场景的落地实践

一、内容创作&#xff1a;重构数字内容生产范式 在短视频创作领域&#xff0c;IndexTTS 的语音克隆技术彻底改变了配音流程。B 站 UP 主通过 5 秒参考音频即可克隆出郭老师音色&#xff0c;生成的 “各位吴彦祖们大家好” 语音相似度达 97%&#xff0c;单条视频播放量突破百万…...

SQL注入篇-sqlmap的配置和使用

在之前的皮卡丘靶场第五期SQL注入的内容中我们谈到了sqlmap&#xff0c;但是由于很多朋友看不了解命令行格式&#xff0c;所以是纯手动获取数据库信息的 接下来我们就用sqlmap来进行皮卡丘靶场的sql注入学习&#xff0c;链接&#xff1a;https://wwhc.lanzoue.com/ifJY32ybh6vc…...

嵌入式面试常问问题

以下内容面向嵌入式/系统方向的初学者与面试备考者,全面梳理了以下几大板块,并在每个板块末尾列出常见的面试问答思路,帮助你既能夯实基础,又能应对面试挑战。 一、TCP/IP 协议 1.1 TCP/IP 五层模型概述 链路层(Link Layer) 包括网卡驱动、以太网、Wi‑Fi、PPP 等。负责…...

Yii2项目自动向GitLab上报Bug

Yii2 项目自动上报Bug 原理 yii2在程序报错时, 会执行指定action, 通过重写ErrorAction, 实现Bug自动提交至GitLab的issue 步骤 配置SiteController中的actions方法 public function actions(){return [error > [class > app\helpers\web\ErrorAction,],];}重写Error…...