当前位置: 首页 > news >正文

零基础都可以本地部署Deepseek R1

文章目录

    • 一、硬件配置需求
    • 二、详细部署步骤
      • 1. 安装 Ollama 工具
      • 2. 部署 DeepSeek-R1 模型
      • 3. API使用
      • 4. 配置图形化交互界面(可选)
      • 5. 使用与注意事项

一、硬件配置需求

不同版本的 DeepSeek-R1 模型参数量不同,对硬件资源的要求也不尽相同。常见版本及推荐配置大致如下(仅供参考,实际需求应根据使用场景和性能预期调整):

模型版本CPU配置内存要求硬盘空间显卡配置适用场景
DeepSeek-R1-1.5B最低4核(推荐Intel/AMD多核处理器)8GB+3GB+非必需(纯CPU推理),若GPU加速可选4GB+显存(如GTX 1650)低资源设备部署,如树莓派、旧款笔记本、嵌入式系统或物联网设备
DeepSeek-R1-7B8核以上(推荐现代多核CPU)16GB+8GB+推荐8GB+显存(如RTX 3070/4060)中小型企业本地开发测试、中等复杂度NLP任务,例如文本摘要、翻译、轻量级多轮对话系统
DeepSeek-R1-8B8核以上(推荐现代多核CPU)16GB+8GB+推荐8GB+显存(如RTX 3070/4060)需更高精度的轻量级任务(如代码生成、逻辑推理)
DeepSeek-R1-14B12核以上32GB+15GB+16GB+显存(如RTX 4090或A5000)企业级复杂任务、长文本理解与生成
DeepSeek-R1-32B16核以上(如AMD Ryzen 9或Intel i9)64GB+30GB+24GB+显存(如A100 40GB或双卡RTX 3090)高精度专业领域任务、多模态任务预处理
DeepSeek-R1-70B32核以上(服务器级CPU)128GB+70GB+多卡并行(如2xA100 80GB或4xRTX 4090)科研机构/大型企业、高复杂度生成任务
DeepSeek-R1-671B64核以上(服务器集群)512GB+300GB+多节点分布式训练(如8xA100/H100)超大规模AI研究、通用人工智能(AGI)探索

对于大多数家用或工作站级别的电脑,运行 1.5b 至 7b 版本已基本满足体验需求,而更高参数的版本则适合服务器或高端工作站使用。

二、详细部署步骤

以下介绍基于 Windows 环境的一个典型部署流程,其他系统(如 Linux 或 macOS)基本类似,主要区别在安装包和命令行工具上。

1. 安装 Ollama 工具

Ollama 是一个用于管理和运行本地大模型的命令行工具,可从其官网下载安装包。步骤如下:

  • 下载

    访问 Ollama 官网并选择与你操作系统匹配的版本进行下载。

  • 安装

    运行下载的安装程序(例如 Windows 下双击 .exe 文件),完成安装后打开 CMD 或 PowerShell,输入以下命令验证安装成功:

    ollama -v
    

    若返回版本号(例如 0.5.7),则说明安装成功。

    在这里插入图片描述

2. 部署 DeepSeek-R1 模型

  • 选择模型版本
    在 Ollama 官网首页或其模型库中点击左上角的 “Models”,找到 “deepseek-r1” 模型。页面中会展示多个版本(1.5b、7b、8b、14b 等),你需要根据自己的硬件配置选择合适版本。例如,若你的 GPU 为 RTX 3060 12GB,建议选用 1.5b 至 14b 版本。

  • 复制运行命令
    页面中会提供类似下面的命令:

    ollama run deepseek-r1:1.5b
    

    复制对应版本的命令。

  • 下载与安装
    打开 CMD 或 PowerShell,粘贴并运行上面的命令。此时工具会自动下载模型文件并安装。下载过程中注意网络状况,若下载速度较慢,可适时中断后重启命令。

  • 验证模型运行
    下载完成后,在同一命令行窗口中,你可以直接输入问题(例如输入“上海在哪”),若模型能够返回答案,则说明部署成功。

    在这里插入图片描述

3. API使用

ollama API官方文档

ollama运行后默认的路径是http://localhost:11434

curl -X POST "http://localhost:11434/api/generate" \-H "Content-Type: application/json" \-d '{"model": "deepseek-r1:1.5b","prompt": "上海在哪","stream":false #如需流式返回,取消该参数默认为流式}'
{"model": "deepseek-r1:1.5b","created_at": "2025-02-08T14:13:30.203344Z","response": "\u003cthink\u003e\n\n\u003c/think\u003e\n\n上海是中国的一个直辖市,位于中国的东部沿海地区。具体位置是 longitude 121°38'东,latitude 31°25'北。它的城市、工业中心和国际都市特征使其在世界范围内拥有重要的影响力。","done": true,"done_reason": "stop","context": [151644,100633,109333,151645,151648,271,151649,271,100633,105196,104111,116866,3837,103987,105538,106565,107815,100361,1773,100398,81812,20412,20515,220,16,17,16,11616,18,23,6,67364,3837,23718,220,18,16,11616,17,20,6,48309,1773,104121,99490,5373,100159,99488,33108,99876,101478,104363,102989,18493,99489,104589,103926,100799,102484,1773],"total_duration": 1758949417,"load_duration": 570749542,"prompt_eval_count": 5,"prompt_eval_duration": 755000000,"eval_count": 57,"eval_duration": 431000000
}

在这里插入图片描述

\u003cthink\u003e\n\n\u003c/think\u003es其实就是 标签,里边是思考推理的内容,比较简单的问题无需推理,所以这里为空。我们问一个相对较难的问题来试试:

在这里插入图片描述

如果去掉stream为false后的流式返回如下:

在这里插入图片描述

直到done为true,done reason为stop为止

在这里插入图片描述

4. 配置图形化交互界面(可选)

虽然直接在命令行中对话已经能验证模型运行,但为了更友好地交互,你可以安装图形化界面工具:

  • 下载 Chatbox:访问 Chatbox 官网 下载并安装该软件。

  • 在 Chatbox 的设置中,选择使用本地模型,并将模型提供方设置为 Ollama API;在模型列表中选择你刚安装的 DeepSeek-R1 模型即可。
    在这里插入图片描述

    然后即可对话

在这里插入图片描述

5. 使用与注意事项

  • 每次使用时:若需要使用模型,只需先启动 Ollama(通常在安装时会自动后台运行),然后通过命令行或图形界面调用模型。你可以使用命令 ollama list 查看已安装的模型列表,并通过 ollama run <模型名称> 重新启动对话会话。

  • 资源消耗:注意大模型运行时对 CPU、内存和 GPU 的负载较高,建议在使用过程中避免同时进行高负载任务。

  • 升级与卸载

    如果以后不再使用模型,需要按照相关说明清理模型文件和环境变量,避免占用过多磁盘空间。

相关文章:

零基础都可以本地部署Deepseek R1

文章目录 一、硬件配置需求二、详细部署步骤1. 安装 Ollama 工具2. 部署 DeepSeek-R1 模型3. API使用4. 配置图形化交互界面&#xff08;可选&#xff09;5. 使用与注意事项 一、硬件配置需求 不同版本的 DeepSeek-R1 模型参数量不同&#xff0c;对硬件资源的要求也不尽相同。…...

通过Ollama本地部署DeepSeek R1以及简单使用的教程(超详细)

本文介绍了在Windows环境下&#xff0c;通过Ollama来本地部署DeepSeek R1。该问包含了Ollama的下载、安装、安装目录迁移、大模型存储位置修改、下载DeepSeek以及通过Web UI来对话等相关内容。 1、&#x1f947;下载Ollama 首先我们到Ollama官网去下载安装包&#xff0c;此处我…...

css实现长尾箭头(夹角小于45度的)

1. 长尾夹角小于45度的箭头 代码 //h5<div class"singleArrow"></div>//css .singleArrow {width: 150px;height: 1px;position: relative;background-color: #15ff00;/* transform: rotate(-40deg); */ /* 旋转角度 */}.singleArrow::after{ // 成品-有…...

封装descriptions组件,描述,灵活

效果 1、组件1&#xff0c;dade-descriptions.vue <template><table><tbody><slot></slot></tbody> </table> </template><script> </script><style scoped>table {width: 100%;border-collapse: coll…...

OC-Block

关于OC中的block作为属性时&#xff0c;为什么要要用copy修饰 property (nonatomic, copy) void (^completionBlock)(void);很多文章包括AI都会给出类似结论 Block 默认分配在栈上&#xff0c;如果没有 copy&#xff0c;当方法退出后&#xff0c;Block 会被销毁。使用 copy 修…...

关于知识蒸馏的概念原理以及常见方法

1. 概念与原理 知识蒸馏的基本定义 知识蒸馏(Knowledge Distillation) 是一种将模型压缩与迁移学习结合的技术:它利用预先训练好的大模型(通常参数量大、精度高、计算开销大)指导一个更轻量(参数量小、推理速度快)的学生模型进行训练,从而在保持模型精度的同时显著减少…...

C++轻量级桌面GUI库FLTK

C轻量级桌面GUI库FLTK Screenshots - Fast Light Toolkit (FLTK) 这里写个备忘录,可以参考一下....

C++20导出模块及使用

1.模块声明 .ixx文件为导入模块文件 math_operations.ixx export module math_operations;//模块导出 //导出命名空间 export namespace math_ {//导出命名空间中函数int add(int a, int b);int sub(int a, int b);int mul(int a, int b);int div(int a, int b); } .cppm文件…...

PID 算法简介(C语言)

一、简介: PID是比例、积分、微分三个环节的组合,用来进行反馈控制。每个部分都有对应的系数,也就是Kp、Ki、Kd。PID 算法实现这三个部分的计算,然后综合起来得到控制输出。 二、PID控制器结构体: PID控制器结构体:包含PID参数(Kp, Ki, Kd);存储积分项和上一次误差;…...

Java中的继承及相关概念

在 Java 中&#xff0c;继承是一种允许一个类继承另一个类的特性。通过继承&#xff0c;子类可以获取父类的属性和方法&#xff0c;这有助于减少代码冗余并提高代码的可维护性。以下是关于文件内容的相关分析和知识点总结&#xff1a; 一、继承的核心概念 1.继承的语法 Java …...

语言月赛 202308【小粉兔做麻辣兔头】题解(AC)

》》》点我查看「视频」详解》》》 [语言月赛 202308] 小粉兔做麻辣兔头 题目描述 粉兔喜欢吃麻辣兔头&#xff0c;麻辣兔头的辣度分为若干级&#xff0c;用数字表示&#xff0c;数字越大&#xff0c;兔头越辣。为了庆祝粉兔专题赛 #1 的顺利举行&#xff0c;粉兔要做一些麻…...

云原生后端|实践?

云原生&#xff08;Cloud Native&#xff09;是一种构建和运行应用程序的方法&#xff0c;它充分利用云计算的优势&#xff0c;包括弹性、可扩展性、高可用性和自动化运维。云原生后端开发通常涉及微服务架构、容器化、持续集成/持续部署&#xff08;CI/CD&#xff09;、服务网…...

GrassWebProxy

GrassWebProxy第一版&#xff1a; using System; using System.Collections.Generic; using System.Linq; using System.Net.Sockets; using System.Net; using System.Text; using System.Threading; using System.Threading.Tasks; using System.IO; using Newtonsoft.Json;…...

6.Python函数:函数定义、函数的类型、函数参数、函数返回值、函数嵌套、局部变量、全局变量、递归函数、匿名函数

1. 函数定义 Python函数通过def关键字定义。一个函数通常包括函数名、参数列表和函数体。 def greet(name):return f"Hello, {name}!"2. 函数的类型 Python中的函数主要有以下几种类型&#xff1a; 普通函数&#xff1a;具有明确的输入参数和返回值。递归函数&am…...

青少年编程与数学 02-008 Pyhon语言编程基础 22课题、类的定义和使用

青少年编程与数学 02-008 Pyhon语言编程基础 22课题、类的定义和使用 一、类类的定义和使用示例 二、定义1. 类定义语法2. 属性和方法3. 构造器和初始化4. 实例化5. 类变量和实例变量6. 类方法和静态方法7. 继承8. 多态总结 三、使用1. 创建类的实例2. 访问属性3. 调用方法4. 修…...

CosyVoice /F5-TTS /GPT-SoVITS /Fish-Speech 开源语音克隆与文本转语音(TTS)项目的对比整理

四个主流开源语音克隆与文本转语音&#xff08;TTS&#xff09;项目的对比整理&#xff0c;基于公开资料与实测反馈总结&#xff1a; 项目CosyVoice F5-TTS GPT-SoVITS Fish-Speech 核心技术双向流式语音合成&#xff0c;支持离线与流式一体化建模基于流匹配的ConvNeXt文本表示…...

MySQL基于binlog和gtid主从搭建方案

MySQL基于binlog和gtid主从搭建方案 一.主库配置 1.1 确认 binlog 是否开启 SHOW VARIABLES LIKE %log_bin%; 1.2 创建日志目录并设置权限 mkdir -p /opt/mysql/log_bin chown -R mysql:mysql /usr/local/mysql chmod -R 755 /usr/local/mysql 1.3 修改 my.cnf 配置文件 …...

5 计算机网络

5 计算机网络 5.1 OSI/RM七层模型 5.2 TCP/IP协议簇 5.2.1:常见协议基础 一、 TCP是可靠的&#xff0c;效率低的&#xff1b; 1.HTTP协议端口默认80&#xff0c;HTTPSSL之后成为HTTPS协议默认端口443。 2.对于0~1023一般是默认的公共端口不需要注册&#xff0c;1024以后的则需…...

Vim跳转文件及文件行结束符EOL

跳转文件 gf 从当前窗口打开那个文件的内容&#xff0c;操作方式&#xff1a;让光标停在文件名上&#xff0c;输入gf。 Ctrlo 从打开的文件返回之前的窗口 Ctrlwf 可以在分割的窗口打开跳转的文件&#xff0c;不过在我的实验不是次次都成功。 统一行尾格式 文本文件里存放的…...

智能理解 PPT 内容,快速生成讲解视频

当我们想根据一版 PPT 制作出相对应的解锁视频时&#xff0c;从撰写解锁词&#xff0c;录制音频到剪辑视频&#xff0c;每一个环节都需要投入大量的时间和精力&#xff0c;本方案将依托于阿里云函数计算 FC 和百炼模型服务&#xff0c;实现从 PPT 到视频的全自动转换&#xff0…...

深入浅出:JavaScript 中的 `window.crypto.getRandomValues()` 方法

深入浅出&#xff1a;JavaScript 中的 window.crypto.getRandomValues() 方法 在现代 Web 开发中&#xff0c;随机数的生成看似简单&#xff0c;却隐藏着许多玄机。无论是生成密码、加密密钥&#xff0c;还是创建安全令牌&#xff0c;随机数的质量直接关系到系统的安全性。Jav…...

学校招生小程序源码介绍

基于ThinkPHPFastAdminUniApp开发的学校招生小程序源码&#xff0c;专为学校招生场景量身打造&#xff0c;功能实用且操作便捷。 从技术架构来看&#xff0c;ThinkPHP提供稳定可靠的后台服务&#xff0c;FastAdmin加速开发流程&#xff0c;UniApp则保障小程序在多端有良好的兼…...

MySQL用户和授权

开放MySQL白名单 可以通过iptables-save命令确认对应客户端ip是否可以访问MySQL服务&#xff1a; test: # iptables-save | grep 3306 -A mp_srv_whitelist -s 172.16.14.102/32 -p tcp -m tcp --dport 3306 -j ACCEPT -A mp_srv_whitelist -s 172.16.4.16/32 -p tcp -m tcp -…...

使用Spring AI和MCP协议构建图片搜索服务

目录 使用Spring AI和MCP协议构建图片搜索服务 引言 技术栈概览 项目架构设计 架构图 服务端开发 1. 创建Spring Boot项目 2. 实现图片搜索工具 3. 配置传输模式 Stdio模式&#xff08;本地调用&#xff09; SSE模式&#xff08;远程调用&#xff09; 4. 注册工具提…...

在Mathematica中实现Newton-Raphson迭代的收敛时间算法(一般三次多项式)

考察一般的三次多项式&#xff0c;以r为参数&#xff1a; p[z_, r_] : z^3 (r - 1) z - r; roots[r_] : z /. Solve[p[z, r] 0, z]&#xff1b; 此多项式的根为&#xff1a; 尽管看起来这个多项式是特殊的&#xff0c;其实一般的三次多项式都是可以通过线性变换化为这个形式…...

Caliper 配置文件解析:fisco-bcos.json

config.yaml 文件 config.yaml 是 Caliper 的主配置文件,通常包含以下内容: test:name: fisco-bcos-test # 测试名称description: Performance test of FISCO-BCOS # 测试描述workers:type: local # 工作进程类型number: 5 # 工作进程数量monitor:type: - docker- pro…...

如何配置一个sql server使得其它用户可以通过excel odbc获取数据

要让其他用户通过 Excel 使用 ODBC 连接到 SQL Server 获取数据&#xff0c;你需要完成以下配置步骤&#xff1a; ✅ 一、在 SQL Server 端配置&#xff08;服务器设置&#xff09; 1. 启用 TCP/IP 协议 打开 “SQL Server 配置管理器”。导航到&#xff1a;SQL Server 网络配…...

JDK 17 序列化是怎么回事

如何序列化&#xff1f;其实很简单&#xff0c;就是根据每个类型&#xff0c;用工厂类调用。逐个完成。 没什么漂亮的代码&#xff0c;只有有效、稳定的代码。 代码中调用toJson toJson 代码 mapper.writeValueAsString ObjectMapper DefaultSerializerProvider 一堆实…...

【若依】框架项目部署笔记

参考【SpringBoot】【Vue】项目部署_no main manifest attribute, in springboot-0.0.1-sn-CSDN博客 多一个redis安装 准备工作&#xff1a; 压缩包下载&#xff1a;http://download.redis.io/releases 1. 上传压缩包&#xff0c;并进入压缩包所在目录&#xff0c;解压到目标…...

DAY 45 超大力王爱学Python

来自超大力王的友情提示&#xff1a;在用tensordoard的时候一定一定要用绝对位置&#xff0c;例如&#xff1a;tensorboard --logdir"D:\代码\archive (1)\runs\cifar10_mlp_experiment_2" 不然读取不了数据 知识点回顾&#xff1a; tensorboard的发展历史和原理tens…...