当前位置: 首页 > news >正文

零基础都可以本地部署Deepseek R1

文章目录

    • 一、硬件配置需求
    • 二、详细部署步骤
      • 1. 安装 Ollama 工具
      • 2. 部署 DeepSeek-R1 模型
      • 3. API使用
      • 4. 配置图形化交互界面(可选)
      • 5. 使用与注意事项

一、硬件配置需求

不同版本的 DeepSeek-R1 模型参数量不同,对硬件资源的要求也不尽相同。常见版本及推荐配置大致如下(仅供参考,实际需求应根据使用场景和性能预期调整):

模型版本CPU配置内存要求硬盘空间显卡配置适用场景
DeepSeek-R1-1.5B最低4核(推荐Intel/AMD多核处理器)8GB+3GB+非必需(纯CPU推理),若GPU加速可选4GB+显存(如GTX 1650)低资源设备部署,如树莓派、旧款笔记本、嵌入式系统或物联网设备
DeepSeek-R1-7B8核以上(推荐现代多核CPU)16GB+8GB+推荐8GB+显存(如RTX 3070/4060)中小型企业本地开发测试、中等复杂度NLP任务,例如文本摘要、翻译、轻量级多轮对话系统
DeepSeek-R1-8B8核以上(推荐现代多核CPU)16GB+8GB+推荐8GB+显存(如RTX 3070/4060)需更高精度的轻量级任务(如代码生成、逻辑推理)
DeepSeek-R1-14B12核以上32GB+15GB+16GB+显存(如RTX 4090或A5000)企业级复杂任务、长文本理解与生成
DeepSeek-R1-32B16核以上(如AMD Ryzen 9或Intel i9)64GB+30GB+24GB+显存(如A100 40GB或双卡RTX 3090)高精度专业领域任务、多模态任务预处理
DeepSeek-R1-70B32核以上(服务器级CPU)128GB+70GB+多卡并行(如2xA100 80GB或4xRTX 4090)科研机构/大型企业、高复杂度生成任务
DeepSeek-R1-671B64核以上(服务器集群)512GB+300GB+多节点分布式训练(如8xA100/H100)超大规模AI研究、通用人工智能(AGI)探索

对于大多数家用或工作站级别的电脑,运行 1.5b 至 7b 版本已基本满足体验需求,而更高参数的版本则适合服务器或高端工作站使用。

二、详细部署步骤

以下介绍基于 Windows 环境的一个典型部署流程,其他系统(如 Linux 或 macOS)基本类似,主要区别在安装包和命令行工具上。

1. 安装 Ollama 工具

Ollama 是一个用于管理和运行本地大模型的命令行工具,可从其官网下载安装包。步骤如下:

  • 下载

    访问 Ollama 官网并选择与你操作系统匹配的版本进行下载。

  • 安装

    运行下载的安装程序(例如 Windows 下双击 .exe 文件),完成安装后打开 CMD 或 PowerShell,输入以下命令验证安装成功:

    ollama -v
    

    若返回版本号(例如 0.5.7),则说明安装成功。

    在这里插入图片描述

2. 部署 DeepSeek-R1 模型

  • 选择模型版本
    在 Ollama 官网首页或其模型库中点击左上角的 “Models”,找到 “deepseek-r1” 模型。页面中会展示多个版本(1.5b、7b、8b、14b 等),你需要根据自己的硬件配置选择合适版本。例如,若你的 GPU 为 RTX 3060 12GB,建议选用 1.5b 至 14b 版本。

  • 复制运行命令
    页面中会提供类似下面的命令:

    ollama run deepseek-r1:1.5b
    

    复制对应版本的命令。

  • 下载与安装
    打开 CMD 或 PowerShell,粘贴并运行上面的命令。此时工具会自动下载模型文件并安装。下载过程中注意网络状况,若下载速度较慢,可适时中断后重启命令。

  • 验证模型运行
    下载完成后,在同一命令行窗口中,你可以直接输入问题(例如输入“上海在哪”),若模型能够返回答案,则说明部署成功。

    在这里插入图片描述

3. API使用

ollama API官方文档

ollama运行后默认的路径是http://localhost:11434

curl -X POST "http://localhost:11434/api/generate" \-H "Content-Type: application/json" \-d '{"model": "deepseek-r1:1.5b","prompt": "上海在哪","stream":false #如需流式返回,取消该参数默认为流式}'
{"model": "deepseek-r1:1.5b","created_at": "2025-02-08T14:13:30.203344Z","response": "\u003cthink\u003e\n\n\u003c/think\u003e\n\n上海是中国的一个直辖市,位于中国的东部沿海地区。具体位置是 longitude 121°38'东,latitude 31°25'北。它的城市、工业中心和国际都市特征使其在世界范围内拥有重要的影响力。","done": true,"done_reason": "stop","context": [151644,100633,109333,151645,151648,271,151649,271,100633,105196,104111,116866,3837,103987,105538,106565,107815,100361,1773,100398,81812,20412,20515,220,16,17,16,11616,18,23,6,67364,3837,23718,220,18,16,11616,17,20,6,48309,1773,104121,99490,5373,100159,99488,33108,99876,101478,104363,102989,18493,99489,104589,103926,100799,102484,1773],"total_duration": 1758949417,"load_duration": 570749542,"prompt_eval_count": 5,"prompt_eval_duration": 755000000,"eval_count": 57,"eval_duration": 431000000
}

在这里插入图片描述

\u003cthink\u003e\n\n\u003c/think\u003es其实就是 标签,里边是思考推理的内容,比较简单的问题无需推理,所以这里为空。我们问一个相对较难的问题来试试:

在这里插入图片描述

如果去掉stream为false后的流式返回如下:

在这里插入图片描述

直到done为true,done reason为stop为止

在这里插入图片描述

4. 配置图形化交互界面(可选)

虽然直接在命令行中对话已经能验证模型运行,但为了更友好地交互,你可以安装图形化界面工具:

  • 下载 Chatbox:访问 Chatbox 官网 下载并安装该软件。

  • 在 Chatbox 的设置中,选择使用本地模型,并将模型提供方设置为 Ollama API;在模型列表中选择你刚安装的 DeepSeek-R1 模型即可。
    在这里插入图片描述

    然后即可对话

在这里插入图片描述

5. 使用与注意事项

  • 每次使用时:若需要使用模型,只需先启动 Ollama(通常在安装时会自动后台运行),然后通过命令行或图形界面调用模型。你可以使用命令 ollama list 查看已安装的模型列表,并通过 ollama run <模型名称> 重新启动对话会话。

  • 资源消耗:注意大模型运行时对 CPU、内存和 GPU 的负载较高,建议在使用过程中避免同时进行高负载任务。

  • 升级与卸载

    如果以后不再使用模型,需要按照相关说明清理模型文件和环境变量,避免占用过多磁盘空间。

相关文章:

零基础都可以本地部署Deepseek R1

文章目录 一、硬件配置需求二、详细部署步骤1. 安装 Ollama 工具2. 部署 DeepSeek-R1 模型3. API使用4. 配置图形化交互界面&#xff08;可选&#xff09;5. 使用与注意事项 一、硬件配置需求 不同版本的 DeepSeek-R1 模型参数量不同&#xff0c;对硬件资源的要求也不尽相同。…...

通过Ollama本地部署DeepSeek R1以及简单使用的教程(超详细)

本文介绍了在Windows环境下&#xff0c;通过Ollama来本地部署DeepSeek R1。该问包含了Ollama的下载、安装、安装目录迁移、大模型存储位置修改、下载DeepSeek以及通过Web UI来对话等相关内容。 1、&#x1f947;下载Ollama 首先我们到Ollama官网去下载安装包&#xff0c;此处我…...

css实现长尾箭头(夹角小于45度的)

1. 长尾夹角小于45度的箭头 代码 //h5<div class"singleArrow"></div>//css .singleArrow {width: 150px;height: 1px;position: relative;background-color: #15ff00;/* transform: rotate(-40deg); */ /* 旋转角度 */}.singleArrow::after{ // 成品-有…...

封装descriptions组件,描述,灵活

效果 1、组件1&#xff0c;dade-descriptions.vue <template><table><tbody><slot></slot></tbody> </table> </template><script> </script><style scoped>table {width: 100%;border-collapse: coll…...

OC-Block

关于OC中的block作为属性时&#xff0c;为什么要要用copy修饰 property (nonatomic, copy) void (^completionBlock)(void);很多文章包括AI都会给出类似结论 Block 默认分配在栈上&#xff0c;如果没有 copy&#xff0c;当方法退出后&#xff0c;Block 会被销毁。使用 copy 修…...

关于知识蒸馏的概念原理以及常见方法

1. 概念与原理 知识蒸馏的基本定义 知识蒸馏(Knowledge Distillation) 是一种将模型压缩与迁移学习结合的技术:它利用预先训练好的大模型(通常参数量大、精度高、计算开销大)指导一个更轻量(参数量小、推理速度快)的学生模型进行训练,从而在保持模型精度的同时显著减少…...

C++轻量级桌面GUI库FLTK

C轻量级桌面GUI库FLTK Screenshots - Fast Light Toolkit (FLTK) 这里写个备忘录,可以参考一下....

C++20导出模块及使用

1.模块声明 .ixx文件为导入模块文件 math_operations.ixx export module math_operations;//模块导出 //导出命名空间 export namespace math_ {//导出命名空间中函数int add(int a, int b);int sub(int a, int b);int mul(int a, int b);int div(int a, int b); } .cppm文件…...

PID 算法简介(C语言)

一、简介: PID是比例、积分、微分三个环节的组合,用来进行反馈控制。每个部分都有对应的系数,也就是Kp、Ki、Kd。PID 算法实现这三个部分的计算,然后综合起来得到控制输出。 二、PID控制器结构体: PID控制器结构体:包含PID参数(Kp, Ki, Kd);存储积分项和上一次误差;…...

Java中的继承及相关概念

在 Java 中&#xff0c;继承是一种允许一个类继承另一个类的特性。通过继承&#xff0c;子类可以获取父类的属性和方法&#xff0c;这有助于减少代码冗余并提高代码的可维护性。以下是关于文件内容的相关分析和知识点总结&#xff1a; 一、继承的核心概念 1.继承的语法 Java …...

语言月赛 202308【小粉兔做麻辣兔头】题解(AC)

》》》点我查看「视频」详解》》》 [语言月赛 202308] 小粉兔做麻辣兔头 题目描述 粉兔喜欢吃麻辣兔头&#xff0c;麻辣兔头的辣度分为若干级&#xff0c;用数字表示&#xff0c;数字越大&#xff0c;兔头越辣。为了庆祝粉兔专题赛 #1 的顺利举行&#xff0c;粉兔要做一些麻…...

云原生后端|实践?

云原生&#xff08;Cloud Native&#xff09;是一种构建和运行应用程序的方法&#xff0c;它充分利用云计算的优势&#xff0c;包括弹性、可扩展性、高可用性和自动化运维。云原生后端开发通常涉及微服务架构、容器化、持续集成/持续部署&#xff08;CI/CD&#xff09;、服务网…...

GrassWebProxy

GrassWebProxy第一版&#xff1a; using System; using System.Collections.Generic; using System.Linq; using System.Net.Sockets; using System.Net; using System.Text; using System.Threading; using System.Threading.Tasks; using System.IO; using Newtonsoft.Json;…...

6.Python函数:函数定义、函数的类型、函数参数、函数返回值、函数嵌套、局部变量、全局变量、递归函数、匿名函数

1. 函数定义 Python函数通过def关键字定义。一个函数通常包括函数名、参数列表和函数体。 def greet(name):return f"Hello, {name}!"2. 函数的类型 Python中的函数主要有以下几种类型&#xff1a; 普通函数&#xff1a;具有明确的输入参数和返回值。递归函数&am…...

青少年编程与数学 02-008 Pyhon语言编程基础 22课题、类的定义和使用

青少年编程与数学 02-008 Pyhon语言编程基础 22课题、类的定义和使用 一、类类的定义和使用示例 二、定义1. 类定义语法2. 属性和方法3. 构造器和初始化4. 实例化5. 类变量和实例变量6. 类方法和静态方法7. 继承8. 多态总结 三、使用1. 创建类的实例2. 访问属性3. 调用方法4. 修…...

CosyVoice /F5-TTS /GPT-SoVITS /Fish-Speech 开源语音克隆与文本转语音(TTS)项目的对比整理

四个主流开源语音克隆与文本转语音&#xff08;TTS&#xff09;项目的对比整理&#xff0c;基于公开资料与实测反馈总结&#xff1a; 项目CosyVoice F5-TTS GPT-SoVITS Fish-Speech 核心技术双向流式语音合成&#xff0c;支持离线与流式一体化建模基于流匹配的ConvNeXt文本表示…...

MySQL基于binlog和gtid主从搭建方案

MySQL基于binlog和gtid主从搭建方案 一.主库配置 1.1 确认 binlog 是否开启 SHOW VARIABLES LIKE %log_bin%; 1.2 创建日志目录并设置权限 mkdir -p /opt/mysql/log_bin chown -R mysql:mysql /usr/local/mysql chmod -R 755 /usr/local/mysql 1.3 修改 my.cnf 配置文件 …...

5 计算机网络

5 计算机网络 5.1 OSI/RM七层模型 5.2 TCP/IP协议簇 5.2.1:常见协议基础 一、 TCP是可靠的&#xff0c;效率低的&#xff1b; 1.HTTP协议端口默认80&#xff0c;HTTPSSL之后成为HTTPS协议默认端口443。 2.对于0~1023一般是默认的公共端口不需要注册&#xff0c;1024以后的则需…...

Vim跳转文件及文件行结束符EOL

跳转文件 gf 从当前窗口打开那个文件的内容&#xff0c;操作方式&#xff1a;让光标停在文件名上&#xff0c;输入gf。 Ctrlo 从打开的文件返回之前的窗口 Ctrlwf 可以在分割的窗口打开跳转的文件&#xff0c;不过在我的实验不是次次都成功。 统一行尾格式 文本文件里存放的…...

智能理解 PPT 内容,快速生成讲解视频

当我们想根据一版 PPT 制作出相对应的解锁视频时&#xff0c;从撰写解锁词&#xff0c;录制音频到剪辑视频&#xff0c;每一个环节都需要投入大量的时间和精力&#xff0c;本方案将依托于阿里云函数计算 FC 和百炼模型服务&#xff0c;实现从 PPT 到视频的全自动转换&#xff0…...

Wnt/β-catenin信号通路在组织修复与再生中的关键作用

1. Wnt/β-catenin信号通路&#xff1a;细胞修复的"总指挥" 想象一下你手指被划伤后伤口愈合的过程&#xff0c;或者肝脏在受损后自我修复的神奇能力。这些看似平常的现象背后&#xff0c;其实隐藏着一个精密的分子调控网络——Wnt/β-catenin信号通路。这条通路就像…...

SU-03T模块烧录固件保姆级教程:从‘智能公元’配置到串口下载(避坑‘路径中文’和‘重新上电’)

SU-03T固件烧录实战指南&#xff1a;从智能公元配置到串口下载全流程解析 第一次拿到SU-03T语音模块时&#xff0c;那种既兴奋又忐忑的心情我至今记忆犹新。作为一款高性能离线语音识别模块&#xff0c;SU-03T确实能带来无限可能&#xff0c;但固件烧录这个看似简单的步骤却让不…...

2023年VSCode插件开发全指南:从零发布你的第一个扩展(TypeScript版)

2023年TypeScript生态下的VSCode插件开发实战 在当今开发者工具生态中&#xff0c;Visual Studio Code以其轻量化和高度可扩展性占据了绝对领先地位。根据2023年Stack Overflow开发者调查报告&#xff0c;VSCode以74.48%的使用率成为最受欢迎的代码编辑器。而插件系统正是其生态…...

OWL ADVENTURE助力在线教育:AI自动批改绘图作业实践

OWL ADVENTURE助力在线教育&#xff1a;AI自动批改绘图作业实践 想象一下&#xff0c;一位在线美术老师&#xff0c;面对上百份刚刚提交的手绘作业。他需要一份份打开&#xff0c;仔细查看学生的构图、线条、比例&#xff0c;然后写下针对性的评语。这个过程不仅耗时费力&…...

无数据库版Mirror照妖镜源码解析:如何安全改造为个人图片鉴黄工具

无数据库版Mirror照妖镜源码解析&#xff1a;如何安全改造为个人图片鉴黄工具 在当今内容爆炸的时代&#xff0c;图片审核成为许多个人开发者和内容创作者的刚需。传统解决方案往往依赖复杂的数据库系统和第三方API&#xff0c;而Mirror照妖镜的无数据库设计为轻量级图片审核提…...

CFO/SFO/STO/CFD/IQ不平衡/IQ gain mismatch/IQ phase mismatch/干扰信号载波频率 等等蓝牙通信中干扰参数解析

载波频偏和采样频偏确实来自物理上不同的时钟源,虽然它们可能在数字通信系统中相互影响。 我们可以从三个层面来理清它们的关系: 2. 为什么容易混淆 因为在实际电路中,射频本振和采样时钟可能来自同一个参考晶振。在一些低成本或集成度高的系统中,收发信机通过锁相环(PL…...

基于Altera Cyclone4 FPGA-EP4CE15F17C8核心板的硬件设计实战(原理图+PCB+AD09工程)

1. 从零开始搭建FPGA核心板硬件系统 第一次接触FPGA核心板设计时&#xff0c;我被密密麻麻的引脚和复杂的电源系统搞得头晕眼花。直到用AD09完整走完EP4CE15F17C8核心板的设计流程&#xff0c;才发现硬件开发就像搭积木——只要掌握模块化思维&#xff0c;菜鸟也能做出专业级设…...

ARMv8开发实战:Aarch64函数调用那些坑(含AAPCS64避坑指南)

ARMv8开发实战&#xff1a;Aarch64函数调用那些坑&#xff08;含AAPCS64避坑指南&#xff09; 在嵌入式开发和系统编程领域&#xff0c;ARMv8架构因其出色的能效比和性能表现&#xff0c;已经成为移动设备、服务器甚至超级计算机的主流选择。然而&#xff0c;当开发者从x86平台…...

3分钟快速上手:免费高效的Elasticsearch可视化工具Elasticvue终极指南

3分钟快速上手&#xff1a;免费高效的Elasticsearch可视化工具Elasticvue终极指南 【免费下载链接】elasticvue Elasticsearch gui for the browser 项目地址: https://gitcode.com/gh_mirrors/el/elasticvue 你是否曾经为复杂的Elasticsearch集群管理而烦恼&#xff1f…...

电子小白之二极管

很多年前我第一次看到电路图上各种二极管符号时&#xff0c;心里只有一个想法&#xff1a;这玩意儿到底干嘛用的&#xff1f;硬件部门同事告诉我一句话&#xff0c;瞬间就通了&#xff1a; 正向导通&#xff0c;反向截止&#xff1b;整流防反&#xff0c;稳压发光。 今天就用最…...