当前位置: 首页 > news >正文

DeepSeek-R1本地部署保姆级教程

一、DeepSeek-R1本地部署配置要求

(一)轻量级模型

▌DeepSeek-R1-1.5B

  • 内存容量:≥8GB 

  • 显卡需求:支持CPU推理(无需独立GPU)

  • 适用场景:本地环境验证测试/Ollama集成调试

(二)中规模模型组

▌DeepSeek-R1-7B

  • 内存容量:≥16GB 

  • 显卡配置:NVIDIA RTX 3070/4060(≥8GB)

  • 典型应用:中等复杂度NLP任务(文本摘要/多语言翻译)

▌DeepSeek-R1-8B

  • 内存容量:≥16GB 

  • 显卡配置:NVIDIA RTX 3070/4060(≥8GB)

  • 典型应用:代码生成/逻辑推理等高精度轻量任务

(三)企业级模型组

 ▌DeepSeek-R1-14B

  • 内存容量:≥32GB

  • 显卡配置:NVIDIA RTX 4090/A5000(≥16GB)

  • 典型应用:长文本语义理解与生成

▌DeepSeek-R1-32B

  • 内存容量:≥64GB

  • 显卡配置:NVIDIA A100 40GB/双路RTX 3090(≥24GB)

  • 典型应用:专业领域高精度推理

(四)超大规模模型组

▌DeepSeek-R1-70B

  • 内存容量:≥128GB 

  • 显卡配置:2x NVIDIA A100 80GB/4x RTX 4090

  • 典型应用:复杂生成式AI任务

▌DeepSeek-R1-671B

  • 内存容量:≥512GB

  • 显卡配置:8x NVIDIA A100/H100多节点集群

  • 典型应用:AGI研究/超大规模AI训练

二、查看本机配置(Windows)

通过组合键Ctrl + Alt + Delete启动任务管理器:

  1. 选择"性能"标签页

  2. 内存检测:物理内存容量显示(附图)

  3. GPU检测:专用显存容量显示(附图)

检测结果:

  • 系统内存:16GB 

  • GPU显存:8GB 

  • 推荐部署方案:DeepSeek-R1-7B模型

三、Ollama框架部署

(一)获取安装包

访问官方仓库:https://ollama.com
选择对应系统版本(Windows/macOS/Linux)

(二)安装流程

执行标准安装程序,默认配置即可完成环境部署

四、DeepSeek-R1模型加载与配置

(一)获取模型指令集

访问模型库:deepseek-r1

(二)命令行部署

  1. Windows+R启动运行窗口

  2. 输入"cmd"启动命令提示符

  3. 执行标准安装指令(附图)

Win+R,然后输入cmd,进入下述界面。

五、可视化交互环境部署

(一)获取CherryStudio

官网下载:https://cherry-ai.com
选择对应系统版本(Windows/macOS)

(二)安装与集成

  1. 完成标准安装流程

  2. 启动后自动检测本地模型(详见附图)

  3. 通过GUI界面进行模型交互

安装好之后,继续下述操作:

相关文章:

DeepSeek-R1本地部署保姆级教程

一、DeepSeek-R1本地部署配置要求 (一)轻量级模型 ▌DeepSeek-R1-1.5B 内存容量:≥8GB 显卡需求:支持CPU推理(无需独立GPU) 适用场景:本地环境验证测试/Ollama集成调试 (二&a…...

Python常见面试题的详解25

1. 什么是 MD5 加密,有什么特点 要点 定义:MD5 是一种广泛应用的哈希函数,它能够把任意长度的输入数据经过特定算法处理,转化为长度固定为 128 位的哈希值,通常以 32 位十六进制字符串的形式呈现,主要用于验…...

DeepSeek赋能大模型内容安全,网易易盾AIGC内容风控解决方案三大升级

在近两年由AI引发的生产力革命的背后,一场关乎数字世界秩序的攻防战正在上演:AI生成的深度伪造视频导致企业品牌声誉损失日均超千万,批量生成的侵权内容使版权纠纷量与日俱增,黑灰产利用AI技术持续发起欺诈攻击。 与此同时&#…...

阿里开源正式开园文生视频、图生视频模型-通义万相 WanX2.1

简介 发布时间与背景 通义万相 Wan2.1 模型于 2025年1月 发布,并迅速登顶视频生成领域权威评测 Vbench 的榜首,超越了包括 Sora、HunyuanVideo、Minimax 等国内外知名模型,并于这周开源。它是阿里云在 AI 视频生成领域的最新成果&#xff0…...

【Python爬虫(73)】用Python爬虫开启交通数据宝藏,畅行出行未来

【Python爬虫】专栏简介:本专栏是 Python 爬虫领域的集大成之作,共 100 章节。从 Python 基础语法、爬虫入门知识讲起,深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑,覆盖网页、图片、音频等各类数据爬取,还涉及数据处理与分析。无论是新手小白还是进阶开发…...

和鲸科技携手四川气象,以 AI 的力量赋能四川气象一体化平台建设

气象领域与农业、能源、交通、环境科学等国计民生关键领域紧密相连,发挥着不可替代的重要作用。人工智能技术的迅猛发展,为气象领域突破困境带来了新的契机。AI 技术能够深度挖掘气象大数据中蕴含的复杂信息,助力人类更精准地把握自然规律&am…...

spring boot 2.7 + seata +微服务 降级失败问题修复

文章引流 一个简单而使用的API管理工具 版本号 spring boot 2.7.17 spring-cloud-dependencies 2021.0.8 spring-cloud-circuitbreaker-resilience4j 2.1.7 spring-cloud-starter-alibaba-seata 2021.1 jdk 1.8原因分析 未配置属性 feign.circuitbreaker.enabledtrue # 未…...

python-leetcode-最长公共子序列

1143. 最长公共子序列 - 力扣(LeetCode) class Solution:def longestCommonSubsequence(self, text1: str, text2: str) -> int:m, n len(text1), len(text2)dp [[0] * (n 1) for _ in range(m 1)]for i in range(1, m 1):for j in range(1, n …...

centos 7 停更后如何升级kernel版本 —— 筑梦

centos 6/7 内核升级(bios/uefi两种引导方式) —— 筑梦之路_centos7 更新efi-CSDN博客 此处主要说明kernel rpm离线包可以从哪里下载,安装升级参考之前的文章 # 历史kernel版本rpm包http://mirrors.coreix.net/elrepo-archive-archive/kernel/el7/x86_64/RPMS/…...

WPF-3天快速WPF入门并达到企业级水准

嘿,小伙伴们!如果你已经有一定的C#开发基础,但想快速掌握WPF开发,达到企业级水准,那接下来的这个三天快速入门计划绝对适合你!虽然听起来有点挑战,但别担心,只要跟着这个高强度、结构…...

爬虫反爬:CSS位置偏移反爬案例分析与实战案例

文章目录 1. 反爬机制概述2. 反爬原理3. 案例分析4. 破解思路5. 实战样例样例1:使用Python和Selenium破解CSS位置偏移反爬样例2:电商网站商品列表CSS位置偏移反爬破解 6. 总结 1. 反爬机制概述 CSS位置偏移反爬是一种常见的反爬虫技术,通过C…...

Ubuntu20.04安装Redis

目录 切换到root用户 使用 apt install redis 安装redis 修改配置文件 ​编辑 重新启动服务器 使用Redis客户端连接服务器 切换到root用户 如果没有切换到root用户的,切换到root用户。 使用 apt install redis 安装redis 遇到y/n直接y即可。 redis安装好之…...

Ubuntu 22.04 安装Nvidia驱动加速deepseek

一键安装22.04 nvidia 驱动 nvidia 官网下载驱动我的环境是NVIDIA RTX A5000nvidia 文档参考没有安装驱动之前确认自己的型号 lspci | grep -i vga (如数字2231) 参考docker 支持nvidia ,注释了需要的取消注释即可 42行-92行一定要重启服务器…...

OkHttp、Retrofit、RxJava:一文讲清楚

一、okHttp的同步和异步请求 Call 是 OkHttp 的核心接口,代表一个已准备好执行的 HTTP 请求。它支持 同步 和 异步 两种模式: enqueue——>okHttp异步 OkHttpClient client new OkHttpClient();Request request new Request.Builder().url("…...

星环科技推出DeepSeek全场景解决方案:即开即用、企业级部署、端侧智能三位一体

星环科技(688031.SH)正式发布DeepSeek全场景解决方案,全面覆盖个人用户、企业客户及行业场景需求,为用户提供从个人到企业、从云端到本地的全方位AI应用支持,为不同需求的用户提供了灵活、高效且安全的AI解决方案。 省…...

Redis缓存一致性难题:如何让数据库和缓存不“打架”?

标题:Redis缓存一致性难题:如何让数据库和缓存不“打架”?(附程序员脱发指南) 导言:当数据库和缓存成了“异地恋” 想象一下:你刚在美团下单了一份麻辣小龙虾,付款后刷新页面&#…...

动态部署Web应用程序与web.xml配置详解

文章目录 前言一、动态部署Web应用程序1.1 什么是动态部署?1.2 动态部署的步骤1.3 动态部署的优势 二、web.xml 配置文件2.1 什么是web.xml?2.2 web.xml 文件的结构2.2.1常见配置(1) 配置上下文参数(2) 配置Servlet(3)配置过滤器(…...

2025年软考报名费用是多少?全国费用汇总!

软考报名时间终于确定了!想要参加2025年软考的同学们注意啦!特别是那些一年只有一次考试机会的科目,千万不要错过哦!这里为大家整理了各地的报名时间、科目、费用等信息,快来看看吧! 一、2025年软考时间安…...

DeepSeek 15天指导手册——从入门到精通 PDF(附下载)

DeepSeek使用教程系列--DeepSeek 15天指导手册——从入门到精通pdf下载: https://pan.baidu.com/s/1PrIo0Xo0h5s6Plcc_smS8w?pwd1234 提取码: 1234 或 https://pan.quark.cn/s/2e8de75027d3 《DeepSeek 15天指导手册——从入门到精通》以系统化学习路径为核心&…...

【Javascript】js精度丢失

当JS处理大整数或者浮点数的时候会出现精度丢失的情况。 Javascript的数字都使用双精度浮点数表示,遵循IEEE754标准 比如我遇到的问题,对一个小数的四舍五入,保留2位小数: 235.985≈235.98 235.9851≈235.99 原理请大家参考百度&…...

PlayRtttl嵌入式音频引擎:轻量级RTTTL/RTX解析与实时播放

1. PlayRtttl 库深度技术解析:嵌入式平台上的 RTTTL/RTX 音频引擎实现1.1 库定位与工程价值PlayRtttl 是一个面向资源受限嵌入式平台的轻量级 RTTTL(Ring Tone Text Transfer Language)与 RTX(扩展版)音频解析与播放库…...

Spring Boot 4.0 Agent-Ready不是未来式——是今天上线就必须具备的生产红线(附GDPR/等保2.0合规增强checklist)

第一章:Spring Boot 4.0 Agent-Ready不是未来式——是今天上线就必须具备的生产红线(附GDPR/等保2.0合规增强checklist)Spring Boot 4.0 正式将 JVM Agent 集成能力列为启动时强制校验项,而非可选扩展。这意味着任何未通过 java -…...

3分钟开启浏览器编程:Core72在线IDE零配置开发指南 [特殊字符]

3分钟开启浏览器编程:Core72在线IDE零配置开发指南 🚀 【免费下载链接】core Online IDE powered by Visual Studio Code ⚡️ 项目地址: https://gitcode.com/gh_mirrors/core72/core 还在为复杂的开发环境配置而烦恼吗?Core72在线ID…...

AI 时代:祛魅、适应与重新定义磐

指令替换 项目需求:将加法指令替换为减法 项目目录如下 /MyProject ├── CMakeLists.txt # CMake 配置文件 ├── build/ #构建目录 │ └── test.c #测试编译代码 └── mypass2.cpp # pass 项目代码 一,测试代码示例 test.c // test.c #includ…...

案例分析:学术文献综述 Agent Harness

案例分析:学术文献综述 Agent Harness——从手动“文献堆沙”到智能“知识城堡”的AI构建器关键词:学术文献综述 Agent、Agent Harness、多智能体协作、大语言模型应用、学术自动化、知识图谱构建、文献检索-筛选-总结流水线摘要:本文以Chatb…...

【高并发支付配置生死线】:单机QPS 3200+场景下,PHP-FPM与Redis连接池的11项关键参数调优清单

第一章:高并发支付场景下的系统瓶颈诊断在每秒数千笔订单涌入的支付高峰(如电商大促、抢券活动),系统常表现出响应延迟陡增、超时率飙升、数据库连接池耗尽等典型症状。这些表象背后,往往隐藏着多层耦合的性能瓶颈——…...

彻底搞懂Pinecone、Chroma、Weaviate:向量数据库架构拆解,看这篇就够了!

向量数据库存储 Embedding,也就是文本、图像或音频的数值表示,并在查询时检索语义上最接近的结果。RAG 系统正是基于这一机制运作。本文对比三个主流方案,每个都附有 Python 代码,均来自实际在生产环境中使用三者的经验。 三种选择…...

RPA入门,看这篇就够了

一、基础定义:RPA究竟是什么? 机器人流程自动化(Robotic Process Automation,简称RPA)是一种通过软件程序模拟人类在计算机上的操作行为,依据预设规则自动执行重复性、规则性任务的应用软件技术。简单来说&…...

YOLOE官版镜像快速部署指南:5分钟搞定开放词汇目标检测环境

YOLOE官版镜像快速部署指南:5分钟搞定开放词汇目标检测环境 1. 引言:为什么选择YOLOE官版镜像 在计算机视觉领域,目标检测技术已经发展得相当成熟。然而,传统模型如YOLOv5/v8存在一个明显局限——它们只能识别训练时见过的固定类…...

小白也能用的AI神器:Anything to RealCharacters 2.5D转真人引擎全流程体验

小白也能用的AI神器:Anything to RealCharacters 2.5D转真人引擎全流程体验 1. 从动漫到真人的神奇转换 你是否曾经想过,把自己喜欢的动漫角色变成真实人物会是什么样子?或者想把游戏中的虚拟形象变成一张可以打印的照片?现在&a…...