Deepseek部署的模型参数要求
DeepSeek 模型部署硬件要求
| 模型名称 | 参数量 | 显存需求(推理) | 显存需求(微调) | CPU 配置 | 内存要求 | 硬盘空间 | 适用场景 |
|---|---|---|---|---|---|---|---|
| DeepSeek-R1-1.5B | 1.5B | 4GB+ | 8GB+ | 最低 4 核(推荐多核) | 8GB+ | 3GB+ | 低资源设备部署,如树莓派、旧款笔记本等 |
| DeepSeek-R1-7B | 7B | 8GB+ | 16GB+ | 8 核以上(推荐现代多核 CPU) | 16GB+ | 8GB+ | 中小型企业本地开发测试、中等复杂度 NLP 任务 |
| DeepSeek-R1-8B | 8B | 8GB+ | 16GB+ | 8 核以上(推荐现代多核 CPU) | 16GB+ | 8GB+ | 需更高精度的轻量级任务(如代码生成、逻辑推理) |
| DeepSeek-R1-14B | 14B | 16GB+ | 32GB+ | 12 核以上 | 32GB+ | 15GB+ | 企业级复杂任务、长文本理解与生成 |
| DeepSeek-R1-32B | 32B | 24GB+ | 48GB+ | 16 核以上(如 AMD Ryzen 9 或 Intel i9) | 64GB+ | 30GB+ | 高精度专业领域任务、多模态任务预处理 |
| DeepSeek-R1-70B | 70B | 48GB+ | 96GB+ | 32 核以上(服务器级 CPU) | 128GB+ | 70GB+ | 科研机构/大型企业、高复杂度生成任务 |
| DeepSeek-R1-671B | 671B | 128GB+ | 256GB+ | 64 核以上(服务器集群) | 512GB+ | 300GB+ | 超大规模 AI 研究、通用人工智能(AGI)探索 |
NVIDIA显卡
| 显卡型号 | 显存容量 | 显存类型 |
|---|---|---|
| RTX 5090 | 32GB | GDDR7 |
| RTX 5090D | 32GB | GDDR7 |
| RTX 5080 | 16GB | GDDR7 |
| RTX 5070Ti | 16GB | GDDR7 |
| RTX 5070 | 12GB | GDDR7 |
| RTX 4090D | 24GB | GDDR6X |
| RTX 4080 | 16GB | GDDR6X |
| RTX 4070TiSuper | 12GB | GDDR6X |
| RTX 4070Super | 12GB | GDDR6X |
| RTX 4060Ti 16G | 16GB | GDDR6 |
| RTX 4060Ti 8G | 8GB | GDDR6 |
| RTX 4060 | 8GB | GDDR6 |
NVIDIA 10 系列显卡
| 显卡型号 | 显存容量 | 显存类型 | 显存位宽 |
|---|---|---|---|
| GT 1030 | 2GB | GDDR5 | 64bit |
NVIDIA 20 系列显卡
| 显卡型号 | 显存容量 | 显存类型 | 显存位宽 |
|---|---|---|---|
| RTX 2080 Ti | 11GB | GDDR6 | 352bit |
| RTX 2080 | 8GB | GDDR6 | 256bit |
| RTX 2070 Super | 8GB | GDDR6 | 256bit |
| RTX 2070 | 8GB | GDDR6 | 256bit |
| RTX 2060 Super | 8GB | GDDR6 | 256bit |
| RTX 2060 | 6GB | GDDR6 | 192bit |
NVIDIA 30 系列显卡
| 显卡型号 | 显存容量 | 显存类型 | 显存位宽 |
|---|---|---|---|
| RTX 3090 Ti | 24GB | GDDR6X | 384bit |
| RTX 3090 | 24GB | GDDR6X | 384bit |
| RTX 3080 Ti | 12GB | GDDR6X | 384bit |
| RTX 3080 | 12GB | GDDR6X | 320bit |
| RTX 3070 Ti | 8GB | GDDR6X | 256bit |
| RTX 3070 | 8GB | GDDR6 | 256bit |
| RTX 3060 Ti | 8GB | GDDR6 | 256bit |
| RTX 3060 | 12GB | GDDR6 | 192bit |
| RTX 3050 | 8GB | GDDR6 | 128bit |
AMD显卡
| 显卡型号 | 显存容量 | 显存类型 |
|---|---|---|
| Radeon RX 9070 XT | 16GB | GDDR6 |
| Radeon RX 9070 | 16GB | GDDR6 |
| Radeon RX 7900GRE | 16GB | GDDR6 |
| Radeon RX 7800XT | 12GB | GDDR6 |
Intel显卡
| 显卡型号 | 显存容量 | 显存类型 |
|---|---|---|
| Arc B580 | 12GB | GDDR6 |
| Arc B570 | 10GB | GDDR6 |
相关文章:
Deepseek部署的模型参数要求
DeepSeek 模型部署硬件要求 模型名称参数量显存需求(推理)显存需求(微调)CPU 配置内存要求硬盘空间适用场景DeepSeek-R1-1.5B1.5B4GB8GB最低 4 核(推荐多核)8GB3GB低资源设备部署,如树莓派、旧…...
AI-学习路线图-PyTorch-我是土堆
1 需求 PyTorch深度学习快速入门教程(绝对通俗易懂!)【小土堆】_哔哩哔哩_bilibili PyTorch 深度学习快速入门教程 配套资源 链接 视频教程 https://www.bilibili.com/video/BV1hE411t7RN/ 文字教程 https://blog.csdn.net/xiaotudui…...
[LeetCode]day17 349.两个数组的交集
https://leetcode.cn/problems/intersection-of-two-arrays/description/ 题目描述 给定两个数组 nums1 和 nums2 ,返回它们的交集。 输出结果中的每个元素一定是唯一的。 我们可以不考虑输出结果的顺序 。 示例 1: 输入:nums1 [1,2,2,1…...
axios 发起 post请求 json 需要传入数据格式
• 1. axios 发起 post请求 json 传入数据格式 • 2. axios get请求 1. axios 发起 post请求 json 传入数据格式 使用 axios 发起 POST 请求并以 JSON 格式传递数据是前端开发中常见的操作。 下面是一个简单的示例,展示如何使用 axios 向服务器发送包含 JSON 数…...
linux交叉编译paho-mqtt-c
下载源代码: https://github.com/eclipse-paho/paho.mqtt.c.git 编译: 如果mqtt不需要SSL安全认证,可以直接执行(注意把编译工具链路径改成自己的) cd paho.mqtt.c-1.3.13/ mkdir install # 创建安装目录 mkdir…...
feign Api接口中注解问题:not annotated with HTTP method type (ex. GET, POST)
Bug Description 在调用Feign api时,出现如下异常: java.lang.IllegalStateException: Method PayFeignSentinelApi#getPayByOrderNo(String) not annotated with HTTPReproduciton Steps 1.启动nacos-pay-provider服务,并启动nacos-pay-c…...
安装指定版本的pnpm
要安装指定版本的 pnpm,可以使用以下方法: 方法 1: 使用 pnpm 安装指定版本 你可以通过 pnpm 的 add 命令来安装指定版本: pnpm add -g pnpm<版本号>例如,安装 pnpm 的 7.0.0 版本: pnpm add -g pnpm7.0.0方法…...
【系统设计】Spring、SpringMVC 与 Spring Boot 技术选型指南:人群、场景与实战建议
在 Java 开发领域,Spring 生态的技术选型直接影响项目的开发效率、维护成本和长期扩展性。然而,面对 Spring、SpringMVC 和 Spring Boot 这三个紧密关联的框架,开发者常常陷入纠结:该从何入手?如何根据团队能力和业务需…...
常用数据结构之String字符串
字符串 在Java编程语言中,字符可以使用基本数据类型char来保存,在 Java 中字符串属于对象,Java 提供了 String 类来创建和操作字符串。 操作字符串常用的有三种类:String、StringBuilder、StringBuffer 接下来看看这三类常见用…...
深入Linux系列之进程地址空间
深入Linux系列之进程地址空间 1.引入 那么在之前的学习中,我们知道我们创建一个子进程的话,我们可以在代码层面调用fork函数来创建我们的子进程,那么fork函数的返回值根据我们当前所处进程的上下文是返回不同的值,它在父进程中返…...
HAL库外设宝典:基于CubeMX的STM32开发手册(持续更新)
目录 前言 GPIO(通用输入输出引脚) 推挽输出模式 浮空输入和上拉输入模式 GPIO其他模式以及内部电路原理 输出驱动器 输入驱动器 中断 外部中断(EXTI) 深入中断(内部机制及原理) 外部中断/事件控…...
网络安全-HSTS
什么是HSTS? HTTP严格传输安全协议(HTTP Strict Transport Security,简称:HSTS) 是互联网安全策略机制。网站可以选择使用HSTS策略,来让浏览器强制使用HTTPS与网站进行通信,以减少会话劫持风险。…...
全程Kali linux---CTFshow misc入门(38-50)
第三十八题: ctfshow{48b722b570c603ef58cc0b83bbf7680d} 第三十九题: 37换成1,36换成0,就得到长度为287的二进制字符串,因为不能被8整除所以,考虑每7位转换一个字符,得到flag。 ctfshow{5281…...
HarmonyOS:时间日期国际化
一、使用场景 在不同的国家和文化中,时间和日期格式的表示方法有所不同,使用惯例的不同点包括:日期中年月日的顺序、时间中时分秒的分隔符等。若应用中需展示时间日期,要确保界面以合适的方式显示,以便用户能够理解。 …...
使用miniforge代替miniconda
conda作为Python数据科学领域的常用软件,是对Python环境及相关依赖进行管理的经典工具,通常集成在anaconda或miniconda等产品中供用户日常使用。 但长久以来,conda在很多场景下运行缓慢卡顿、库解析速度过慢等问题也一直被用户所诟病…...
LIMO:少即是多的推理
25年2月来自上海交大、SII 和 GAIR 的论文“LIMO: Less is More for Reasoning”。 一个挑战是在大语言模型(LLM)中的复杂推理。虽然传统观点认为复杂的推理任务需要大量的训练数据(通常超过 100,000 个示例),但本文展…...
【玩转 Postman 接口测试与开发2_018】第14章:利用 Postman 初探 API 安全测试
《API Testing and Development with Postman》最新第二版封面 文章目录 第十四章 API 安全测试1 OWASP API 安全清单1.1 相关背景1.2 OWASP API 安全清单1.3 认证与授权1.4 破防的对象级授权(Broken object-level authorization)1.5 破防的属性级授权&a…...
如何编写测试用例
代码质量管理是软件开发过程中的关键组成部分,比如我们常说的代码规范、代码可读性、单元测试和测试覆盖率等,对于研发人员来说单元测试和测试覆盖率是保障自己所编写代码的质量的重要手段;好的用例可以帮助研发人员确保代码质量和稳定性、减…...
复原IP地址(力扣93)
有了上一道题分割字符串的基础,这道题理解起来就会容易很多。相同的思想我就不再赘述,在这里我就说明一下此题额外需要注意的点。首先是终止条件如何确定,上一题我们递归到超过字符串长度时,则说明字符串已经分割完毕,…...
zzcms接口index.php id参数存在SQL注入漏洞
zzcms接口index.php id参数存在SQL注入漏洞 漏洞描述 ZZCMS 2023中发现了一个严重漏洞。该漏洞影响了文件/index.php中的某些未知功能,操纵参数id会导致SQL注入,攻击可能是远程发起的,该漏洞已被公开披露并可被利用。攻击者可通过sql盲注等手段,获取数据库信息。 威胁等级:…...
【ElevenLabs Creator计划终极避坑手册】:基于137份真实申请案例的数据复盘——高通过率申请者的3个共性特征
更多请点击: https://intelliparadigm.com 第一章:ElevenLabs Creator计划全景认知与申请价值重定义 ElevenLabs Creator 计划并非传统意义上的 API 试用通道,而是面向内容创作者、开源贡献者与教育实践者的深度协作生态入口。其核心价值已从…...
汉高2026年第一季度实现稳健有机销售增长
美通社消息:汉高公布了2026年第一季度的销售额,约为50亿欧元,有机(即根据汇率和收购/撤资进行调整后)销售额实现1.7%的稳健增长。两大业务部门均拉动业绩增长,销量与价格均实现正向增长。第一季度欧洲地区的有机销售下降3.4%。在印…...
从泡泡实验室到阿木社区:PX4开发者如何在国内技术圈子里快速成长?
从泡泡实验室到阿木社区:PX4开发者如何在国内技术圈子里快速成长? 在无人机开源飞控领域,PX4和Pixhawk已经成为开发者绕不开的技术栈。但相比国外活跃的开发者社区,国内的技术生态往往让新手感到无从下手——百度贴吧的讨论碎片化…...
贾子理论体系:公理化东方智慧与现代科学工程化的认知范式
贾子理论体系:公理化东方智慧与现代科学工程化的认知范式摘要 贾子(本名贾龙栋,笔名Kucius)于2025–2026年间构建以“1-2-3-4-5”公理架构为核心的跨学科认知体系,涵盖思想主权元公理、两大规律、三大定律、四大支柱与…...
【零基础部署】Ubuntu 安装 Docker 保姆级教程
Docker 是当今最流行的容器化平台之一,它能让你把应用及其依赖打包到一个轻量级的容器中运行。无论你是想搭建开发环境、部署服务,还是学习云原生技术,Docker 都是必备技能。本文将手把手带你从零开始,在 Ubuntu 系统上完成 Docke…...
面向非技术人员的AI智能体实战:零代码自动化工作流构建指南
1. 项目概述:面向非工程师的AI智能体实战训练营如果你是一名市场、销售、运营或行政人员,每天被重复性的文档处理、数据分析、内容制作和跨平台沟通所淹没,看着工程师同事用代码自动化一切,自己却只能手动操作,那么你很…...
青龙脚本自动化:五款实用脚本助你轻松管理日常任务
青龙脚本自动化:五款实用脚本助你轻松管理日常任务 【免费下载链接】huajiScript 滑稽の青龙脚本库 项目地址: https://gitcode.com/gh_mirrors/hu/huajiScript 在当今快节奏的数字时代,自动化工具已成为提升效率的必备利器。如果你正在寻找一款能…...
京东商品自动监控下单工具:告别手动刷新,让心仪商品自动到手
京东商品自动监控下单工具:告别手动刷新,让心仪商品自动到手 【免费下载链接】jd-happy [DEPRECATED]Node 爬虫,监控京东商品到货,并实现下单服务 项目地址: https://gitcode.com/gh_mirrors/jd/jd-happy 还在为抢不到心仪…...
命令行与IM桥接工具:适配器模式实现统一消息通知
1. 项目概述与核心价值最近在折腾一个挺有意思的东西,一个叫tmwgsicp/im-cli-bridge的项目。光看这个名字,可能有点摸不着头脑,我来拆解一下。tmwgsicp大概率是作者的用户名或者组织名,im-cli-bridge才是核心。im是即时通讯&#…...
开源机械爪OpenClaw Max:从设计原理到实践应用全解析
1. 项目概述:从开源机械爪到OpenClaw Max的进化之路如果你和我一样,对机器人、自动化或者DIY硬件充满热情,那么“机械爪”这个组件一定不会陌生。它就像是机器人的“手”,是实现抓取、搬运、操作等复杂任务的核心执行器。市面上有…...
