【DeepSeek】Ubuntu快速部署DeepSeek(Ollama方式)
文章目录
- 人人都该学习的DeepSeek
- DeepSeek不同版本功能差异
- DeepSeek与硬件直接的关系
- DeepSeek系统兼容性
- 部署方式选择
- 部署步骤(Ollama方式)
- 1.选定适合的deepseek版本
- 2.环境准备
- 3.安装Ollama
- 4.部署deepseek
- 5.测试使用
人人都该学习的DeepSeek
DeepSeek 作为一款先进的人工智能工具,具备强大的推理能力和广泛的应用场景,能够帮助用户高效解决复杂问题。它支持文本生成、代码编写、数据分析、情感分析等多种任务,适用于教育、医疗、金融、创意等各行各业。它的开源特性使得个人和企业能够低成本地利用其功能,推动AI技术的普及。无论是提升工作效率、辅助学习,还是解决生活中的问题,DeepSeek 都能提供智能化支持。
DeepSeek不同版本功能差异
| 版本 | 特点 | 适用场景 |
|---|---|---|
| 1.5B | 轻量级模型,参数量少,推理速度快,适合低资源环境。 | 短文本生成、基础问答、移动端应用(如简单智能助手)。 |
| 7B | 平衡型模型,性能与资源需求适中,支持中等复杂度任务。 | 文案撰写、表格处理、统计分析、简单代码生成。 |
| 8B | 性能略强于7B,优化逻辑推理和代码生成。 | 代码生成、逻辑推理(如数学题解决)、中等复杂度文本生成。 |
| 14B | 高性能模型,擅长复杂任务(如数学推理、长文本生成)。 | 数据分析、长文本生成(如研究报告)、多模态任务预处理。 |
| 32B | 专业级模型,支持高精度任务和大规模数据处理。 | 语言建模、金融预测、复杂病例分析(医疗场景)。 |
| 70B | 顶级模型,多模态任务支持,科研级分析能力。 | 高精度临床决策(医疗)、多模态数据分析、前沿科学研究。 |
| 671B | 超大规模基础模型,最高准确性和推理速度,支持国家级研究。 | 气候建模、基因组分析、通用人工智能探索。 |
注:671B是我们常说的满血版deepseek。
关键点
1. 输入输出
- 短文本处理(1.5B-7B):最大支持16k tokens,适合对话和短文生成。
- 长文本处理(32B+):32k-10M tokens,可处理整本书籍或科研论文。
- 多模态支持:32B及以上版本实验性支持图文混合输入,671B版本实现视频流解析。
2. 推理计算
- 数学能力:7B版本仅支持四则运算,32B版本可解微积分方程(准确率92%)。
- 代码生成:7B生成单文件脚本,14B支持全栈项目架构设计(含单元测试)。
3. 部署
- 量化支持:1.5B支持8-bit量化(体积压缩至400MB),70B需保留FP16精度。
- 分布式训练:70B版本支持千卡并行训练(吞吐量1.2 exaFLOPs),671B版本兼容量子计算节点。
DeepSeek与硬件直接的关系
| 参数 | 推荐显卡型号 | 显存要求 | 内存 | 存储 | 适用场景 |
|---|---|---|---|---|---|
| 1.5B | NVIDIA RTX 3060 | 4-8GB | 8GB+ | 3GB+ SSD | 低资源设备部署、简单对话 |
| 7B | NVIDIA RTX 3070/4060 | 8GB+ | 16GB+ | 8GB+ NVMe SSD | 本地开发测试、中小型企业任务 |
| 8B | NVIDIA RTX 3090 | 8GB+ | 16GB+ | 8GB+ NVMe SSD | 高精度轻量级任务 |
| 14B | NVIDIA RTX 3090 | 16GB+ | 32GB+ | 15GB+ NVMe SSD | 企业级复杂任务、专业咨询 |
| 32B | NVIDIA A100 40GB | 24GB+ | 64GB+ | 30GB+ NVMe SSD | 高精度专业领域任务 |
| 70B | NVIDIA A100 80GB 多卡 | ≥40GB(多卡) | 128GB+ | 70GB+ NVMe SSD | 企业级复杂任务处理、科研 |
| 671B | NVIDIA H100/HGX 集群 | 640GB(8卡并行) | 512GB+ | 400GB+ NVMe SSD | 超大规模科研计算、国家级项目 |
注:32B是一个分水岭,从该版本开始对硬件要求开始急速升高。
DeepSeek系统兼容性
| 操作系统 | 兼容性与性能 | 问题与风险 | 工具与部署建议 |
|---|---|---|---|
| Windows | 支持轻量级至中型模型(如7B-32B量化版) | 底层架构限制可能导致闪退或延迟,需关闭后台程序、更新显卡驱动 | 推荐使用Ollama进行一键部署,结合任务管理器监控资源占用,性能较Linux低10%-15% |
| Linux | 适配全版本模型(含70B+超算级部署) | 需注意安全防护(88.9%未防护服务器存在漏洞风险) | 通过LMDeploy优化推理速度,SGLang实现多模型协同,建议Ubuntu系统,性能最优 且支持分布式计算 |
| Mac | 仅支持1.5B-8B轻量模型,依赖M系列芯片NPU加速(如M2 Ultra) | 模型选择受限,复杂任务响应延迟显著(生成速度约2-3 tokens/秒) | 必须通过Ollama进行4-bit量化压缩,优先使用Metal框架加速 |
注:部署时Linux系统最优。
部署方式选择
- 优先选 Ollama 的场景
- 快速原型开发、个人项目测试
- 硬件资源有限(如无高端 GPU)
- 无需复杂参数调优
- 优先选直接部署的场景
- 企业级服务需高并发、低延迟响应
- 需定制模型或优化底层计算(如 FP8 加速、MOE 负载均衡)
- 对数据隐私和合规性要求极高
部署步骤(Ollama方式)
1.选定适合的deepseek版本
按照自己的需求选取合适的deepseek版本,可参照上文的表格内容。
选择的依据主要是:
- 使用场景
- 功能需要
- 硬件限制
- 成本要求
2.环境准备
准备好Ubuntu系统,deepseek推荐使用Ubuntu20.04及以上版本。当前示例使用的是Ubuntu18.04版本。
当前配置情况:
- CPU:16核心
- 内存:64Gb
- 硬盘:128Gb
- GPU:RTX 4090
显卡驱动准备
准备好裸机后首先更新系统:
sudo add-apt-repository ppa:graphics-drivers/ppa #18.04版本较旧,需要加上新的驱动
sudo apt update && sudo apt upgrade -y # 更新系统包
sudo apt install nvidia-driver-535 # 安装NVIDIA驱动
安装好显卡驱动后,确认显卡运行情况:
nvidia-smi
如图所示是驱动完成。

CUDA环境准备
sudo apt update
sudo apt install nvidia-cuda-toolkit
3.安装Ollama
安装Ollama:
curl -fsSL https://ollama.ai/install.sh | sh # 执行官方安装脚本
启用Ollama:
sudo systemctl start ollama # 启动服务
ollama --version # 输出版本号即成功
可能的问题:
1.如果下载Ollama网络慢导致异常中断,可能如下所示:
curl: (16) Error in the HTTP2 framing layer
gzip: stdin: unexpected end of file
tar: Child returned status 1
tar: Error is not recoverable: exiting now
解决方案:
curl -fsSL https://ollama.com/install.sh -o ollama_install.sh
sed -i 's|https://ollama.com/download/ollama-linux|https://gh.llkk.cc/https://github.com/ollama/ollama/releases/download/v0.5.7/ollama-linux|g' ollama_install.sh
chmod +x ollama_install.sh
sudo ./ollama_install.sh
4.部署deepseek
ollama pull deepseek-r1:14b # 下载14B参数版本
整个过程需要一些时间:


5.测试使用
测试deepseek运行情况:
ollama run deepseek-r1:14b

相关文章:
【DeepSeek】Ubuntu快速部署DeepSeek(Ollama方式)
文章目录 人人都该学习的DeepSeekDeepSeek不同版本功能差异DeepSeek与硬件直接的关系DeepSeek系统兼容性部署方式选择部署步骤(Ollama方式)1.选定适合的deepseek版本2.环境准备3.安装Ollama4.部署deepseek5.测试使用 人人都该学习的DeepSeek DeepSeek 作…...
C++后端服务器开发技术栈有哪些?有哪些资源或开源库拿来用?
一、 C后台服务器开发是一个涉及多方面技术选择的复杂领域,特别是在高性能、高并发的场景下。以下是C后台服务器开发的一种常见技术路线,涵盖了从基础到高级的技术栈。 1. 基础技术栈 C标准库 C11/C14/C17/C20:使用现代C特性,如…...
基于SpringBoot的餐厅点餐管理系统设计与实现(源码+SQL脚本+LW+部署讲解等)
专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…...
服务端和客户端通信(TCP)
服务端 using System; using System.Collections.Generic; using System.Linq; using System.Net; using System.Net.Sockets; using System.Text; using System.Threading.Tasks;namespace TeachTcpServer {class Program{static void Main(string[] args){#region 知识点一 …...
Java 大视界 -- Java 大数据在智能体育赛事运动员表现分析与训练优化中的应用(122)
💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也…...
基于Spring Boot的多级缓存架构实现
基于Spring Boot的多级缓存架构实现 以下是一个基于Spring Boot的多级缓存架构实现示例 多级缓存架构实现方案 1. 依赖配置(pom.xml) <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-star…...
Git与GitHub:理解两者差异及其关系
目录 Git与GitHub:理解两者差异及其关系Git:分布式版本控制系统概述主要特点 GitHub:基于Web的托管服务概述主要特点 Git和GitHub如何互补关系现代开发工作流 结论 Git与GitHub:理解两者差异及其关系 Git:分布式版本控…...
ALG(Alloy+Loki+Grafana)轻量级日志系统
ALG(AlloyLokiGrafana)轻量级日志系统 前提要求 GrafanaMinioNginxPrometheus Grafana日志收集系统旧版是PLG(ProtailLokiGrafana), Protail收集日志, Loki存储, Grafana展示, 后续的Protail不维护了, Grafana推出了Alloy代替Pritial, 除了收集日志外, 还集成管理Prometheus各种…...
【漫话机器学习系列】121.偏导数(Partial Derivative)
偏导数(Partial Derivative)详解 1. 引言 在数学分析、机器学习、物理学和工程学中,我们经常会遇到多个变量的函数。这些函数的输出不仅取决于一个变量,而是由多个变量共同决定的。那么,当其中某一个变量发生变化时&…...
Deepseek可以通过多种方式帮助CAD加速工作
自动化操作:通过Deepseek的AI能力,可以编写脚本来自动化重复性任务。例如,使用Python脚本调用Deepseek API,在CAD中实现自动化操作。 插件开发:结合Deepseek进行二次开发,可以创建自定义的CAD插件。例如&a…...
【工具使用】IDEA 社区版如何创建 Spring Boot 项目(详细教程)
IDEA 社区版如何创建 Spring Boot 项目(详细教程) Spring Boot 以其简洁、高效的特性,成为 Java 开发的主流框架之一。虽然 IntelliJ IDEA 专业版提供了Spring Boot 项目向导,但 社区版(Community Edition)…...
QT中串口打开按钮如何点击打开后又能点击关闭
前言: if (!portOpen) { // 打开串口 if (!sp18Controller->initializePort("COM5", 38400)) { QMessageBox::critical(this, "Error", "Failed to open serial port."); return; } ui->btnOpenPort_2->setText("Close…...
【AI深度学习基础】PyTorch初探
引言 PyTorch 是由 Facebook 开源的深度学习框架,专门针对 GPU 加速的深度神经网络编程,它的核心概念包括张量(Tensor)、计算图和自动求导机制。PyTorch作为Facebook开源的深度学习框架,凭借其动态计算图和直观的API设…...
springboot011基于springboot的课程作业管理系统(源码+包运行+LW+技术指导)
项目描述 临近学期结束,还是毕业设计,你还在做java程序网络编程,期末作业,老师的作业要求觉得难了吗?不知道毕业设计该怎么办?网页功能的数量是否太多?没有合适的类型或系统?等等,你想解决的问题,今天…...
快速从C过度C++(一):namespace,C++的输入和输出,缺省参数,函数重载
📝前言: 本文章适合有一定C语言编程基础的读者浏览,主要介绍从C语言到C过度,我们首先要掌握的一些基础知识,以便于我们快速进入C的学习,为后面的学习打下基础。 这篇文章的主要内容有: 1&#x…...
PostgreSQL时间计算大全:从时间差到时区转换(保姆级教程)
一、时间计算的三大核心场景 当你遇到这些需求时,本文就是你的救星🌟: 倒计时功能:计算活动剩余天数 用户行为分析:统计操作间隔时间 跨国系统:多时区时间统一管理 报表生成:自动计算同比/环…...
laravel es 相关代码 ElasticSearch
来源: github <?phpnamespace App\Http\Controllers;use Elastic\Elasticsearch\ClientBuilder; use Illuminate\Support\Facades\DB;class ElasticSearch extends Controller {public $client null;public function __construct(){$this->client ClientB…...
题目 3220 ⭐因数计数⭐【数理基础】蓝桥杯2024年第十五届省赛
小蓝随手写出了含有 n n n 个正整数的数组 a 1 , a 2 , ⋅ ⋅ ⋅ , a n {a_1, a_2, , a_n} a1,a2,⋅⋅⋅,an ,他发现可以轻松地算出有多少个有序二元组 ( i , j ) (i, j) (i,j) 满足 a j a_j aj 是 a i a_i ai 的一个因数。因此他定义一个整数对 …...
【Java代码审计 | 第十一篇】SSRF漏洞成因及防范
未经许可,不得转载。 文章目录 SSRF漏洞成因Java中发送HTTP请求的函数1、HttpURLConnection2、HttpClient(Java 11)3、第三方库Request库漏洞示例OkHttpClient漏洞示例HttpClients漏洞示例 漏洞代码示例防范标准代码 SSRF SSRF(S…...
RabbitMQ高级特性--消息确认机制
目录 一、消息确认 1.消息确认机制 2.手动确认方法 二、代码示例 1. AcknowledgeMode.NONE 1.1 配置文件 1.2 生产者 1.3 消费者 1.4 运行程序 2.AcknowledgeMode.AUTO 3.AcknowledgeMode.MANUAL 一、消息确认 1.消息确认机制 生产者发送消息之后,到达消…...
智慧医疗能源事业线深度画像分析(上)
引言 医疗行业作为现代社会的关键基础设施,其能源消耗与环境影响正日益受到关注。随着全球"双碳"目标的推进和可持续发展理念的深入,智慧医疗能源事业线应运而生,致力于通过创新技术与管理方案,重构医疗领域的能源使用模式。这一事业线融合了能源管理、可持续发…...
【Linux】C语言执行shell指令
在C语言中执行Shell指令 在C语言中,有几种方法可以执行Shell指令: 1. 使用system()函数 这是最简单的方法,包含在stdlib.h头文件中: #include <stdlib.h>int main() {system("ls -l"); // 执行ls -l命令retu…...
高频面试之3Zookeeper
高频面试之3Zookeeper 文章目录 高频面试之3Zookeeper3.1 常用命令3.2 选举机制3.3 Zookeeper符合法则中哪两个?3.4 Zookeeper脑裂3.5 Zookeeper用来干嘛了 3.1 常用命令 ls、get、create、delete、deleteall3.2 选举机制 半数机制(过半机制࿰…...
ArcGIS Pro制作水平横向图例+多级标注
今天介绍下载ArcGIS Pro中如何设置水平横向图例。 之前我们介绍了ArcGIS的横向图例制作:ArcGIS横向、多列图例、顺序重排、符号居中、批量更改图例符号等等(ArcGIS出图图例8大技巧),那这次我们看看ArcGIS Pro如何更加快捷的操作。…...
在Ubuntu24上采用Wine打开SourceInsight
1. 安装wine sudo apt install wine 2. 安装32位库支持,SourceInsight是32位程序 sudo dpkg --add-architecture i386 sudo apt update sudo apt install wine32:i386 3. 验证安装 wine --version 4. 安装必要的字体和库(解决显示问题) sudo apt install fonts-wqy…...
在Mathematica中实现Newton-Raphson迭代的收敛时间算法(一般三次多项式)
考察一般的三次多项式,以r为参数: p[z_, r_] : z^3 (r - 1) z - r; roots[r_] : z /. Solve[p[z, r] 0, z]; 此多项式的根为: 尽管看起来这个多项式是特殊的,其实一般的三次多项式都是可以通过线性变换化为这个形式…...
Proxmox Mail Gateway安装指南:从零开始配置高效邮件过滤系统
💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:「storms…...
Python爬虫(52)Scrapy-Redis分布式爬虫架构实战:IP代理池深度集成与跨地域数据采集
目录 一、引言:当爬虫遭遇"地域封锁"二、背景解析:分布式爬虫的两大技术挑战1. 传统Scrapy架构的局限性2. 地域限制的三种典型表现 三、架构设计:Scrapy-Redis 代理池的协同机制1. 分布式架构拓扑图2. 核心组件协同流程 四、技术实…...
【向量库】Weaviate概述与架构解析
文章目录 一、什么是weaviate二、High-Level Architecture1. Core Components2. Storage Layer3. 组件交互流程 三、核心组件1. API Layer2. Schema Management3. Vector Indexing3.1. 查询原理3.2. 左侧:Search Process(搜索流程)3.3. 右侧&…...
Redis:常用数据结构 单线程模型
🌈 个人主页:Zfox_ 🔥 系列专栏:Redis 🔥 常用数据结构 🐳 Redis 当中常用的数据结构如下所示: Redis 在底层实现上述数据结构的过程中,会在源码的角度上对于上述的内容进行特定的…...
