【DeepSeek】Ubuntu快速部署DeepSeek(Ollama方式)
文章目录
- 人人都该学习的DeepSeek
- DeepSeek不同版本功能差异
- DeepSeek与硬件直接的关系
- DeepSeek系统兼容性
- 部署方式选择
- 部署步骤(Ollama方式)
- 1.选定适合的deepseek版本
- 2.环境准备
- 3.安装Ollama
- 4.部署deepseek
- 5.测试使用

人人都该学习的DeepSeek
DeepSeek 作为一款先进的人工智能工具,具备强大的推理能力和广泛的应用场景,能够帮助用户高效解决复杂问题。它支持文本生成、代码编写、数据分析、情感分析等多种任务,适用于教育、医疗、金融、创意等各行各业。它的开源特性使得个人和企业能够低成本地利用其功能,推动AI技术的普及。无论是提升工作效率、辅助学习,还是解决生活中的问题,DeepSeek 都能提供智能化支持。
DeepSeek不同版本功能差异
版本 | 特点 | 适用场景 |
---|---|---|
1.5B | 轻量级模型,参数量少,推理速度快,适合低资源环境。 | 短文本生成、基础问答、移动端应用(如简单智能助手)。 |
7B | 平衡型模型,性能与资源需求适中,支持中等复杂度任务。 | 文案撰写、表格处理、统计分析、简单代码生成。 |
8B | 性能略强于7B,优化逻辑推理和代码生成。 | 代码生成、逻辑推理(如数学题解决)、中等复杂度文本生成。 |
14B | 高性能模型,擅长复杂任务(如数学推理、长文本生成)。 | 数据分析、长文本生成(如研究报告)、多模态任务预处理。 |
32B | 专业级模型,支持高精度任务和大规模数据处理。 | 语言建模、金融预测、复杂病例分析(医疗场景)。 |
70B | 顶级模型,多模态任务支持,科研级分析能力。 | 高精度临床决策(医疗)、多模态数据分析、前沿科学研究。 |
671B | 超大规模基础模型,最高准确性和推理速度,支持国家级研究。 | 气候建模、基因组分析、通用人工智能探索。 |
注:671B是我们常说的满血版deepseek。
关键点
1. 输入输出
- 短文本处理(1.5B-7B):最大支持16k tokens,适合对话和短文生成。
- 长文本处理(32B+):32k-10M tokens,可处理整本书籍或科研论文。
- 多模态支持:32B及以上版本实验性支持图文混合输入,671B版本实现视频流解析。
2. 推理计算
- 数学能力:7B版本仅支持四则运算,32B版本可解微积分方程(准确率92%)。
- 代码生成:7B生成单文件脚本,14B支持全栈项目架构设计(含单元测试)。
3. 部署
- 量化支持:1.5B支持8-bit量化(体积压缩至400MB),70B需保留FP16精度。
- 分布式训练:70B版本支持千卡并行训练(吞吐量1.2 exaFLOPs),671B版本兼容量子计算节点。
DeepSeek与硬件直接的关系
参数 | 推荐显卡型号 | 显存要求 | 内存 | 存储 | 适用场景 |
---|---|---|---|---|---|
1.5B | NVIDIA RTX 3060 | 4-8GB | 8GB+ | 3GB+ SSD | 低资源设备部署、简单对话 |
7B | NVIDIA RTX 3070/4060 | 8GB+ | 16GB+ | 8GB+ NVMe SSD | 本地开发测试、中小型企业任务 |
8B | NVIDIA RTX 3090 | 8GB+ | 16GB+ | 8GB+ NVMe SSD | 高精度轻量级任务 |
14B | NVIDIA RTX 3090 | 16GB+ | 32GB+ | 15GB+ NVMe SSD | 企业级复杂任务、专业咨询 |
32B | NVIDIA A100 40GB | 24GB+ | 64GB+ | 30GB+ NVMe SSD | 高精度专业领域任务 |
70B | NVIDIA A100 80GB 多卡 | ≥40GB(多卡) | 128GB+ | 70GB+ NVMe SSD | 企业级复杂任务处理、科研 |
671B | NVIDIA H100/HGX 集群 | 640GB(8卡并行) | 512GB+ | 400GB+ NVMe SSD | 超大规模科研计算、国家级项目 |
注:32B是一个分水岭,从该版本开始对硬件要求开始急速升高。
DeepSeek系统兼容性
操作系统 | 兼容性与性能 | 问题与风险 | 工具与部署建议 |
---|---|---|---|
Windows | 支持轻量级至中型模型(如7B-32B量化版) | 底层架构限制可能导致闪退或延迟,需关闭后台程序、更新显卡驱动 | 推荐使用Ollama进行一键部署,结合任务管理器监控资源占用,性能较Linux低10%-15% |
Linux | 适配全版本模型(含70B+超算级部署) | 需注意安全防护(88.9%未防护服务器存在漏洞风险) | 通过LMDeploy优化推理速度,SGLang实现多模型协同,建议Ubuntu系统,性能最优 且支持分布式计算 |
Mac | 仅支持1.5B-8B轻量模型,依赖M系列芯片NPU加速(如M2 Ultra) | 模型选择受限,复杂任务响应延迟显著(生成速度约2-3 tokens/秒) | 必须通过Ollama进行4-bit量化压缩,优先使用Metal框架加速 |
注:部署时Linux系统最优。
部署方式选择
- 优先选 Ollama 的场景
- 快速原型开发、个人项目测试
- 硬件资源有限(如无高端 GPU)
- 无需复杂参数调优
- 优先选直接部署的场景
- 企业级服务需高并发、低延迟响应
- 需定制模型或优化底层计算(如 FP8 加速、MOE 负载均衡)
- 对数据隐私和合规性要求极高
部署步骤(Ollama方式)
1.选定适合的deepseek版本
按照自己的需求选取合适的deepseek版本,可参照上文的表格内容。
选择的依据主要是:
- 使用场景
- 功能需要
- 硬件限制
- 成本要求
2.环境准备
准备好Ubuntu系统,deepseek推荐使用Ubuntu20.04及以上版本。当前示例使用的是Ubuntu18.04版本。
当前配置情况:
- CPU:16核心
- 内存:64Gb
- 硬盘:128Gb
- GPU:RTX 4090
显卡驱动准备
准备好裸机后首先更新系统:
sudo add-apt-repository ppa:graphics-drivers/ppa #18.04版本较旧,需要加上新的驱动
sudo apt update && sudo apt upgrade -y # 更新系统包
sudo apt install nvidia-driver-535 # 安装NVIDIA驱动
安装好显卡驱动后,确认显卡运行情况:
nvidia-smi
如图所示是驱动完成。
CUDA环境准备
sudo apt update
sudo apt install nvidia-cuda-toolkit
3.安装Ollama
安装Ollama:
curl -fsSL https://ollama.ai/install.sh | sh # 执行官方安装脚本
启用Ollama:
sudo systemctl start ollama # 启动服务
ollama --version # 输出版本号即成功
可能的问题:
1.如果下载Ollama网络慢导致异常中断,可能如下所示:
curl: (16) Error in the HTTP2 framing layer
gzip: stdin: unexpected end of file
tar: Child returned status 1
tar: Error is not recoverable: exiting now
解决方案:
curl -fsSL https://ollama.com/install.sh -o ollama_install.sh
sed -i 's|https://ollama.com/download/ollama-linux|https://gh.llkk.cc/https://github.com/ollama/ollama/releases/download/v0.5.7/ollama-linux|g' ollama_install.sh
chmod +x ollama_install.sh
sudo ./ollama_install.sh
4.部署deepseek
ollama pull deepseek-r1:14b # 下载14B参数版本
整个过程需要一些时间:
5.测试使用
测试deepseek运行情况:
ollama run deepseek-r1:14b
相关文章:

【DeepSeek】Ubuntu快速部署DeepSeek(Ollama方式)
文章目录 人人都该学习的DeepSeekDeepSeek不同版本功能差异DeepSeek与硬件直接的关系DeepSeek系统兼容性部署方式选择部署步骤(Ollama方式)1.选定适合的deepseek版本2.环境准备3.安装Ollama4.部署deepseek5.测试使用 人人都该学习的DeepSeek DeepSeek 作…...
C++后端服务器开发技术栈有哪些?有哪些资源或开源库拿来用?
一、 C后台服务器开发是一个涉及多方面技术选择的复杂领域,特别是在高性能、高并发的场景下。以下是C后台服务器开发的一种常见技术路线,涵盖了从基础到高级的技术栈。 1. 基础技术栈 C标准库 C11/C14/C17/C20:使用现代C特性,如…...

基于SpringBoot的餐厅点餐管理系统设计与实现(源码+SQL脚本+LW+部署讲解等)
专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…...

服务端和客户端通信(TCP)
服务端 using System; using System.Collections.Generic; using System.Linq; using System.Net; using System.Net.Sockets; using System.Text; using System.Threading.Tasks;namespace TeachTcpServer {class Program{static void Main(string[] args){#region 知识点一 …...

Java 大视界 -- Java 大数据在智能体育赛事运动员表现分析与训练优化中的应用(122)
💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也…...
基于Spring Boot的多级缓存架构实现
基于Spring Boot的多级缓存架构实现 以下是一个基于Spring Boot的多级缓存架构实现示例 多级缓存架构实现方案 1. 依赖配置(pom.xml) <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-star…...
Git与GitHub:理解两者差异及其关系
目录 Git与GitHub:理解两者差异及其关系Git:分布式版本控制系统概述主要特点 GitHub:基于Web的托管服务概述主要特点 Git和GitHub如何互补关系现代开发工作流 结论 Git与GitHub:理解两者差异及其关系 Git:分布式版本控…...

ALG(Alloy+Loki+Grafana)轻量级日志系统
ALG(AlloyLokiGrafana)轻量级日志系统 前提要求 GrafanaMinioNginxPrometheus Grafana日志收集系统旧版是PLG(ProtailLokiGrafana), Protail收集日志, Loki存储, Grafana展示, 后续的Protail不维护了, Grafana推出了Alloy代替Pritial, 除了收集日志外, 还集成管理Prometheus各种…...
【漫话机器学习系列】121.偏导数(Partial Derivative)
偏导数(Partial Derivative)详解 1. 引言 在数学分析、机器学习、物理学和工程学中,我们经常会遇到多个变量的函数。这些函数的输出不仅取决于一个变量,而是由多个变量共同决定的。那么,当其中某一个变量发生变化时&…...
Deepseek可以通过多种方式帮助CAD加速工作
自动化操作:通过Deepseek的AI能力,可以编写脚本来自动化重复性任务。例如,使用Python脚本调用Deepseek API,在CAD中实现自动化操作。 插件开发:结合Deepseek进行二次开发,可以创建自定义的CAD插件。例如&a…...
【工具使用】IDEA 社区版如何创建 Spring Boot 项目(详细教程)
IDEA 社区版如何创建 Spring Boot 项目(详细教程) Spring Boot 以其简洁、高效的特性,成为 Java 开发的主流框架之一。虽然 IntelliJ IDEA 专业版提供了Spring Boot 项目向导,但 社区版(Community Edition)…...
QT中串口打开按钮如何点击打开后又能点击关闭
前言: if (!portOpen) { // 打开串口 if (!sp18Controller->initializePort("COM5", 38400)) { QMessageBox::critical(this, "Error", "Failed to open serial port."); return; } ui->btnOpenPort_2->setText("Close…...

【AI深度学习基础】PyTorch初探
引言 PyTorch 是由 Facebook 开源的深度学习框架,专门针对 GPU 加速的深度神经网络编程,它的核心概念包括张量(Tensor)、计算图和自动求导机制。PyTorch作为Facebook开源的深度学习框架,凭借其动态计算图和直观的API设…...

springboot011基于springboot的课程作业管理系统(源码+包运行+LW+技术指导)
项目描述 临近学期结束,还是毕业设计,你还在做java程序网络编程,期末作业,老师的作业要求觉得难了吗?不知道毕业设计该怎么办?网页功能的数量是否太多?没有合适的类型或系统?等等,你想解决的问题,今天…...

快速从C过度C++(一):namespace,C++的输入和输出,缺省参数,函数重载
📝前言: 本文章适合有一定C语言编程基础的读者浏览,主要介绍从C语言到C过度,我们首先要掌握的一些基础知识,以便于我们快速进入C的学习,为后面的学习打下基础。 这篇文章的主要内容有: 1&#x…...
PostgreSQL时间计算大全:从时间差到时区转换(保姆级教程)
一、时间计算的三大核心场景 当你遇到这些需求时,本文就是你的救星🌟: 倒计时功能:计算活动剩余天数 用户行为分析:统计操作间隔时间 跨国系统:多时区时间统一管理 报表生成:自动计算同比/环…...

laravel es 相关代码 ElasticSearch
来源: github <?phpnamespace App\Http\Controllers;use Elastic\Elasticsearch\ClientBuilder; use Illuminate\Support\Facades\DB;class ElasticSearch extends Controller {public $client null;public function __construct(){$this->client ClientB…...
题目 3220 ⭐因数计数⭐【数理基础】蓝桥杯2024年第十五届省赛
小蓝随手写出了含有 n n n 个正整数的数组 a 1 , a 2 , ⋅ ⋅ ⋅ , a n {a_1, a_2, , a_n} a1,a2,⋅⋅⋅,an ,他发现可以轻松地算出有多少个有序二元组 ( i , j ) (i, j) (i,j) 满足 a j a_j aj 是 a i a_i ai 的一个因数。因此他定义一个整数对 …...

【Java代码审计 | 第十一篇】SSRF漏洞成因及防范
未经许可,不得转载。 文章目录 SSRF漏洞成因Java中发送HTTP请求的函数1、HttpURLConnection2、HttpClient(Java 11)3、第三方库Request库漏洞示例OkHttpClient漏洞示例HttpClients漏洞示例 漏洞代码示例防范标准代码 SSRF SSRF(S…...

RabbitMQ高级特性--消息确认机制
目录 一、消息确认 1.消息确认机制 2.手动确认方法 二、代码示例 1. AcknowledgeMode.NONE 1.1 配置文件 1.2 生产者 1.3 消费者 1.4 运行程序 2.AcknowledgeMode.AUTO 3.AcknowledgeMode.MANUAL 一、消息确认 1.消息确认机制 生产者发送消息之后,到达消…...
conda相比python好处
Conda 作为 Python 的环境和包管理工具,相比原生 Python 生态(如 pip 虚拟环境)有许多独特优势,尤其在多项目管理、依赖处理和跨平台兼容性等方面表现更优。以下是 Conda 的核心好处: 一、一站式环境管理:…...
树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频
使用rpicam-app通过网络流式传输视频 使用 rpicam-app 通过网络流式传输视频UDPTCPRTSPlibavGStreamerRTPlibcamerasrc GStreamer 元素 文章来源: http://raspberry.dns8844.cn/documentation 原文网址 使用 rpicam-app 通过网络流式传输视频 本节介绍来自 rpica…...

K8S认证|CKS题库+答案| 11. AppArmor
目录 11. AppArmor 免费获取并激活 CKA_v1.31_模拟系统 题目 开始操作: 1)、切换集群 2)、切换节点 3)、切换到 apparmor 的目录 4)、执行 apparmor 策略模块 5)、修改 pod 文件 6)、…...
【位运算】消失的两个数字(hard)
消失的两个数字(hard) 题⽬描述:解法(位运算):Java 算法代码:更简便代码 题⽬链接:⾯试题 17.19. 消失的两个数字 题⽬描述: 给定⼀个数组,包含从 1 到 N 所有…...
Go 语言接口详解
Go 语言接口详解 核心概念 接口定义 在 Go 语言中,接口是一种抽象类型,它定义了一组方法的集合: // 定义接口 type Shape interface {Area() float64Perimeter() float64 } 接口实现 Go 接口的实现是隐式的: // 矩形结构体…...

ArcGIS Pro制作水平横向图例+多级标注
今天介绍下载ArcGIS Pro中如何设置水平横向图例。 之前我们介绍了ArcGIS的横向图例制作:ArcGIS横向、多列图例、顺序重排、符号居中、批量更改图例符号等等(ArcGIS出图图例8大技巧),那这次我们看看ArcGIS Pro如何更加快捷的操作。…...

认识CMake并使用CMake构建自己的第一个项目
1.CMake的作用和优势 跨平台支持:CMake支持多种操作系统和编译器,使用同一份构建配置可以在不同的环境中使用 简化配置:通过CMakeLists.txt文件,用户可以定义项目结构、依赖项、编译选项等,无需手动编写复杂的构建脚本…...
DAY 26 函数专题1
函数定义与参数知识点回顾:1. 函数的定义2. 变量作用域:局部变量和全局变量3. 函数的参数类型:位置参数、默认参数、不定参数4. 传递参数的手段:关键词参数5 题目1:计算圆的面积 任务: 编写一…...

java高级——高阶函数、如何定义一个函数式接口类似stream流的filter
java高级——高阶函数、stream流 前情提要文章介绍一、函数伊始1.1 合格的函数1.2 有形的函数2. 函数对象2.1 函数对象——行为参数化2.2 函数对象——延迟执行 二、 函数编程语法1. 函数对象表现形式1.1 Lambda表达式1.2 方法引用(Math::max) 2 函数接口…...
Java并发编程实战 Day 11:并发设计模式
【Java并发编程实战 Day 11】并发设计模式 开篇 这是"Java并发编程实战"系列的第11天,今天我们聚焦于并发设计模式。并发设计模式是解决多线程环境下常见问题的经典解决方案,它们不仅提供了优雅的设计思路,还能显著提升系统的性能…...