【DeepSeek】Ubuntu快速部署DeepSeek(Ollama方式)
文章目录
- 人人都该学习的DeepSeek
- DeepSeek不同版本功能差异
- DeepSeek与硬件直接的关系
- DeepSeek系统兼容性
- 部署方式选择
- 部署步骤(Ollama方式)
- 1.选定适合的deepseek版本
- 2.环境准备
- 3.安装Ollama
- 4.部署deepseek
- 5.测试使用

人人都该学习的DeepSeek
DeepSeek 作为一款先进的人工智能工具,具备强大的推理能力和广泛的应用场景,能够帮助用户高效解决复杂问题。它支持文本生成、代码编写、数据分析、情感分析等多种任务,适用于教育、医疗、金融、创意等各行各业。它的开源特性使得个人和企业能够低成本地利用其功能,推动AI技术的普及。无论是提升工作效率、辅助学习,还是解决生活中的问题,DeepSeek 都能提供智能化支持。
DeepSeek不同版本功能差异
版本 | 特点 | 适用场景 |
---|---|---|
1.5B | 轻量级模型,参数量少,推理速度快,适合低资源环境。 | 短文本生成、基础问答、移动端应用(如简单智能助手)。 |
7B | 平衡型模型,性能与资源需求适中,支持中等复杂度任务。 | 文案撰写、表格处理、统计分析、简单代码生成。 |
8B | 性能略强于7B,优化逻辑推理和代码生成。 | 代码生成、逻辑推理(如数学题解决)、中等复杂度文本生成。 |
14B | 高性能模型,擅长复杂任务(如数学推理、长文本生成)。 | 数据分析、长文本生成(如研究报告)、多模态任务预处理。 |
32B | 专业级模型,支持高精度任务和大规模数据处理。 | 语言建模、金融预测、复杂病例分析(医疗场景)。 |
70B | 顶级模型,多模态任务支持,科研级分析能力。 | 高精度临床决策(医疗)、多模态数据分析、前沿科学研究。 |
671B | 超大规模基础模型,最高准确性和推理速度,支持国家级研究。 | 气候建模、基因组分析、通用人工智能探索。 |
注:671B是我们常说的满血版deepseek。
关键点
1. 输入输出
- 短文本处理(1.5B-7B):最大支持16k tokens,适合对话和短文生成。
- 长文本处理(32B+):32k-10M tokens,可处理整本书籍或科研论文。
- 多模态支持:32B及以上版本实验性支持图文混合输入,671B版本实现视频流解析。
2. 推理计算
- 数学能力:7B版本仅支持四则运算,32B版本可解微积分方程(准确率92%)。
- 代码生成:7B生成单文件脚本,14B支持全栈项目架构设计(含单元测试)。
3. 部署
- 量化支持:1.5B支持8-bit量化(体积压缩至400MB),70B需保留FP16精度。
- 分布式训练:70B版本支持千卡并行训练(吞吐量1.2 exaFLOPs),671B版本兼容量子计算节点。
DeepSeek与硬件直接的关系
参数 | 推荐显卡型号 | 显存要求 | 内存 | 存储 | 适用场景 |
---|---|---|---|---|---|
1.5B | NVIDIA RTX 3060 | 4-8GB | 8GB+ | 3GB+ SSD | 低资源设备部署、简单对话 |
7B | NVIDIA RTX 3070/4060 | 8GB+ | 16GB+ | 8GB+ NVMe SSD | 本地开发测试、中小型企业任务 |
8B | NVIDIA RTX 3090 | 8GB+ | 16GB+ | 8GB+ NVMe SSD | 高精度轻量级任务 |
14B | NVIDIA RTX 3090 | 16GB+ | 32GB+ | 15GB+ NVMe SSD | 企业级复杂任务、专业咨询 |
32B | NVIDIA A100 40GB | 24GB+ | 64GB+ | 30GB+ NVMe SSD | 高精度专业领域任务 |
70B | NVIDIA A100 80GB 多卡 | ≥40GB(多卡) | 128GB+ | 70GB+ NVMe SSD | 企业级复杂任务处理、科研 |
671B | NVIDIA H100/HGX 集群 | 640GB(8卡并行) | 512GB+ | 400GB+ NVMe SSD | 超大规模科研计算、国家级项目 |
注:32B是一个分水岭,从该版本开始对硬件要求开始急速升高。
DeepSeek系统兼容性
操作系统 | 兼容性与性能 | 问题与风险 | 工具与部署建议 |
---|---|---|---|
Windows | 支持轻量级至中型模型(如7B-32B量化版) | 底层架构限制可能导致闪退或延迟,需关闭后台程序、更新显卡驱动 | 推荐使用Ollama进行一键部署,结合任务管理器监控资源占用,性能较Linux低10%-15% |
Linux | 适配全版本模型(含70B+超算级部署) | 需注意安全防护(88.9%未防护服务器存在漏洞风险) | 通过LMDeploy优化推理速度,SGLang实现多模型协同,建议Ubuntu系统,性能最优 且支持分布式计算 |
Mac | 仅支持1.5B-8B轻量模型,依赖M系列芯片NPU加速(如M2 Ultra) | 模型选择受限,复杂任务响应延迟显著(生成速度约2-3 tokens/秒) | 必须通过Ollama进行4-bit量化压缩,优先使用Metal框架加速 |
注:部署时Linux系统最优。
部署方式选择
- 优先选 Ollama 的场景
- 快速原型开发、个人项目测试
- 硬件资源有限(如无高端 GPU)
- 无需复杂参数调优
- 优先选直接部署的场景
- 企业级服务需高并发、低延迟响应
- 需定制模型或优化底层计算(如 FP8 加速、MOE 负载均衡)
- 对数据隐私和合规性要求极高
部署步骤(Ollama方式)
1.选定适合的deepseek版本
按照自己的需求选取合适的deepseek版本,可参照上文的表格内容。
选择的依据主要是:
- 使用场景
- 功能需要
- 硬件限制
- 成本要求
2.环境准备
准备好Ubuntu系统,deepseek推荐使用Ubuntu20.04及以上版本。当前示例使用的是Ubuntu18.04版本。
当前配置情况:
- CPU:16核心
- 内存:64Gb
- 硬盘:128Gb
- GPU:RTX 4090
显卡驱动准备
准备好裸机后首先更新系统:
sudo add-apt-repository ppa:graphics-drivers/ppa #18.04版本较旧,需要加上新的驱动
sudo apt update && sudo apt upgrade -y # 更新系统包
sudo apt install nvidia-driver-535 # 安装NVIDIA驱动
安装好显卡驱动后,确认显卡运行情况:
nvidia-smi
如图所示是驱动完成。
CUDA环境准备
sudo apt update
sudo apt install nvidia-cuda-toolkit
3.安装Ollama
安装Ollama:
curl -fsSL https://ollama.ai/install.sh | sh # 执行官方安装脚本
启用Ollama:
sudo systemctl start ollama # 启动服务
ollama --version # 输出版本号即成功
可能的问题:
1.如果下载Ollama网络慢导致异常中断,可能如下所示:
curl: (16) Error in the HTTP2 framing layer
gzip: stdin: unexpected end of file
tar: Child returned status 1
tar: Error is not recoverable: exiting now
解决方案:
curl -fsSL https://ollama.com/install.sh -o ollama_install.sh
sed -i 's|https://ollama.com/download/ollama-linux|https://gh.llkk.cc/https://github.com/ollama/ollama/releases/download/v0.5.7/ollama-linux|g' ollama_install.sh
chmod +x ollama_install.sh
sudo ./ollama_install.sh
4.部署deepseek
ollama pull deepseek-r1:14b # 下载14B参数版本
整个过程需要一些时间:
5.测试使用
测试deepseek运行情况:
ollama run deepseek-r1:14b
相关文章:

【DeepSeek】Ubuntu快速部署DeepSeek(Ollama方式)
文章目录 人人都该学习的DeepSeekDeepSeek不同版本功能差异DeepSeek与硬件直接的关系DeepSeek系统兼容性部署方式选择部署步骤(Ollama方式)1.选定适合的deepseek版本2.环境准备3.安装Ollama4.部署deepseek5.测试使用 人人都该学习的DeepSeek DeepSeek 作…...

C++后端服务器开发技术栈有哪些?有哪些资源或开源库拿来用?
一、 C后台服务器开发是一个涉及多方面技术选择的复杂领域,特别是在高性能、高并发的场景下。以下是C后台服务器开发的一种常见技术路线,涵盖了从基础到高级的技术栈。 1. 基础技术栈 C标准库 C11/C14/C17/C20:使用现代C特性,如…...

基于SpringBoot的餐厅点餐管理系统设计与实现(源码+SQL脚本+LW+部署讲解等)
专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…...

服务端和客户端通信(TCP)
服务端 using System; using System.Collections.Generic; using System.Linq; using System.Net; using System.Net.Sockets; using System.Text; using System.Threading.Tasks;namespace TeachTcpServer {class Program{static void Main(string[] args){#region 知识点一 …...

Java 大视界 -- Java 大数据在智能体育赛事运动员表现分析与训练优化中的应用(122)
💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也…...

基于Spring Boot的多级缓存架构实现
基于Spring Boot的多级缓存架构实现 以下是一个基于Spring Boot的多级缓存架构实现示例 多级缓存架构实现方案 1. 依赖配置(pom.xml) <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-star…...

Git与GitHub:理解两者差异及其关系
目录 Git与GitHub:理解两者差异及其关系Git:分布式版本控制系统概述主要特点 GitHub:基于Web的托管服务概述主要特点 Git和GitHub如何互补关系现代开发工作流 结论 Git与GitHub:理解两者差异及其关系 Git:分布式版本控…...

ALG(Alloy+Loki+Grafana)轻量级日志系统
ALG(AlloyLokiGrafana)轻量级日志系统 前提要求 GrafanaMinioNginxPrometheus Grafana日志收集系统旧版是PLG(ProtailLokiGrafana), Protail收集日志, Loki存储, Grafana展示, 后续的Protail不维护了, Grafana推出了Alloy代替Pritial, 除了收集日志外, 还集成管理Prometheus各种…...
【漫话机器学习系列】121.偏导数(Partial Derivative)
偏导数(Partial Derivative)详解 1. 引言 在数学分析、机器学习、物理学和工程学中,我们经常会遇到多个变量的函数。这些函数的输出不仅取决于一个变量,而是由多个变量共同决定的。那么,当其中某一个变量发生变化时&…...

Deepseek可以通过多种方式帮助CAD加速工作
自动化操作:通过Deepseek的AI能力,可以编写脚本来自动化重复性任务。例如,使用Python脚本调用Deepseek API,在CAD中实现自动化操作。 插件开发:结合Deepseek进行二次开发,可以创建自定义的CAD插件。例如&a…...

【工具使用】IDEA 社区版如何创建 Spring Boot 项目(详细教程)
IDEA 社区版如何创建 Spring Boot 项目(详细教程) Spring Boot 以其简洁、高效的特性,成为 Java 开发的主流框架之一。虽然 IntelliJ IDEA 专业版提供了Spring Boot 项目向导,但 社区版(Community Edition)…...

QT中串口打开按钮如何点击打开后又能点击关闭
前言: if (!portOpen) { // 打开串口 if (!sp18Controller->initializePort("COM5", 38400)) { QMessageBox::critical(this, "Error", "Failed to open serial port."); return; } ui->btnOpenPort_2->setText("Close…...

【AI深度学习基础】PyTorch初探
引言 PyTorch 是由 Facebook 开源的深度学习框架,专门针对 GPU 加速的深度神经网络编程,它的核心概念包括张量(Tensor)、计算图和自动求导机制。PyTorch作为Facebook开源的深度学习框架,凭借其动态计算图和直观的API设…...

springboot011基于springboot的课程作业管理系统(源码+包运行+LW+技术指导)
项目描述 临近学期结束,还是毕业设计,你还在做java程序网络编程,期末作业,老师的作业要求觉得难了吗?不知道毕业设计该怎么办?网页功能的数量是否太多?没有合适的类型或系统?等等,你想解决的问题,今天…...

快速从C过度C++(一):namespace,C++的输入和输出,缺省参数,函数重载
📝前言: 本文章适合有一定C语言编程基础的读者浏览,主要介绍从C语言到C过度,我们首先要掌握的一些基础知识,以便于我们快速进入C的学习,为后面的学习打下基础。 这篇文章的主要内容有: 1&#x…...

PostgreSQL时间计算大全:从时间差到时区转换(保姆级教程)
一、时间计算的三大核心场景 当你遇到这些需求时,本文就是你的救星🌟: 倒计时功能:计算活动剩余天数 用户行为分析:统计操作间隔时间 跨国系统:多时区时间统一管理 报表生成:自动计算同比/环…...

laravel es 相关代码 ElasticSearch
来源: github <?phpnamespace App\Http\Controllers;use Elastic\Elasticsearch\ClientBuilder; use Illuminate\Support\Facades\DB;class ElasticSearch extends Controller {public $client null;public function __construct(){$this->client ClientB…...

题目 3220 ⭐因数计数⭐【数理基础】蓝桥杯2024年第十五届省赛
小蓝随手写出了含有 n n n 个正整数的数组 a 1 , a 2 , ⋅ ⋅ ⋅ , a n {a_1, a_2, , a_n} a1,a2,⋅⋅⋅,an ,他发现可以轻松地算出有多少个有序二元组 ( i , j ) (i, j) (i,j) 满足 a j a_j aj 是 a i a_i ai 的一个因数。因此他定义一个整数对 …...

【Java代码审计 | 第十一篇】SSRF漏洞成因及防范
未经许可,不得转载。 文章目录 SSRF漏洞成因Java中发送HTTP请求的函数1、HttpURLConnection2、HttpClient(Java 11)3、第三方库Request库漏洞示例OkHttpClient漏洞示例HttpClients漏洞示例 漏洞代码示例防范标准代码 SSRF SSRF(S…...

RabbitMQ高级特性--消息确认机制
目录 一、消息确认 1.消息确认机制 2.手动确认方法 二、代码示例 1. AcknowledgeMode.NONE 1.1 配置文件 1.2 生产者 1.3 消费者 1.4 运行程序 2.AcknowledgeMode.AUTO 3.AcknowledgeMode.MANUAL 一、消息确认 1.消息确认机制 生产者发送消息之后,到达消…...

C++复试笔记(一)
Setw 是C中用于设置输出字段宽度的函数。当使用 setw(3) 时,它会设置紧接着的输出字段的最小宽度为3个字符。如果字段内容长度小于3,则会在左侧填充空格以达到指定宽度;如果内容长度大于或等于3,则全部内容将被输出,…...

K8s 1.27.1 实战系列(四)验证集群及应用部署测试
一、验证集群可用性 1、检查节点 kubectl get nodes ------------------------------------------------------ NAME STATUS ROLES AGE VERSION k8s-master Ready control-plane 3h48m v1.27.1 k8s-node1 Ready <none> …...

基于Spring Boot的健美操评分管理系统设计与实现(LW+源码+讲解)
专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…...

H5页面在移动端自动横屏
首先需要再head标签添加这样一段代码 <meta name="viewport" content="width=device-width,height=device-width,initial-scale=1.0,user-scalable=no">因为需求是为了满足WEB端和手机端都可以查看整体效果 但由于UI没有设计移动端的样式 所以我想说…...

【从0到1搞懂大模型】神经网络的实现:数据策略、模型调优与评估体系(3)
一、数据集的划分 (1)按一定比例划分为训练集和测试集 我们通常取8-2、7-3、6-4、5-5比例切分,直接将数据随机划分为训练集和测试集,然后使用训练集来生成模型,再用测试集来测试模型的正确率和误差,以验证…...

从0到1入门RabbitMQ
一、同步调用 优势:时效性强,等待到结果后才返回 缺点: 拓展性差性能下降级联失败问题 二、异步调用 优势: 耦合度低,拓展性强异步调用,无需等待,性能好故障隔离,下游服务故障不影响…...

MySQL数据库复杂的增删改查操作
在前面的文章中,我们主要学习了数据库的基础知识以及基本的增删改查的操作。接下去将以一个比较实际的公司数据库为例子,进行讲解一些较为复杂且现时需求的例子。 基础知识: 一文清晰梳理Mysql 数据库基础知识_字段变动如何梳理清楚-CSDN博…...

点云软件VeloView开发环境搭建与编译
官方编译说明 LidarView / LidarView-Superbuild GitLab 我的编译过程: 安装vs2019,windows sdk,qt5.14.2(没安装到5.15.7),git,cmake3.31,python3.7.9,ninja下载放到…...

本地YARN集群部署
请先完成HDFS的前置部署,部署方式可查看:本地部署HDFS集群https://blog.csdn.net/m0_73641796/article/details/145998092?spm1001.2014.3001.5502 部署说明 组件配置文件启动进程备注Hadoop HDFS需修改 需启动: NameNode作为主节点 DataNode作为从节点 Secondary…...

STM32常见外设的驱动示例和代码解析
以下是针对STM32常见外设的驱动示例和代码解析,基于HAL库实现,适用于大多数STM32系列(如F1/F4/H7等),可根据具体型号调整引脚和时钟配置。 1. GPIO驱动 应用场景:控制LED、按键检测、继电器开关等。 示例代码: // 初始化LED(推挽输出) void LED_Init(void) {GPIO_In…...