当前位置：首页 > news >正文

Ollama部署 DeepSeek-R1:70B 模型的详细步骤

news 2025/12/27 18:52:15

1. 确认环境准备

(1) 硬件要求

显存需求：70B 参数的模型需要大量显存。若使用 NVIDIA T4（16GB 显存），需多卡并行（如 8 卡）或开启量化（如 q4_0、q8_0）。
内存需求：建议至少 64GB 系统内存。
存储空间：模型文件约 40-140GB（取决于量化方式）。

(2) 软件依赖

安装 Ollama（确保版本支持自定义模型）：
```
curl -fsSL https://ollama.com/install.sh | sh
```

2. 下载 DeepSeek-R1:70B 模型

(1) 若模型已存在于本地

直接通过 Ollama 加载：
```
ollama run deepseek-r1:70b
```

(2) 若需自定义模型

创建 Modelfile 定义模型参数（示例）：

FROM deepseek-r1:70b
PARAMETER num_gpu 8  # 使用 8 卡 GPU
PARAMETER num_ctx 4096  # 上下文长度
PARAMETER quantize q4_0  # 量化方式（可选）

构建自定义模型：

ollama create deepseek-r1-custom -f Modelfile

3. 启动 Ollama 服务

(1) 启动模型

前台运行（调试模式）：
```
ollama serve
```
后台运行（生产环境）：
```
systemctl start ollama
```

(2) 检查模型状态

查看已加载模型：

ollama list

输出应包含：

NAME            ID              SIZE      MODIFIED
deepseek-r1:70b 0c1615a8ca32    42 GB     2 hours ago

4. 配置外部访问

默认情况下，Ollama 仅监听 127.0.0.1:11434，需修改为允许外部访问：

(1) 修改监听地址

编辑 Ollama 环境变量：

sudo vim /etc/systemd/system/ollama.service

添加：

[Service]
Environment="OLLAMA_HOST=0.0.0.0:11434"

重启服务：

sudo systemctl daemon-reload
sudo systemctl restart ollama

(2) 开放防火墙端口

开放 11434 端口：

sudo ufw allow 11434/tcp
sudo ufw reload

(3) 验证监听状态

netstat -tuln | grep 11434

输出应为：

tcp  0  0 0.0.0.0:11434  0.0.0.0:*  LISTEN

5. 调用模型 API

(1) 通过 Curl 测试

curl http://<服务器IP>:11434/api/generate -d '{"model": "deepseek-r1:70b","prompt": "你好，DeepSeek！","stream": false
}'

(2) 使用 Python 客户端

import requestsresponse = requests.post("http://<服务器IP>:11434/api/generate",json={"model": "deepseek-r1:70b","prompt": "如何部署大模型？","stream": False}
)
print(response.json()["response"])

6. 性能优化

(1) 多 GPU 并行

启动时指定 GPU 数量：
```
OLLAMA_NUM_GPU=8 ollama serve
```

(2) 量化模型

使用 q4_0 或 q8_0 量化减少显存占用：

ollama run deepseek-r1:70b --quantize q4_0

(3) 调整批处理大小

在 Modelfile 中设置：

PARAMETER num_batch 512  # 根据显存调整

7. 常见问题解决

(1) 显存不足

现象：CUDA out of memory
解决：
- 减少 num_batch。
- 启用量化（quantize q4_0）。
- 增加 GPU 数量。

(2) 服务无法启动

现象：Failed to bind port 11434
解决：
- 检查端口占用：lsof -i :11434。
- 关闭冲突进程或更换端口。

(3) 模型加载失败

现象：Model deepseek-r1:70b not found
解决：
- 确认模型文件路径正确。
- 重新下载模型：ollama pull deepseek-r1:70b。

总结

通过上述步骤，你可以在 Ollama 上成功部署 DeepSeek-R1:70B 模型，并支持外部网络访问。如果遇到性能问题，优先通过量化和多 GPU 并行优化资源占用。若需进一步扩展，可结合 Kubernetes 或 Docker Swarm 实现集群化部署。

Ollama部署 DeepSeek-R1:70B 模型的详细步骤

1. 确认环境准备 (1) 硬件要求显存需求：70B 参数的模型需要大量显存。若使用 NVIDIA T4（16GB 显存），需多卡并行（如 8 卡）或开启量化（如 q4_0、q8_0）。内存需求：建议至…...

编程日记 2025/2/9 15:47:07

PAT乙级( 1009 说反话 1010 一元多项式求导)C语言版本超详细解析

1009 说反话给定一句英语，要求你编写程序，将句中所有单词的顺序颠倒输出。输入格式： 测试输入包含一个测试用例，在一行内给出总长度不超过 80的字符串。字符串由若干单词和若干空格组成，其中单词是由英文字母&#x…...

编程日记 2025/2/9 15:45:00

学习笔记十九：K8S生成pod过程

K8S生成pod过程流程图具体生成过程用户提交 Pod 定义API Server 处理请求调度器分配节点（Scheduling）目标节点上的 Pod 创建网络配置状态上报与监控控制器管理（Controller Manager）就绪与服务发现关键错误场景高级特性流程图具…...

编程日记 2025/2/9 15:40:54

Qwen2-VL：增强视觉语言模型对世界任意分辨率的感知能力

1、摘要 Qwen2-VL系列是Qwen-VL模型的高级升级版本，它重新定义了传统视觉处理中预设分辨率的方法。Qwen2-VL引入了Naive Dynamic Resolution机制，使模型能够动态处理不同分辨率的图像，并将其转换为不同数量的视觉标记。这种机制使模型能够生…...

编程日记 2025/2/9 15:39:52

原神新版本角色牌上新七圣召唤增添新玩法

在原神这款游戏中，5.4版本更新后七圣召唤玩法将新增2张角色牌和对应天赋牌、3张行动牌，并进行部分卡牌平衡调整，今天就给大家介绍一下。一、角色牌【基尼奇】 1.元素战技：选一个我方角色，自身附属钩索链接并进入夜魂…...

编程日记 2025/2/9 15:38:50

Spring 中的事务隔离级别以及传播行为

1. 事务隔离级别（Isolation Level） 事务隔离级别定义了事务在并发环境下的行为，主要解决以下问题： 脏读（Dirty Read）：一个事务读取了另一个未提交事务的数据。不可重复读（Non-Re…...

编程日记 2025/2/9 15:37:49

为多个GitHub账户配置SSH密钥

背景当需要同时使用多个GitHub账户（例如工作和个人账户）时，默认的SSH配置可能导致冲突。本文介绍如何通过生成不同的SSH密钥对并配置SSH客户端来管理多个账户。操作步骤生成SSH密钥对为每个GitHub账户生成独立的密钥对，并指…...

编程日记 2025/2/9 15:36:48

OSPF基础（3）：区域划分

OSPF的区域划分 1、区域产生背景路由器在同一个区域中泛洪LSA。为了确保每台路由器都拥有对网络拓扑的一致认知，LSDB需要在区域内进行同步。OSPF域如果仅有一个区域，随着网络规模越来越大，OSPF路由器的数量越来越多，这将导致诸…...

编程日记 2025/2/9 15:35:46

android studio无痛入门

在Android Studio中创建和管理项目主要涉及以下几个步骤： 1. 创建新项目打开Android Studio，点击“Start a new Android Studio project”或者“File” > “New” > “New Project”。选择一个模板，例如“Empty Activity”&#xff0…...

编程日记 2025/2/9 15:34:43

免费windows pdf编辑工具Epdf

Epdf（完全免费） 作者：不染心时间：2025/2/6 Github: https://github.com/dog-tired/Epdf Epdf Epdf 是一款使用 Rust 编写的 PDF 编辑器，目前仍在开发中。它提供了一系列实用的命令行选项，方便用户对 PDF …...

编程日记 2025/2/9 15:31:39

CNN 卷积神经网络处理图片任务 | PyTorch 深度学习实战

前一篇文章，学习率调整策略 | PyTorch 深度学习实战本系列文章 GitHub Repo: https://github.com/hailiang-wang/pytorch-get-started CNN 卷积神经网络 CNN什么是卷积工作原理深度学习的卷积运算提取特征不同特征核的效果比较卷积核感受野共享权重池化示例源码 …...

编程日记 2025/2/9 15:29:37

LeetCode 128: 最长连续序列

LeetCode 128: 最长连续序列题目: 给定一个未排序的整数数组 nums ，找出数字连续的最长序列（不要求序列元素在原数组中连续）的长度。请你设计并实现时间复杂度为 O(n) 的算法解决此问题。示例 1： 输入：nums […...

编程日记 2025/2/9 15:26:33

大语言模型需要的可观测性数据的关联方式

可观测性数据的关联方式及其优缺点随着现代分布式架构和微服务的普及，可观测性（Observability）已经成为确保系统健康、排查故障、优化性能的重要组成部分。有效的可观测性数据关联方式不仅能够帮助我们实时监控系统的运行状态，还…...

编程日记 2025/2/9 15:22:29

【韩顺平linux】部分上课笔记整理

整理一下一些韩顺平老师上课时候的笔记课程：【小白入门通俗易懂】韩顺平一周学会Linux linux环境：使用阿里云服务器笔记参考 ： [学习笔记]2021韩顺平一周学会Linux 一、自定义函数基本语法应用实例： 计算两个参数的和…...

编程日记 2025/2/9 15:21:27

先安装： pip install pyttsx3再运行： import pyttsx3 # 初始化语音引擎 def init_engine():engine pyttsx3.init()# 设置中文语音voices engine.getProperty(voices)for voice in voices:if chinese in voice.name.lower():engine.setProperty(voice…...

编程日记 2025/2/9 15:20:26

【Golang学习之旅】Golang 内存管理与 GC 机制详解

文章目录前言1. Go 语言的内存管理的简述2. Golang 内存管理机制2.1 Go 语言的内存分配模型2.2 Go 变量分配示例2.3 Go 语言的内存池（sync.Pool） 3. Golang 垃圾回收（GC）机制详解3.1 Go 的 GC 机制概述3.2 GC 触发条件3.3 手动触…...

编程日记 2025/2/9 15:18:24

Kamailio 各个功能的共同点、不同点及应用场景

Kamailio 各个功能的共同点、不同点及应用场景： 功能共同点不同点应用场景SIP 注册服务器处理用户注册请求，维护用户位置信息专注于用户设备的注册和注销，维护设备位置企业内部通信系统，确保用户设备的动态注册和注销SIP 代理服务…...

编程日记 2025/2/9 15:17:22

Linux（CentOS）安装 Nginx

CentOS版本：CentOS 7 Nginx版本：1.24.0 两种安装方式： 一、通过 yum 安装，最简单，一键安装，全程无忧。二、通过编译源码包安装，需具备配置相关操作。最后附：设置 Nginx 服务开…...

编程日记 2025/2/9 15:16:21

string 与 wstring 的字符编码

测试代码： #include<stdio.h> #include<stdlib.h> #include<windows.h> #include <locale.h> #include <string> #include <iostream>// 函数用于计算UTF-8字符串中的字符数 int utf8_strlen(const char* str) {int len = 0;for (; *s…...

编程日记 2025/2/9 15:15:19

C#面试常考随笔14: 方法如何传递不定数量的参数？params关键字怎么使用？

使用params关键字，就可以像python传参那样传递多个参数，类似元组主要作用 params 关键字的主要作用是让方法可以接受不定数量的参数，而不需要在调用方法时显式地创建数组来传递多个参数。这为方法调用提供了更大的灵活性，使得代…...

编程日记 2025/2/9 15:14:18

【Linux】C语言执行shell指令

在C语言中执行Shell指令在C语言中，有几种方法可以执行Shell指令： 1. 使用system()函数这是最简单的方法，包含在stdlib.h头文件中： #include <stdlib.h>int main() {system("ls -l"); // 执行ls -l命令retu…...

编程新知 2025/11/20 18:42:48

无法与IP建立连接，未能下载VSCode服务器

如题，在远程连接服务器的时候突然遇到了这个提示。查阅了一圈，发现是VSCode版本自动更新惹的祸！！！ 在VSCode的帮助->关于这里发现前几天VSCode自动更新了，我的版本号变成了1.100.3 才导致了远程连接出…...

编程新知 2025/12/19 23:23:11

3-11单元格区域边界定位(End属性)学习笔记

返回一个Range 对象，只读。该对象代表包含源区域的区域上端下端左端右端的最后一个单元格。等同于按键 End 向上键(End(xlUp))、End向下键(End(xlDown))、End向左键(End(xlToLeft)End向右键(End(xlToRight)) 注意：它移动的位置必须是相连的有内容的单元格…...

编程新知 2025/12/19 21:20:22

JavaScript基础-API 和 Web API

在学习JavaScript的过程中，理解API（应用程序接口）和Web API的概念及其应用是非常重要的。这些工具极大地扩展了JavaScript的功能，使得开发者能够创建出功能丰富、交互性强的Web应用程序。本文将深入探讨JavaScript中的API与Web AP…...

编程新知 2025/8/21 23:03:46

AirSim/Cosys-AirSim 游戏开发（四）外部固定位置监控相机

这个博客介绍了如何通过 settings.json 文件添加一个无人机外的固定位置监控相机，因为在使用过程中发现 Airsim 对外部监控相机的描述模糊，而 Cosys-Airsim 在官方文档中没有提供外部监控相机设置，最后在源码示例中找到了，所以感…...

编程新知 2025/12/19 22:42:04

mac 安装homebrew (nvm 及git)

mac 安装nvm 及git 万恶之源 mac 安装这些东西离不开Xcode。及homebrew 一、先说安装git步骤通用： 方法一：使用 Homebrew 安装 Git（推荐） 步骤如下：打开终端（Terminal.app） 1.安装 Homebrew…...

编程新知 2025/12/21 17:17:17

在鸿蒙HarmonyOS 5中使用DevEco Studio实现企业微信功能

1. 开发环境准备安装DevEco Studio 3.1： 从华为开发者官网下载最新版DevEco Studio安装HarmonyOS 5.0 SDK 项目配置： // module.json5 {"module": {"requestPermissions": [{"name": "ohos.permis…...

编程新知 2025/12/13 6:14:10

学习一下用鸿蒙DevEco Studio HarmonyOS5实现百度地图

在鸿蒙（HarmonyOS5）中集成百度地图，可以通过以下步骤和技术方案实现。结合鸿蒙的分布式能力和百度地图的API，可以构建跨设备的定位、导航和地图展示功能。 1. 鸿蒙环境准备开发工具：下载安装 De…...

编程新知 2025/11/13 2:37:01

Vue 模板语句的数据来源

🧩 Vue 模板语句的数据来源：全方位解析 Vue 模板（<template> 部分）中的表达式、指令绑定（如 v-bind, v-on）和插值（{{ }}）都在一个特定的作用域内求值。这个作用域由当前组件…...

编程新知 2025/10/4 11:36:04

密码学基础——SM4算法

博客主页：christine-rr-CSDN博客专栏主页：密码学 📌 【今日更新】📌 对称密码算法——SM4 目录一、国密SM系列算法概述二、SM4算法 2.1算法背景 2.2算法特点 2.3 基本部件 2.3.1 S盒 2.3.2 非线性变换编辑…...

编程新知 2025/12/25 5:07:46