当前位置：首页 > news >正文

【deepseek-r1模型】linux部署deepseek

news 2026/2/10 0:00:49

1、快速安装

Ollama 下载：Download Ollama on macOS

Ollama 官方主页：https://ollama.com

Ollama 官方 GitHub 源代码仓库：https://github.com/ollama/ollama/

官网提供了一条命令行快速安装的方法。

（1）下载Ollama

curl -fsSL https://ollama.com/install.sh | sh

此命令将自动下载最新版本的 Ollama 并完成安装，以下是 Ollama 使用常见的指令：

ollama serve         #启动ollama
ollama create        #从模型文件创建模型
ollama show          #显示模型信息
ollama run           #运行模型
ollama pull          #从注册表中拉取模型
ollama push          #将模型推送到注册表
ollama list          #列出模型
ollama cp            #复制模型
ollama rm            #删除模型
ollama help          #获取有关任何命令的帮助信息

验证安装完成，在 Exec 处输入：

ollama -h

输出如下：即表示安装成功🎉

（2）开启并使用 Ollama

1).在Service中增加下面两行

vi /etc/systemd/system/ollama.service

Environment="OLLAMA_HOST=0.0.0.0"

Environment="OLLAMA_ORIGINS=*"

2).首先，在终端中开启 Ollama，并在后台挂起(这里有可能有问题，启动的时候是127.0.0.1监听的)

ollama serve

（3）下载大模型

然后下载大模型选择Models 选择一个模型我这里选择的是deepseek-r1

执行命令以下是成功的结果

（4）以下是常用的指令

1.运行指定大模型指令

ollama run deepseek-r1:7b

2.停止ollama服务

systemctl stop ollama

3.指令启动方式(这个是解决ollama serve启动时ip监听错误的指令)

OLLAMA_HOST=0.0.0.0:11434 /usr/local/bin/ollama serve

这是错误的监听界面

这是正确的监听界面

2. Ollama接口概览

Ollama 提供了以下主要接口：

(1) 生成文本

URL: POST /api/generate
功能: 向模型发送提示（prompt），生成文本。

请求体:

{"prompt": "你的提示文本","max_tokens": 50, // 可选，生成的最大 token 数量"temperature": 0.7, // 可选，控制生成文本的随机性"top_p": 0.9, // 可选，控制生成文本的多样性"stop": ["\n", "。"] // 可选，生成停止的标记
}

响应体:

{"response": "模型生成的文本","tokens_used": 50 // 使用的 token 数量
}

(2) 对话模式

URL: POST /api/chat
功能: 与模型进行多轮对话。

请求体:

{"messages": [{"role": "user", "content": "你好！"},{"role": "assistant", "content": "你好，有什么可以帮助你的？"}],"max_tokens": 100, // 可选，生成的最大 token 数量"temperature": 0.7 // 可选，控制生成文本的随机性
}

响应体:

{"response": "模型生成的回复","tokens_used": 100 // 使用的 token 数量
}

(3) 获取模型信息

URL: GET /api/model
功能: 获取当前加载的模型信息。

响应体:

{"model_name": "deepseek-r1:7b","model_size": "7B",
}

(4) 重新加载模型

URL: POST /api/reload
功能: 重新加载模型。

请求体:

{"model": "deepseek-r1:7b" // 可选，指定重新加载的模型
}

响应体:

{"status": "success","message": "Model reloaded successfully"
}

(5) 停止服务

URL: POST /api/stop
功能: 停止 Ollama 服务。

响应体:

{"status": "success","message": "Service stopped successfully"
}

3. 参数说明

参数名	类型	说明
`prompt`	string	生成文本的提示。
`messages`	array	对话模式中的消息列表，每条消息包含 `role` （user/assistant）和 `content` 。
`max_tokens`	integer	生成的最大 token 数量。
`temperature`	float	控制生成文本的随机性，值越高越随机。
`top_p`	float	控制生成文本的多样性，值越高越多样。
`stop`	array	生成停止的标记列表。

4. 错误响应

如果请求失败，Ollama 会返回以下格式的错误信息：

{"error": "错误描述","code": 400 // 错误码
}

常见错误码：

400: 请求参数错误。
404: 接口不存在。
500: 服务器内部错误。

5. 注意事项

确保 Ollama 服务已正确启动，并且模型 deepseek-r1:7b 已加载。
如果服务监听在 127.0.0.1，外部无法访问，请修改为 0.0.0.0。
如果需要更高的性能，可以调整模型的参数（如 max_tokens 和 temperature）。

6. Java调用demo

public static void main(String[] args) {try (CloseableHttpClient httpClient = HttpClients.createDefault()) {HttpPost post = new HttpPost("http://你的ip:11434/api/generate");// 注意Ollama的API参数格式String json = "{"+ "\"model\": \"deepseek-r1:7b\","+ "\"prompt\": \"Hello World!\","
//                    + "\"temperature\": 0.7,"  // 新增温度参数
//                    + "\"top_p\": 0.9,"        // 新增top_p参数+ "\"stream\": false,"  // 是否启用流式   true时会逐个返回结果，而不是一次性返回全部结果+ "\"max_tokens\": 50"+ "}";post.setEntity(new StringEntity(json));post.setHeader("Content-Type", "application/json");HttpResponse response = httpClient.execute(post);String result = EntityUtils.toString(response.getEntity());System.out.println("API Response:\n" + result);// 解析 JSONJSONObject jsonObject = JSON.parseObject(result);// 提取 "response" 字段的值String responseStr = jsonObject.getString("response");// 去除 HTML 标签（如果需要）String cleanedResponse = responseStr.replaceAll("\\u003c/?.*?\\u003e", "").trim();// 打印结果System.out.println(String.format("提取的回答内容：%s", cleanedResponse));} catch (Exception e) {e.printStackTrace();}}

以下是请求成功的示例

如果对你有帮助请帮忙点个👍

【deepseek-r1模型】linux部署deepseek

1、快速安装 Ollama 下载：Download Ollama on macOS Ollama 官方主页：https://ollama.com Ollama 官方 GitHub 源代码仓库：https://github.com/ollama/ollama/ 官网提供了一条命令行快速安装的方法。 （1）下载Olla…...

编程日记 2025/2/20 9:35:56

【Github每日推荐】-- 2024 年项目汇总

1、AI 技术项目简述OmniParser一款基于纯视觉的 GUI 智能体，能够准确识别界面上可交互图标以及理解截图中各元素语义，实现自动化界面交互场景，如自动化测试、自动化操作等。ChatTTS一款专门为对话场景设计的语音生成模型，主要用…...

编程日记 2025/2/20 9:34:54

C++中的.*运算符

看运算符重载的时候，看到这一句 .* :: sizeof ?: . 注意以上5个运算符不能重载。 :: sizeof ?: . 这四个好理解，毕竟都学过，但.*是什么？ 于是自己整理了一下 .* 是一种 C 中的运算符，称为指针到成…...

编程日记 2025/2/20 9:30:50

深度学习笔记——LSTM

大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍面试过程中可能遇到的LSTM知识点。文章目录 LSTM（Long Short-Term Memory）LSTM 的核心部件LSTM 的公式和工作原理(1) 遗忘门&a…...

编程日记 2025/2/20 9:28:47

spring boot知识点2

1.spring boot 要开启一些特性，可通过什么方式开启 a.通过Enable注解，可启动定时服务 b.通过application.properties可设置端口号等地址信息 2.什么是热部署，以及spring boot通过什么方式进行热部署热部署这个概念，我知道。就…...

编程日记 2025/2/20 9:27:45

【机器学习】CNN与Transformer的表面区别与本质区别

仅供参考表面区别 1. 结构和原理： CNN：主要通过卷积层来提取特征，这些层通过滑动窗口（卷积核）捕捉局部特征，并通过池化层（如最大池化）来降低特征的空间维度。CNN非常适合处理具有网格状拓扑结构的数据，如图像。Transformer：基于自注意力（Self-Attention）机制，能…...

编程日记 2025/2/20 9:26:44

框架篇 - Hearth ArcGIS 框架扩展（DryIoC、Options、Nlog...）

框架篇 - Hearth ArcGISPro Addin 框架扩展（DryIoC、Options、Nlog…）文章目录框架篇 - Hearth ArcGISPro Addin 框架扩展（DryIoC、Options、Nlog...）1 使用IoC、DI1.1 服务注册1.1.1 `ServiceAttribute`服务特性1.2 依赖注入1.2.1 SDK底层创建实例类型依赖注入1.2.2 `In…...

编程日记 2025/2/20 9:20:37

JUC并发—7.AQS源码分析三

大纲 1.等待多线程完成的CountDownLatch介绍 2.CountDownLatch.await()方法源码 3.CountDownLatch.coutDown()方法源码 4.CountDownLatch总结 5.控制并发线程数的Semaphore介绍 6.Semaphore的令牌获取过程 7.Semaphore的令牌释放过程 8.同步屏障CyclicBarrier介绍 9.C…...

编程日记 2025/2/20 9:18:35

windows系统本地部署DeepSeek-R1全流程指南：Ollama+Docker+OpenWebUI

本文将手把手教您使用OllamaDockerOpenWebUI三件套在本地部署DeepSeek-R1大语言模型，实现私有化AI服务搭建。一、环境准备 1.1 硬件要求 CPU：推荐Intel i7及以上（需支持AVX2指令集） 内存：最低16GB，推荐…...

编程日记 2025/2/20 9:15:32

当C#邂逅Deepseek, 或.net界面集成deepseek

最近，我开发了一个C#界面，并集成了Deepseek的接口功能，实现了本地化部署和流模式读取。过程充满了挑战和乐趣，也让我深刻体会到Deepseek的强大之处。今天，我想和大家分享这段经历，希望能激发你对Deepseek的…...

编程日记 2025/2/20 9:13:29

Cursor实战：Web版背单词应用开发演示

Cursor实战：Web版背单词应用开发演示需求分析自行编写需求文档借助Cursor生成需求文档前端UI设计后端开发项目结构环境参数数据库设计安装Python依赖运行应用前端代码修改测试前端界面测试数据生成功能测试Bug修复总结在上一篇《Cursor AI编程助手不完全指南》…...

编程日记 2025/2/20 9:11:26

Kotlin Lambda

Kotlin Lambda 在探索Kotlin Lambda之前，我们先回顾下Java中的Lambda表达式，Java 的 Lambda 表达式是 Java 8 引入的一项强大的功能，它使得函数式编程风格的代码更加简洁和易于理解。Lambda 表达式允许你以一种更简洁的方式表示实现接口&…...

编程日记 2025/2/20 9:10:25

V4L2驱动之UVC

以下是关于V4L2摄像头驱动框架与UVC协议的关联分析，从内核驱动到用户空间的完整视角： 1. V4L2驱动框架核心架构关键组件： 核心层 (V4L2 Core) v4l2_device：设备的总入口，管理所有子组件video_device：对应…...

编程日记 2025/2/20 9:08:22

numpy(01 入门)

前面内容：pandas(01 入门) 目录一、numpy 简介 1.1 Numpy 应用场景 1.2 Numpy 优点 1.3 Numpy 缺点 1.4 相关链接二、Numpy环境安装配置 2.1 Python自带包 2.2 Numpy 安装三、NumPy.Ndarray 3.1 ndarray特点： 3.2 ndarray()参数&…...

编程日记 2025/2/20 9:07:21

Chatgpt论文润色指令整理

1. 内容润色这个来自文章《three ways ChatGPT helps me in my academic writing》。在输入你要润色的内容前，先输入以下内容来驯化chatgpt的身份： I’m writing a paper on [话题] for a leading [学科/杂志] academic journal. What I tried to s…...

编程日记 2025/2/20 9:06:19

vscode复制到下一行

linux中默认快捷键是ctrl shift alt down/up 但是在vscode中无法使用，应该是被其他的东西绑定了，经测试，可以使用windows下的快捷键shift alt down/up { “key”: “shiftaltdown”, “command”: “editor.action.copyLinesDownAction”…...

编程日记 2025/2/20 9:04:17

Python天梯赛刷题-五分题（上）

蓝桥杯题刷的好累，感觉零帧起手、以题带学真的会很吃力，打算重新刷一点天梯的题目巩固一下，我本人在算法非常不精通的情况下，自认为天梯的L1的题是会相对容易一些的，可能有一些没有脑子光靠力气的“硬推”hhhh。从头…...

编程日记 2025/2/20 9:03:15

【优先级队列】任务分配

任务分配问题，有n个任务，每个任务有个达到时间。将这些任务分配给m个处理器，进行处理。每个处理器的处理时间不一样。处理器的任务列表有最大任务数限制。分配任务的策略是：当前待分配的任务的处理时刻最小。如果处理时刻相同&am…...

编程日记 2025/2/20 9:02:14

设计模式之适配模式是什么？以及在Spring AOP中的拦截器链的使用源码解析。

前言本文涉及到适配模式的基本用法，以及在Spring AOP中如何使用，首先需要了解适配模式的工作原理，然后结合Spring AOP的具体实现来详细详细解析源码。首先，适配模式，也就是Adapter Pattern，属于结构型设计…...

编程日记 2025/2/20 8:58:09

Python 库自制 Cross-correlation 算法

Python 库自制 Cross-correlation 算法引言正文引言虽然 Scipy 库中包含了成熟的 Cross-correlation 算法，但是有些时候我们无法使用现成的库进行数据处理。这里介绍如何使用 Python 基础函数自制 Cross-correlation 算法。后续读者可以将该算法转换为其他各类语言。正文…...

编程日记 2025/2/20 8:57:08

19c补丁后oracle属主变化，导致不能识别磁盘组

补丁后服务器重启，数据库再次无法启动 ORA01017: invalid username/password; logon denied Oracle 19c 在打上 19.23 或以上补丁版本后，存在与用户组权限相关的问题。具体表现为，Oracle 实例的运行用户（oracle）和集…...

编程新知 2026/2/8 4:37:10

C++_核心编程_多态案例二-制作饮品

#include <iostream> #include <string> using namespace std;/*制作饮品的大致流程为：煮水 - 冲泡 - 倒入杯中 - 加入辅料利用多态技术实现本案例，提供抽象制作饮品基类，提供子类制作咖啡和茶叶*//*基类*/ class AbstractDr…...

编程新知 2026/2/8 20:42:55

基于距离变化能量开销动态调整的WSN低功耗拓扑控制开销算法matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.算法仿真参数 5.算法理论概述 6.参考文献 7.完整程序 1.程序功能描述通过动态调整节点通信的能量开销，平衡网络负载，延长WSN生命周期。具体通过建立基于距离的能量消耗模型&am…...

编程新知 2026/2/6 5:38:46

FFmpeg 低延迟同屏方案

引言在实时互动需求激增的当下，无论是在线教育中的师生同屏演示、远程办公的屏幕共享协作，还是游戏直播的画面实时传输，低延迟同屏已成为保障用户体验的核心指标。FFmpeg 作为一款功能强大的多媒体框架，凭借其灵活的编解码、数据…...

编程新知 2025/11/4 6:26:59

渲染学进阶内容——模型

最近在写模组的时候发现渲染器里面离不开模型的定义，在渲染的第二篇文章中简单的讲解了一下关于模型部分的内容，其实不管是方块还是方块实体，都离不开模型的内容 🧱 一、CubeListBuilder 功能解析 CubeListBuilder 是 Minecraft Java 版模型系统的核心构建器，用于动态创…...

编程新知 2025/11/25 22:59:17

srs linux

下载编译运行 git clone https:///ossrs/srs.git ./configure --h265on make 编译完成后即可启动SRS # 启动 ./objs/srs -c conf/srs.conf # 查看日志 tail -n 30 -f ./objs/srs.log 开放端口默认RTMP接收推流端口是1935，SRS管理页面端口是8080，可…...

编程新知 2026/2/6 9:49:55