当前位置: 首页 > news >正文

Linux服务升级:Almalinux 升级 DeepSeek-R1

目录

 一、实验

1.环境

2.Almalinux 部署 Ollama

3.Almalinux 升级 DeepSeek-R1

4.Almalinux 部署 docker

5. docker 部署 DeepSeek-R1

6.Almalinux 部署 Cpolar (内网穿透)

7.使用cpolar内网穿透

二、问题

1.构建容器失败


 一、实验

1.环境

(1)主机

表1 主机

系统版本软件IP备注
Almalinux9.4

Ollama

Docker

Cpolar

192.168.204.150

配置:12C 16G

(2)Termius连接主机

(3)查看系统版本

 cat /etc/os-release

(4)DeepSeek-R1版本

表2 版本

模型显存/内存备注
1.5B

需要4核CPU + 5GB内存

最低3GB显存(GTX1060+)

7B

需要8核CPU + 9GB内存

最低6GB显存(GTX1650+)

8B

需要8核CPU + 10GB内存

最低8GB显存(GTX1660+)

14B

需要12核CPU + 16GB内存

最低12GB显存(RTX3070+)

32B

需要16核CPU + 36GB内存

推荐24GB显存(RTX4090)

70B

需要32核CPU + 75GB内存

需要多卡(2xA100)

家用电脑不适用

(5)查看cpu与内存

lscpu

free -m

(6)目标版本

主机配置:12C 16G

所以目标版本:14B

2.Almalinux 部署 Ollama

(1) 查阅

https://ollama.com/download/linux

(2) 预先安装软件包

安装包pciutils (查看pci总线设备信息)

安装包lshw (查看硬件信息)

yum install -y pciutils lshw

(3)下载

curl -fsSL https://ollama.com/install.sh | sh

最后提示仅CPU模式

(4)修改配置

添加配置(让物理机可以访问)

vim /etc/systemd/system/ollama.service
……
Environment="OLLAMA_HOST=0.0.0.0"
Environment="OLLAMA_ORIGINS=*"
……

修改前:

修改后

(5)重载配置

systemctl daemon-reload

(6)重启服务

systemctl restart ollama

(7)查看端口

ss -anlp | grep 11434

(8)访问

127.0.0.1:11434

物理机访问 (linux需要关闭防火墙与selinux)

http://192.168.204.150:11434/

3.Almalinux 升级 DeepSeek-R1

 (1) 查阅

https://ollama.com/library/deepseek-r1

(2) 选择

下拉选择14b

(3)复制命令执行

ollama run deepseek-r1:14b

(4)提问

devops含义

(5)退出

ctrl +d 或 /bye

这里输入 /bye 

4.Almalinux 部署 docker

(1) 安装docker

安装软件包yum-utils

yum install yum-utils -y

添加repo源

yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo

安装

yum install docker-ce-24.0.6 -y

(2)开机启动

systemctl start dockersystemctl enable docker

(3)查阅

https://developer.aliyun.com/article/29941

(4)docker镜像加速

修改配置文件

vim /etc/docker/daemon.json

XXXXXXXX为自己的镜像加速配置

{"registry-mirrors":["https://XXXXXXXX.mirror.aliyuncs.com","https://docker.lmirror.top","https://docker.m.daocloud.io", "https://hub.uuuadc.top","https://docker.anyhub.us.kg","https://dockerhub.jobcher.com","https://dockerhub.icu","https://docker.ckyl.me","https://docker.awsl9527.cn","https://docker.laoex.link","https://ghcr.nju.edu.cn"]
} 

(5)重启

systemctl restart docker

5. docker 部署 DeepSeek-R1

(1)查阅

Open WebUI 是一个可扩展、功能丰富且用户友好的自托管 AI 平台,旨在完全离线运行。它支持各种 LLM 运行器(如Ollama)和与OpenAI 兼容的 API,并内置RAG 推理引擎,使其成为强大的 AI 部署解决方案

Github开源地址:
https://github.com/open-webui/open-webuiOpen WebUI 文档地址:  
https://docs.openwebui.com/features/

(2)拉取镜像

docker pull ghcr.io/open-webui/open-webui:main

如果拉不动,可以切换其他源拉取

# 如果拉不动的话切换镜像源
docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/ghcr.io/open-webui/open-webui:v0.5.18# 重命名镜像(如果是通过代理下载的) 
docker tag  swr.cn-north-4.myhuaweicloud.com/ddn-k8s/ghcr.io/open-webui/open-webui:v0.5.18   ghcr.io/open-webui/open-webui:main# 删除代理镜像(如果是通过代理下载的) 
docker rmi swr.cn-north-4.myhuaweicloud.com/ddn-k8s/ghcr.io/open-webui/open-webui:v0.5.18

拉取

重新打标签

删除原有镜像

(3)查看镜像

docker images

(4)环境变量

表3 环境变量

变量备注
OLLAMA_API_BASE_URL    Ollama 服务器的地址
WEBUI_SECRET_KEY密码,可用 Vaultwarden 生成的可选

(5)运行

运行容器(仅CPU)

docker run -d -p 9000:8080 -e OLLAMA_BASE_URL=http://192.168.204.150:11434 -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

查看容器

docker ps 

(6)访问

点击开始使用

http://192.168.204.150:9000

(7)创建账号密码

创建完会自动登录

(8)确认开始使用

(9)进入界面

(10)提问

devops含义

回答

6.Almalinux 部署 Cpolar (内网穿透)

(1) 官网

https://www.cpolar.com

(2)一键脚本安装命令

curl -L https://www.cpolar.com/static/downloads/install-release-cpolar.sh | sudo bash

(3)开机自启

systemctl enable cpolar

(4)启动cpolar服务

systemctl start cpolar

(5) 监听服务端口

netstat -antlp | grep 9200

(6)浏览器访问

http://localhost:9200

登录仪表盘 (输入注册的账号密码)

7.使用cpolar内网穿透

(1)内网访问open webui

(2)固定二级子域名地址

登录cpolar官网点击左侧的预留,找到保留二级子域名,为远程服务器连接保留一个固定二级子域名地址

https://www.cpolar.com

(3)创建隧道

域名类型:选择二级子域名预留的http地址:复制粘贴官网保留成功的地址,Ollama地区选择:China VIP


(4) 查看隧道列表

(4)查看在线隧道列表

(5)二级子域名地址访问

http访问

http://newollama.vip.cpolar.cn

https访问

 https://newollama.vip.cpolar.cn 

二、问题

1.构建容器失败

(1)问题

问题一

ARNING: The requested image's platform (linux/arm64) does not match the detected host platform (linux/amd64/v3) and no specific platform was requested

问题二

docker: Error response from daemon: failed to create task for container: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: exec: "-e": executable file not found in $PATH: unknown

(2)原因分析

问题一:镜像使用了arm平台,与当前系统不匹配;

问题二:尝试重启docker 内存不能分配问题解决

(2)解决方法

问题一:

删除旧镜像


重新下载linux/amd64 镜像并构建

问题二:

msg="stream copy error: reading from a closed fifo"

重启docker

成功:

相关文章:

Linux服务升级:Almalinux 升级 DeepSeek-R1

目录 一、实验 1.环境 2.Almalinux 部署 Ollama 3.Almalinux 升级 DeepSeek-R1 4.Almalinux 部署 docker 5. docker 部署 DeepSeek-R1 6.Almalinux 部署 Cpolar (内网穿透) 7.使用cpolar内网穿透 二、问题 1.构建容器失败 一、实验 1.环境 (1&#xff09…...

Linux操作系统5- 补充知识(可重入函数,volatile关键字,SIGCHLD信号)

上篇文章:Linux操作系统5-进程信号3(信号的捕捉流程,信号集,sigaction)-CSDN博客 本篇Gitee仓库:myLerningCode/l26 橘子真甜/Linux操作系统与网络编程学习 - 码云 - 开源中国 (gitee.com) 目录 一. 可重入…...

ctfshow刷题笔记—栈溢出—pwn61~pwn64

目录 前言 一、pwn61(输出了什么?) 二、pwn62(短了一点) 三、pwn63(又短了一点) 四、pwn64(有时候开启某种保护并不代表这条路不通) 五、一些shellcode 前言 这几道都是与shellcode有关的题,实在是…...

java23种设计模式-责任链模式

责任链模式(Chain of Responsibility Pattern)学习笔记 编程相关书籍分享:https://blog.csdn.net/weixin_47763579/article/details/145855793 DeepSeek使用技巧pdf资料分享:https://blog.csdn.net/weixin_47763579/article/details/145884039 🌟 模式定义 责任链模式是…...

新一代跨境电商ERP系统:从订单到发货的全流程自动化管理

随着全球电商市场的持续扩张,跨境电商卖家面临着多平台运营、国际物流、税务合规等复杂挑战。如何高效整合订单、库存、物流和财务数据,实现从客户下单到商品交付的无缝衔接,成为企业降本增效的关键。Zoho Books作为一款专为跨境商家设计的智…...

苹果廉价机型 iPhone 16e 影像系统深度解析

【人像拍摄差异】 尽管iPhone 16e支持后期焦点调整功能,但用户无法像iPhone 16系列那样通过点击屏幕实时切换拍摄主体。前置摄像头同样缺失人像深度控制功能,不过TrueTone原彩闪光灯系统在前后摄均有保留。 很多人都高估了 iPhone 的安全性,查…...

hive 面试题

Hive基础概念 1.1 Hive是什么? 基于Hadoop的数据仓库工具,支持类SQL(HiveQL)查询,底层转换为MapReduce/Tez/Spark任务。 核心功能:数据ETL、查询、分析;定位:OLAP(分析…...

VScode在windows10上使用clang-format

用途:自动调整代码格式,如缩进等。 clang-format官方文档:ClangFormat — Clang 21.0.0git documentation 前提:有一个.clang-format文件 下载LLVM:https://github.com/llvm/llvm-project/releases,将可…...

AWS API Gateway灰度验证实现

在微服务架构中,灰度发布(金丝雀发布)是验证新版本稳定性的核心手段。通过将小部分流量(如 10%)导向新版本服务,可以在不影响整体系统的情况下快速发现问题。AWS API Gateway 原生支持流量按比例分配功能,无需复杂编码即可实现灰度验证。本文将详细解析其实现方法、最佳…...

【每日八股】MySQL篇(三):索引(上)

目录 MySQL 为什么使用 B 树来做索引,它的优势是什么?特性和定义B 树和 B 树的对比拓展:既然 B 树相较于 B 树优势如此之大,为什么 nosql 的 MongoDB 底层仍采用 B 树而不是 B 树? 使用 B 树做索引的优势补充&#xff…...

在Pycharm中将ui文件修改为py文件

在Pycharm中将ui文件修改为py文件 有些时候,我们需要把QTDesigner生成的.ui文件修改为.py文件 在一些教程中,通常使用cmd打开终端修改,或者是有一些人写了一些脚本来修改 这里我们可以使用pycharm来快速的修改 首先,我们在pyc…...

看视频学习方法总结

以下是提高教学视频吸收率的系统性方法,结合认知科学原理和实际学习场景,帮助您最大化学习效果: 一、观看前的黄金准备阶段 60秒快速扫描法 用1分钟快速浏览视频目录、章节标题和简介,建立知识框架。荷兰伊拉斯姆斯大学实验表明&…...

Matlab 大量接单

分享一个matlab接私活、兼职的平台 1、技术方向满足任一即可 2、技术要求 3、最后 技术方向满足即可 MATLAB:熟练掌握MATLAB编程语言,能够使用MATLAB进行数据处理、机器学习和深度学习等相关工作。 机器学习、深度学习、强化学习、仿真、复现、算法、…...

《深度剖析:生成对抗网络中生成器与判别器的高效协作之道》

在人工智能的前沿领域,生成对抗网络(GAN)以其独特的对抗学习机制,为数据生成和处理带来了革命性的变革。生成器与判别器作为GAN的核心组件,它们之间的协作效率直接决定了GAN在图像生成、数据增强、风格迁移等众多应用中…...

Android6到Android15版本新增的功能和api

Android6到Android15版本新增的功能和api 文章目录 Android6到Android15版本新增的功能和api一、前言二、Android6 后的版本迭代1、Android 6.0(Marshmallow,API 级别 23)新增功能重要 API 2、Android 7.0(Nougat,API …...

【现代Web布局与动画技术:卡片组件实战分享】

📱 现代Web布局与动画技术:卡片组件实战分享 🚀 引言 🌟 在过去的开发过程中,我们共同实现了一个功能丰富的卡片组件,它不仅美观,还具有交互性和响应式设计。这篇文章将分享这个组件背后的技术…...

计算机网络之传输层(传输层提供的服务)

一、可靠的数据传输 传输层提供可靠的数据传输服务,确保数据在传输过程中不丢失、不重复、不乱序,并且能够被正确接收。这通常通过面向连接的协议(如TCP)来实现,TCP通过确认、重传、序号等机制来保证数据传输的可靠性…...

FPGA开发,使用Deepseek V3还是R1(1):应用场景

以下都是Deepseek生成的答案 FPGA开发,使用Deepseek V3还是R1(1):应用场景 FPGA开发,使用Deepseek V3还是R1(2):V3和R1的区别 FPGA开发,使用Deepseek V3还是R1&#x…...

哈希表和STL —— unorderde_set/unordered_map【复习笔记】

1. 哈希表的相关概念 1.1 哈希表的定义 哈希表,又称为散列表,是根据关键字直接进行访问的数据结构。 它通过一个哈希函数(Hash Function),建立了一种关键字和存储地址间的直接映射关系,将每个关键字映射…...

计算机毕业设计SpringBoot+Vue.js体育馆使用预约平台(源码+文档+PPT+讲解)

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…...

【Python】 -- 趣味代码 - 小恐龙游戏

文章目录 文章目录 00 小恐龙游戏程序设计框架代码结构和功能游戏流程总结01 小恐龙游戏程序设计02 百度网盘地址00 小恐龙游戏程序设计框架 这段代码是一个基于 Pygame 的简易跑酷游戏的完整实现,玩家控制一个角色(龙)躲避障碍物(仙人掌和乌鸦)。以下是代码的详细介绍:…...

Unity3D中Gfx.WaitForPresent优化方案

前言 在Unity中,Gfx.WaitForPresent占用CPU过高通常表示主线程在等待GPU完成渲染(即CPU被阻塞),这表明存在GPU瓶颈或垂直同步/帧率设置问题。以下是系统的优化方案: 对惹,这里有一个游戏开发交流小组&…...

在HarmonyOS ArkTS ArkUI-X 5.0及以上版本中,手势开发全攻略:

在 HarmonyOS 应用开发中,手势交互是连接用户与设备的核心纽带。ArkTS 框架提供了丰富的手势处理能力,既支持点击、长按、拖拽等基础单一手势的精细控制,也能通过多种绑定策略解决父子组件的手势竞争问题。本文将结合官方开发文档&#xff0c…...

跨链模式:多链互操作架构与性能扩展方案

跨链模式:多链互操作架构与性能扩展方案 ——构建下一代区块链互联网的技术基石 一、跨链架构的核心范式演进 1. 分层协议栈:模块化解耦设计 现代跨链系统采用分层协议栈实现灵活扩展(H2Cross架构): 适配层&#xf…...

AirSim/Cosys-AirSim 游戏开发(四)外部固定位置监控相机

这个博客介绍了如何通过 settings.json 文件添加一个无人机外的 固定位置监控相机,因为在使用过程中发现 Airsim 对外部监控相机的描述模糊,而 Cosys-Airsim 在官方文档中没有提供外部监控相机设置,最后在源码示例中找到了,所以感…...

MySQL 8.0 事务全面讲解

以下是一个结合两次回答的 MySQL 8.0 事务全面讲解,涵盖了事务的核心概念、操作示例、失败回滚、隔离级别、事务性 DDL 和 XA 事务等内容,并修正了查看隔离级别的命令。 MySQL 8.0 事务全面讲解 一、事务的核心概念(ACID) 事务是…...

第7篇:中间件全链路监控与 SQL 性能分析实践

7.1 章节导读 在构建数据库中间件的过程中,可观测性 和 性能分析 是保障系统稳定性与可维护性的核心能力。 特别是在复杂分布式场景中,必须做到: 🔍 追踪每一条 SQL 的生命周期(从入口到数据库执行)&#…...

【深度学习新浪潮】什么是credit assignment problem?

Credit Assignment Problem(信用分配问题) 是机器学习,尤其是强化学习(RL)中的核心挑战之一,指的是如何将最终的奖励或惩罚准确地分配给导致该结果的各个中间动作或决策。在序列决策任务中,智能体执行一系列动作后获得一个最终奖励,但每个动作对最终结果的贡献程度往往…...

Linux 下 DMA 内存映射浅析

序 系统 I/O 设备驱动程序通常调用其特定子系统的接口为 DMA 分配内存,但最终会调到 DMA 子系统的dma_alloc_coherent()/dma_alloc_attrs() 等接口。 关于 dma_alloc_coherent 接口详细的代码讲解、调用流程,可以参考这篇文章,我觉得写的非常…...

TCP/IP 网络编程 | 服务端 客户端的封装

设计模式 文章目录 设计模式一、socket.h 接口(interface)二、socket.cpp 实现(implementation)三、server.cpp 使用封装(main 函数)四、client.cpp 使用封装(main 函数)五、退出方法…...