当前位置: 首页 > article >正文

离线服务器大模型日常运维命令速查手册

离线服务器大模型日常运维命令速查手册背景在内网 GPU 服务器上使用 Docker 部署了 PaddleOCR端口 6511和 Ollama Qwen2.5-7B端口 11434两个 AI 服务。本文梳理出日常操作中会用到的常用命令涵盖容器管理、模型操作、资源监控、网络排错等方面方便快速查阅和应急处理。一、Docker 容器管理1. 查看容器状态# 列出所有运行中的容器dockerps# 列出所有容器包括已停止的dockerps-a# 仅显示 ollama 和 paddleocr 容器dockerps--filternameollamadockerps--filternamepaddleocr2. 启动 / 停止 / 重启容器# 停止 ollama 容器服务不可用dockerstop ollama# 启动已存在的 ollama 容器dockerstart ollama# 重启 ollama 容器常用于修改配置后dockerrestart ollama# 强制停止容器kill 信号dockerkillollama# 对 PaddleOCR 容器也适用容器名可能不同请根据实际名称调整dockerstop paddleocr-vl-apidockerstop paddleocr-vlm-server3. 进入容器内部# 进入 ollama 容器的 bash 终端dockerexec-itollamabash# 进入 PaddleOCR 的 API 容器根据实际容器名调整dockerexec-itpaddleocr-vl-apibash4. 查看容器日志# 查看 ollama 容器的最新日志持续输出dockerlogs-f--tail100ollama# 查看 PaddleOCR API 容器日志dockerlogs-f--tail100paddleocr-vl-api# 查看推理引擎日志dockerlogs-f--tail100paddleocr-vlm-server# 显示最近 50 行并退出dockerlogs--tail50ollama5. 查看容器资源占用# 实时显示 CPU、内存、网络等信息dockerstats ollama# 查看所有容器的资源占用不加容器名dockerstats6. 容器开机自启设置# 容器创建时已通过 --restart unless-stopped 启用自启如需修改dockerupdate--restartunless-stopped ollama二、Ollama 模型管理1. 列出已安装的模型# 直接调用容器内的 ollama 命令dockerexec-itollama ollama list2. 导入新模型GGUF 格式# 假设已将 .gguf 文件放置在宿主机 /root/hjl/data/ 并已挂载为 /models/host# 进入容器dockerexec-itollamabash# 创建 Modelfilecat/tmp/ModelfileEOF FROM /models/host/your_model.gguf TEMPLATE |im_start|system {{ .System }}|im_end| |im_start|user {{ .Prompt }}|im_end| |im_start|assistant EOF# 创建模型模型名为自定义名称ollama create mymodel:latest-f/tmp/Modelfile# 退出容器exit3. 删除模型dockerexec-itollama ollamarmqwen2.5:7b4. 测试模型 API# 在宿主机上直接测试curlhttp://localhost:11434/api/generate-d{ model: qwen2.5:7b, prompt: hello, stream: false }# 如果使用内网 IP例如 10.13.13.221curlhttp://10.13.13.221:11434/api/generate-d{ model: qwen2.5:7b, prompt: hello, stream: false }三、GPU 与系统资源监控1. GPU 状态# 查看 GPU 利用率、显存占用、进程列表nvidia-smi# 持续监控每 2 秒刷新watch-n2nvidia-smi2. CPU 和内存# 查看内存总量和使用量free-h# 动态查看 CPU 和内存使用退出按 qtop# 更友好的监控工具如果安装了 htophtop3. 磁盘空间# 查看所有挂载分区的使用情况df-h# 查看某个目录的大小du-sh/root/hjl/data/四、网络和端口检查1. 查看端口监听状态# 列出所有监听的 TCP 端口ss-tlnp# 过滤特定端口ss-tlnp|grep-E6511|114342. 检查端口连通性# 在服务器本地测试curl-Ihttp://localhost:11434# 如果本地能通但外部不通可能是防火墙拦截# 临时开放端口需 root 权限重启后失效iptables-IINPUT-ptcp--dport11434-jACCEPT# 检查防火墙规则firewalld 或 iptablesfirewall-cmd --list-ports# 如果使用 firewalldiptables-LINPUT-n|grep11434# 如果使用 iptables3. 从远程机器测试# 在你的 Windows 电脑上测试PowerShellTest-NetConnection-ComputerName 10.13.13.221-Port 11434五、进程和系统服务管理1. 查看与 ollama 相关的进程psaux|grepollama2. 如果 Ollama 不是在容器中运行而是直接安装的可以用 systemd 管理本例是容器但作为参考# 启动/停止/重启sudosystemctl start ollamasudosystemctl stop ollamasudosystemctl restart ollama# 查看服务状态sudosystemctl status ollama# 设置开机自启sudosystemctlenableollama六、文件管理常用操作1. 复制和移动文件# 将宿主机文件复制到容器内dockercp/host/path/file.txt ollama:/container/path/# 将容器内文件复制到宿主机dockercpollama:/container/path/file.txt /host/path/2. 查看模型文件夹大小ls-lh/root/hjl/data/3. 清理 Docker 未使用的资源谨慎# 清理无用的镜像、容器、网络dockersystem prune-a七、快速排错组合命令1. 检查整个服务健康# 查看两个核心容器是否在运行dockerps--filternameollamadockerps--filternamepaddleocr# 检查两个 API 是否响应curl-shttp://localhost:6511/healthcurl-shttp://localhost:11434/api/generate-d{model:qwen2.5:7b,prompt:ping,stream:false}2. 查看容器启动失败的原因dockerlogs--tail50ollama21|head-50# 或者用 journalctl如果是原生安装3. 如果堡垒机突然失联紧急释放资源# 停止 ollama 容器释放显存和内存dockerstop ollama# 如果整个系统卡死可通过服务器本地控制台输入# 或者强制重启服务器不推荐八、注意事项端口开放6511和11434都需要内网防火墙允许访问否则外部调用失败。显存余量定期执行nvidia-smi确保总显存占用不超过 46 GB。日志空间Docker 日志默认无大小限制建议在启动容器时添加--log-opt max-size10m参数防止日志占满磁盘。模型更新更换模型文件后需要进入容器重新ollama create文件名不要冲突。本文档覆盖了日常运维中最常用的命令可当作速查表贴在桌边。如有新需求可继续补充。

相关文章:

离线服务器大模型日常运维命令速查手册

离线服务器大模型日常运维命令速查手册背景:在内网 GPU 服务器上,使用 Docker 部署了 PaddleOCR(端口 6511)和 Ollama Qwen2.5-7B(端口 11434)两个 AI 服务。本文梳理出日常操作中会用到的常用命令&#x…...

王者营地 Token获取:从 SSL Pinning 绕过到 Frida 动态插桩

王者营地官方英雄战力数据抓包实战:从 SSL Pinning 绕过到 Frida 动态插桩获取Token 背景:近期在研究王者荣耀英雄战力数据时,需要通过王者营地 App 获取官方战力榜接口参数。过程中遇到了 HTTPS 抓包失败、SSL Pinning 拦截等问题&#xff0…...

Better Godot MCP:用AI助手与Model Context Protocol提升Godot游戏开发效率

1. 项目概述:当AI助手遇上游戏引擎如果你是一名独立游戏开发者,或者正在学习使用Godot引擎,那么你肯定经历过这样的场景:脑子里有一个绝妙的游戏机制想法,但在实现时,却要花大量时间在编辑器里拖拽节点、编…...

DeepPCB:突破PCB缺陷检测技术瓶颈的工业级解决方案

DeepPCB:突破PCB缺陷检测技术瓶颈的工业级解决方案 【免费下载链接】DeepPCB A PCB defect dataset. 项目地址: https://gitcode.com/gh_mirrors/de/DeepPCB 在智能制造时代,PCB(印刷电路板)缺陷检测是电子制造业质量控制的…...

Neovim状态栏插件moo-statusline:模块化设计与高效定制指南

1. 项目概述:一个为现代开发者定制的状态栏插件如果你是一个重度使用Neovim或Vim的开发者,那么对编辑器的状态栏一定不会陌生。它通常位于编辑器窗口的底部,默默地展示着当前文件的信息、光标位置、Git分支状态等。然而,原生Vim的…...

AMD Ryzen内存时序监控终极指南:ZenTimings工具快速上手教程

AMD Ryzen内存时序监控终极指南:ZenTimings工具快速上手教程 【免费下载链接】ZenTimings 项目地址: https://gitcode.com/gh_mirrors/ze/ZenTimings 想要深入了解AMD Ryzen平台内存性能表现?ZenTimings是一款专为AMD Ryzen处理器设计的开源内存…...

实战指南:基于快马平台快速开发全栈tokenpo质押收益农场应用

今天想和大家分享一个最近在InsCode(快马)平台上快速搭建的实战项目——tokenpo质押收益农场应用。这个项目完美模拟了DeFi领域常见的代币质押和流动性挖矿场景,特别适合想学习全栈开发的朋友练手。 项目背景与需求分析 代币质押是区块链应用中非常经典的功能&#…...

中国词元:构建AI新基建的生态密码

在AI产业迎来范式变革的关键节点,中国科技企业正在书写全新的基础设施标准。中国词元(Chinese Tokens)这一创新概念,正在通过"中国模型中国GPU中国绿色能源"的三元架构,重塑全球AI竞争格局。开源中国旗下模力方舟Moark与口袋龙虾Po…...

告别高成本DAC!用单片机PWM+RC滤波,低成本搞定LM5175数控电源的电压调节

低成本数控电源方案:用PWMRC滤波替代DAC驱动LM5175 在硬件开发领域,预算限制常常是创新路上的绊脚石。当我们面对一个需要精确电压控制的电源项目时,传统方案会毫不犹豫地选择高精度DAC芯片。但现实情况是,一块16位DAC的价格可能比…...

2026年工地无塔供水压力罐批发厂家,这些靠谱之选你知道吗?

2026 年,在工地建设中,无塔供水压力罐的稳定运行至关重要。河南飞龙圣无塔供水设备有限公司作为行业老牌企业,有着丰富的经验,能为大家解决诸多供水难题。很多工地在使用无塔供水压力罐时,会遇到各种问题。比如水压不稳…...

【深度解析】从 Chatbot 到 AI 数字队友:Claude 高阶能力、模型选型与 API 实战

摘要 本文基于 Claude 高阶使用方法,系统拆解 Memory、Projects、Artifacts、Code Execution、Computer Use 等能力,并结合 OpenAI 兼容 API 给出 Python 实战示例,帮助开发者构建更稳定、可复用的 AI 工作流。背景介绍:为什么很多…...

小红书上的“三天写完论文”是真的吗?我试了,真的

生成式人工智能技术的飞速发展,正深刻重塑高校学术写作的范式与流程。传统学术创作长期面临选题模糊、框架搭建困难、文献处理繁琐、格式排版机械、重复率与 AIGC 检测压力大等多重痛点,严重挤占学生科研思考与核心创作的时间精力。以智能学术写作平台为…...

JSXBIN解密技术深度解析:Jsxer如何高效还原Adobe加密脚本

JSXBIN解密技术深度解析:Jsxer如何高效还原Adobe加密脚本 【免费下载链接】jsxer A fast and accurate JSXBIN decompiler. 项目地址: https://gitcode.com/gh_mirrors/js/jsxer 在Adobe创意生态系统中,JSXBIN格式作为ExtendScript脚本的二进制加…...

【深度解析】Google AI Studio Vibe Coding 更新:从 Prompt 生成到可视化应用构建闭环

摘要 Google AI Studio 的 Vibe Coding 正从“输入提示词生成 Demo”演进为“可视化应用构建器”。本文解析 Prompt 自动补全、设计预览、编辑模式与内联素材生成的技术价值,并给出可落地的 AI Prompt 编排实战方案。背景介绍:Vibe Coding 正在从文本驱动…...

AI工具搭建自动化视频生成Video Combine

# 聊一个挺有意思的视频生成工具:Video Combine 这些年AI视频工具层出不穷,每天都能刷到新的产品。但说实话,多数工具要么太花哨,要么就是个包装壳子。前几天翻GitHub的时候,意外发现了一个叫Video Combine的东西&…...

短剧拉片网站2026推荐,满足多样分析需求

短剧拉片网站2026推荐,满足多样分析需求在短剧市场蓬勃发展的2026年,据《2026中国短剧行业发展报告》显示,短剧市场规模持续增长,用户数量不断攀升。然而,对于众多短剧创作者、从业者以及爱好者来说,找到一…...

2026 热门网页游戏推荐,耐玩不氪金的网页游戏大盘点

在快节奏的当下,无需下载、即开即玩的网页游戏依旧是众多玩家休闲娱乐的优选。2026 年的页游市场百花齐放,既有经典 IP 的焕新回归,也有创新玩法的惊喜亮相,更关键的是,一大批耐玩不氪金的良心佳作脱颖而出&#xff0c…...

C++模板技术(泛型编程)

template<typename T> T sum(T a,T b){return ab; }以上称呼为函数模板&#xff0c;调用时生成模板函数template<typename T> int sum(T a, T b) {return a b; } template<> int sum(int * a,int* b) {return *a*b; }int main(int agvn, char* agvc[]) {in…...

蓝桥杯单片机CT107D平台:用PCF8591的DAC做个简易数字电压表(附完整代码)

蓝桥杯单片机CT107D平台&#xff1a;基于PCF8591的闭环数字电压表设计与实现 在蓝桥杯单片机竞赛中&#xff0c;CT107D开发平台因其丰富的外设和稳定的性能成为热门选择。其中&#xff0c;PCF8591这颗集成了ADC和DAC功能的芯片&#xff0c;常被用于模拟信号处理的经典案例。本文…...

STM32CubeMX配置GPIO输入时,上拉/下拉电阻到底怎么选?一个按键电路原理图讲明白

STM32CubeMX配置GPIO输入时&#xff0c;上拉/下拉电阻到底怎么选&#xff1f;一个按键电路原理图讲明白 1. 从硬件原理到软件配置的完整思考路径 很多STM32初学者在使用CubeMX配置GPIO输入模式时&#xff0c;面对"Pull-up/Pull-down"选项常常感到困惑&#xff1a;这个…...

AI编程助手安全防护:AgentCheck实时监控与行为纠正系统

1. 项目概述&#xff1a;为AI编程助手装上“刹车系统” 最近在深度使用Claude、Cursor-Agent这类AI编程助手时&#xff0c;我遇到了一个既普遍又棘手的问题&#xff1a;当我不在屏幕前实时监督时&#xff0c;这些“聪明”的助手为了快速完成任务&#xff0c;常常会采取一些“务…...

astral-sh发布的musl和gnu版本standalone python 性能比较

musl版本standalone python在wsl默认的ubuntu中无法运行。说是找不到文件&#xff0c;其实文件就在那里 C:\d>wget https://mirror.nju.edu.cn/github-release/astral-sh/python-build-standalone/LatestRelease/cpython-3.14.5rc1%2B20260504-x86_64-unknown-linux-musl-in…...

5分钟掌握八大网盘极速下载:LinkSwift直链助手完全攻略

5分钟掌握八大网盘极速下载&#xff1a;LinkSwift直链助手完全攻略 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 &#xff0c;支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼…...

在wsl中使用cython.txt

Cython 的本质可以总结如下&#xff1a;Cython 是包含 C 数据类型的 Python。 Cython 是 Python&#xff1a;几乎所有 Python 代码都是合法的 Cython 代码。 &#xff08;存在一些限制&#xff0c;但是差不多也可以。&#xff09; Cython 的编译器会转化 Python 代码为 C 代码&…...

2026年相城木托盘回收,厂家直收省心又划算

在仓储物流行业&#xff0c;木托盘是必不可少的周转工具&#xff0c;但大量闲置托盘堆积在仓库角落&#xff0c;不仅占用空间&#xff0c;还增加管理成本。2026年&#xff0c;苏州相城地区的企业发现&#xff0c;与其找零散回收商低价处理&#xff0c;不如直接联系厂家直收。以…...

前端八股整理总索引|JS/TS、HTML/CSS、Vue、浏览器、工程化与手写题

文章目录一、JavaScript / TypeScript 篇二. CSS 篇三. VUE 篇四. 工程化篇五. 浏览器篇六. 手写篇一、JavaScript / TypeScript 篇 前端八股整理&#xff08;JavaScript 01&#xff09;&#xff5c;interface/type 区别、数组常用方法、 与 前端八股整理&#xff08;JavaScr…...

SwiftUI与WebSocket构建iOS原生IM应用:从原理到实战

1. 项目概述&#xff1a;一个iOS原生即时通讯应用的诞生最近在GitHub上看到一个挺有意思的开源项目&#xff0c;叫sam-david/clawtalk-ios。光看名字&#xff0c;“ClawTalk”&#xff0c;直译过来是“爪语”或者“爪聊”&#xff0c;带着点神秘和趣味性。这其实是一个用SwiftU…...

熵减开发悖论突破方案:软件测试的破局之道

在软件测试领域&#xff0c;“熵减”早已成为高频关键词。测试工作的核心&#xff0c;本就是在混乱的需求、多变的环境与随机的缺陷中&#xff0c;建立秩序、降低不确定性。然而&#xff0c;当我们深入实践那些被奉为圭臬的熵减方法时&#xff0c;一个尖锐的悖论却逐渐浮现&…...

平行宇宙数据同步协议:软件测试的多维挑战与验证体系

在分布式系统、元宇宙与智能物联深度融合的今天&#xff0c;软件运行生态正从单一的单体架构&#xff0c;演化为由不同设备终端、云边端环境、数据副本集群乃至用户感知节点构成的“平行宇宙”协同系统。数据同步协议作为维系这些宇宙间一致性的核心纽带&#xff0c;其可靠性直…...

二向箔压缩测试极限挑战

一、从科幻到现实&#xff1a;二向箔压缩测试的概念溯源刘慈欣科幻巨著《三体》中&#xff0c;二向箔作为宇宙规律武器&#xff0c;能将三维空间及物质不可逆坍缩为二维平面&#xff0c;其核心逻辑是“降维”“压缩”与“信息损耗”。当我们以软件测试从业者的视角审视这一概念…...