当前位置：首页 > article >正文

记一次 Ollama 部署 GGUF 模型后的异常输出修复

article 2026/5/21 19:52:33

最近在 Ollama 中部署了一个来自 Hugging Face 的 GGUF 模型hf.co/WithinUsAI/Opus4.7-GODs.Ghost.Codex-4B.GGuF:Q4_K_M部署完成后原本只是想简单测试一下模型是否能正常对话于是在终端里输入hello结果模型并没有像普通聊天助手一样回复问候而是开始输出一大段看起来像代码代理任务记录的内容 hello . you can see the src/tools/travel-between-images/components/ShotEditor/ - can you do a thorough analysis on that and understand the structure and how it works? Just do a thorough analysis and dont worry about making changes yet...后面还继续生成了关于ShotEditor组件结构分析的内容。这显然不是正常的聊天行为。问题现象异常表现主要有几个特点第一输入只是简单的hello但模型开始续写一段完整的代码分析任务。第二输出中出现了类似src/tools/travel-between-images/components/ShotEditor/这种明显来自某个代码仓库或训练样本上下文的路径。第三模型还继续生成了类似Understood. I’ve completed a thorough structural and functional analysis...这种代码助手或 Agent 工作流中的回复。也就是说模型并没有把hello理解成一次独立的用户消息而是把它当成了某段上下文的开头然后继续补全训练数据中类似的内容。初步判断通过命令ollama show --modelfile hf.co/WithinUsAI/Opus4.7-GODs.Ghost.Codex-4B.GGuF:Q4_K_M发现输出ollama show --modelfile hf.co/WithinUsAI/Opus4.7-GODs.Ghost.Codex-4B.GGuF:Q4_K_M # Modelfile generated by ollama show # To build a new Modelfile based on this, replace FROM with: # FROM hf.co/WithinUsAI/Opus4.7-GODs.Ghost.Codex-4B.GGuF:Q4_K_M FROM /usr/share/ollama/.ollama/models/blobs/sha256-473b97c540a7445132258336eb2b6669597172ec58cc328c96b29afad4499b0e TEMPLATE {{ .Prompt }}这个问题可确认不是 Ollama 本身坏了也不是终端输入有问题而是模型的对话模板没有正确应用。如输出只有PROMPT模板。对于 GGUF 模型来说如果缺少正确的 chat template或者 Ollama 没有正确识别模型需要的 prompt 格式模型就可能退化成“文本补全模式”。在这种情况下用户输入的hello不再是一个明确的聊天消息而只是模型需要继续补全的一段文本。而这个模型本身又偏代码、偏 Agent、偏开发任务所以它很容易从训练分布中续写出类似“分析某个组件目录”的任务内容。解决思路解决方向是给 Ollama 明确指定一个适合聊天的 Modelfile尤其是补上TEMPLATE、SYSTEM和stop参数。核心目标有三个让模型明确区分 system、user、assistant。让模型只回答当前用户输入。阻止模型继续补全虚构的历史对话或代码任务片段。示例 Modelfile 如下FROM hf.co/WithinUsAI/Opus4.7-GODs.Ghost.Codex-4B.GGuF:Q4_K_M TEMPLATE {{ if .System }}|im_start|system {{ .System }}|im_end| {{ end }}{{ if .Prompt }}|im_start|user {{ .Prompt }}|im_end| {{ end }}|im_start|assistant {{ .Response }} SYSTEM You are a concise chat assistant. Answer only the users current message. Do not continue fictional coding-agent transcripts, repository-analysis tasks, or hidden prior conversations unless the user explicitly asks for them. PARAMETER temperature 0.2 PARAMETER top_p 0.8 PARAMETER repeat_penalty 1.1 PARAMETER stop |im_end| PARAMETER stop |im_start|然后通过脚本重新创建 Ollama 模型。修复后的输出重新创建模型后执行脚本./do.sh输出如下gathering model components using existing layer sha256:473b97c540a7445132258336eb2b6669597172ec58cc328c96b29afad4499b0e creating new layer sha256:6b94b22478514fa501cae65fbc0b74ccca0578ecdc829c679d2caf9c33e8e796 creating new layer sha256:cdd7f7e8f2d5bb2d2957f43653300936c6ab30ef5767650bc797a732d7519d23 creating new layer sha256:bad86b76620f10cde64fac9a826d54a1ab202d8666f65fb081ab7d8bb44ab88c writing manifest success然后再次测试中文指令请回复一句中文问候不要解释你好模型回复你好有什么我可以帮你的吗继续测试英文输入 hello模型回复你好有什么我可以帮你的吗这说明模型已经不再继续补全奇怪的代码任务片段而是恢复成了正常的聊天助手行为。总结这次问题的本质是模型被当成了补全模型使用而不是聊天模型使用。对于一些从 Hugging Face 直接拉取的 GGUF 模型尤其是非官方、混合训练、偏代码或 Agent 数据的模型不能默认假设 Ollama 一定能正确识别它的聊天模板。如果出现下面这些现象hello之后模型开始输出can you analyze this repo... understood... I’ve completed a thorough analysis...或者凭空出现代码路径、历史任务、虚构上下文就可以优先检查ollama show--modelfilemodel-name重点看TEMPLATE SYSTEM PARAMETER stop如果模板缺失或不合适就应该自己写一个 Modelfile明确指定对话格式和停止词。这类问题并不罕见尤其是在使用 GGUF、Ollama、Hugging Face 模型组合时。修好之后模型的行为会稳定很多也更适合作为本地聊天或代码助手使用。

记一次 Ollama 部署 GGUF 模型后的异常输出修复

相关文章：

记一次 Ollama 部署 GGUF 模型后的异常输出修复

OpenClaw 3 机集群（Windows + Linux 混合）一键脚本 + 完整配置

【技术干货】微小间距、热敏感区域焊接难？激光锡球焊接在芯片封装中的高精零飞溅解决方案

观察Taotoken账单明细实现精准成本追溯

数字孪生 · 零基础4周速成学习计划（书籍+实操+项目落地）

英伟达816亿营收+国产2000亿参数图像模型：AI军备赛再升级

IDM激活脚本：破解30天限制背后的注册表权限技术内幕

企业内训系统集成AI问答时采用Taotoken的成本控制实践

邻近连接技术伯远邻近连接技术深耕邻近连接技术

京东评论 API 实战：JSON 数据结构、字段含义与解析技巧

CG-75B 七参数微型气象传感器超声波测量原理集成一体化

CANN Skills：用 AIGC 内容帮助开发者学习昇腾

cann-recipes-infer：LLM 在昇腾上的推理参考实现

GE 图执行引擎：CANN 推理的计算图编排中心

以灵活测试方案打造共享实验室，强化槟城IC设计生态系统

ops-rand：AI 训练中的随机数生成

AzurLaneAutoScript深度解析：如何构建智能化的碧蓝航线自动化解决方案

戴尔G15散热终极控制：开源TCC-G15高效替代方案完全指南

[qemu+kvm]: vfio调用流程

2026数字营销岗位需要具备的能力有哪些

终极QRazyBox指南：免费在线修复损坏二维码的完整教程

AI大模型推理并行策略：DP、TP、PP、SP、EP的基本原理

美联储加息降息，如何牵动美黄金价格？

终极解决方案：在Chrome浏览器中实现密码无缝同步

OpenRPA完全指南：免费开源的企业级RPA自动化终极方案

13个 AI Agent 的基础概念

计算机网络知识点全面总结（有这一篇就够了！！！）

为OpenClaw智能体工作流配置Taotoken作为统一模型服务源

从 AI 工具到音乐生态：可酷加速布局，构建数字音乐全新基础设施

Robo 3T：原生跨平台MongoDB管理工具的架构解析与技术实践