当前位置：首页 > article >正文

不只是问答：灵活定义你的聊天模型

article 2026/5/13 19:07:23

上一篇文章我们装好了第一条链——提示词模板串起模型与解析器几句中文就变成了地道的英文。那一刻你可能觉得一切都尽在掌握了。可一旦把链部署给朋友试用新的问题就冒了出来朋友说“多写一点”模型却只回了一行字你希望模型扮演一个毒舌的代码审查员它却始终温文尔雅。想让模型真正为你所用光会“调用”是不够的你得学会“调校”。就像刚拿到一把新吉他你能弹响它但要弹出心中的旋律还得学会调弦和指法。今天我们就来深入聊天模型的“控制面板”看清楚那些关键的旋钮和开关。学会它们你就能随心所欲地调节模型的输出风格、长度、随机性甚至能让它在多轮对话中始终牢记自己的角色。一、参数调校拧动模型行为的旋钮1.1temperature创造力的“温度计”在所有参数中temperature是你用得最多的那个。它的名字取得很有画面感——高温分子活跃低温分子安静。放在模型上低温接近 0模型几乎总选择概率最高的词。输出稳定、可重复适合翻译、事实提取、代码生成等需要准确性的任务。高温接近 1 甚至更高模型会大胆尝试概率较低的词输出更富有“创意”和变化但也更容易跑题或胡言乱语。适合写诗、头脑风暴、生成故事。来看一个直观对比fromlangchain_deepseekimportChatDeepSeekfromlangchain_core.messagesimportHumanMessage# 低温模型严谨、收敛low_temp_modelChatDeepSeek(modeldeepseek-chat,temperature0.0)# 高温模型跳脱、发散high_temp_modelChatDeepSeek(modeldeepseek-chat,temperature1.2)questionHumanMessage(content用一句话描述下夏天的感觉)# 低温回答print(低温模型,low_temp_model.invoke([question]).content)# 高温回答多试几次每次可能不同print(高温模型,high_temp_model.invoke([question]).content)低温模型大概率会给出“夏天是炎热的季节阳光强烈万物生长”这类中规中矩的答案。而高温模型可能时不时蹦出“夏天像一壶沸腾的橘子汽水在空气里炸开蝉鸣的泡沫”这样意外生动的句子。实用建议做 RAG 问答时把temperature调到 0~0.3保证答案基于事实写宣传文案时大胆拉到 0.8 以上激发灵感。1.2max_tokens控制回答的长度有时候模型会事无巨细说个没完有时候又惜字如金。max_tokens就是给模型画一条“篇幅上限”单位是 token约等于 0.75 个英文单词或 0.5 个中文字。注意这不是“生成恰好这么长”而是一旦达到上限模型就立刻闭嘴哪怕话没说完。# 限制最多只输出 30 个 token大约十几个中文字short_modelChatDeepSeek(modeldeepseek-chat,max_tokens30)msgHumanMessage(content详细解释一下什么是面向对象编程)responseshort_model.invoke([msg])print(response.content)# 话刚起个头就截断了max_tokens在构建简洁回复如标题生成、分类标签时非常有用能避免模型啰嗦。1.3stop指定“刹车词”有时你需要模型生成到某个特定位置就自动停止。比如生成一段 JSON在}之后立即停止不再添加额外的解释。stop参数可以指定一个或多个终止字符串。# 遇到 “---” 时立即停止生成stop_modelChatDeepSeek(modeldeepseek-chat,stop[---])msgHumanMessage(content写一篇关于春天的小短文用 --- 作为结尾)responsestop_model.invoke([msg])print(response.content)# 输出不会包含 --- 之后的内容这个特性在处理结构化输出、对话剧本角色 A……角色 B……时尤其好用。1.4 一次把多个旋钮配好LangChain 允许你在创建模型实例时像填一张配置单一样把所有参数都写好然后这个模型实例就会在所有后续调用中保持统一的行为# 一个严谨、简洁、遇到感叹号就停的模型custom_modelChatDeepSeek(modeldeepseek-chat,temperature0.1,# 确定性高max_tokens100,# 最多 100 tokensstop[!],# 遇到感叹号就停)当然你也可以在不同任务里创建多个不同参数的实例完全自由。二、消息类型赋予对话以角色和记忆参数旋钮拧好了模型有了性格和语调。但真正让聊天模型“活”起来变成一个会“扮演”的家伙还要靠消息Messages。在第二篇里我们接触过SystemMessage、HumanMessage和AIMessage现在系统认识一下它们。LangChain 中消息是从langchain_core.messages导入的。三种核心消息类型各有使命消息类型角色用途SystemMessage系统指令设定助手全局行为、规则、语气。通常放在消息列表最前面。HumanMessage用户代表用户说的话是每次对话的触发者。AIMessage助手代表模型之前的回复用于构建对话历史保持多轮连贯性。2.1 系统消息给模型披上一件“身份外套”系统消息不直接与用户互动而是悄悄在后台定义游戏的玩法。一个精心编写的系统消息能让同一个模型在“严谨的数学老师”和“幽默的脱口秀演员”之间自由切换。fromlangchain_deepseekimportChatDeepSeekfromlangchain_core.messagesimportSystemMessage,HumanMessage modelChatDeepSeek(modeldeepseek-chat,temperature0.7)# 角色一严谨的数学老师teacher_systemSystemMessage(content你是一位严谨的小学数学老师。任何与数学无关的问题你都会礼貌地拒绝回答。使用简洁清晰的中文。)# 角色二幽默的脱口秀演员comedian_systemSystemMessage(content你是一位脱口秀演员回答任何问题都要用幽默的腔调如果你不知道也要编出一个搞笑的解释。)# 同一个问题看看不同身份的回复questionHumanMessage(content1 1 等于几)print(老师模式,model.invoke([teacher_system,question]).content)print(脱口秀模式,model.invoke([comedian_system,question]).content)你会看到第一个回答大约在强调“等于 2这是基本的加法事实”而第二个可能变成“这个问题问得好1加1等于‘幸福’因为把我和你加在一起就是最好的答案”2.2 对话历史让模型拥有“连续记忆”单轮问答不需要记忆但聊天应用必须记住前面说过什么。虽然 LangChain 有高级的 Memory 模块但手动管理消息列表是最基础、也是最灵活的方式。你只需把过去的HumanMessage和AIMessage依次保留每轮新问题时一起提交给模型fromlangchain_core.messagesimportSystemMessage,HumanMessage,AIMessage# 系统设定一个“喜欢宠物的朋友”history[SystemMessage(content你是一个喜欢宠物的朋友对话中时不时会提起你的猫)]# 第一轮history.append(HumanMessage(content今天天气真好))response1model.invoke(history)history.append(response1)# 把模型的回复也加进历史print(Bot:,response1.content)# 第二轮基于之前的对话history.append(HumanMessage(content那我们出去做什么好))response2model.invoke(history)history.append(response2)print(Bot:,response2.content)因为历史里已经存储了第一轮的内容第二轮的回复就会自然地承接上一轮的语境比如建议去公园散步顺便带上猫。注意每一轮都把整个历史重新发送token 消耗会随对话变长而快速增长。好在 LangChain 的 Memory 组件能帮你自动裁剪、汇总历史我们后面会专门讲。三、不止文本灵活的输出类型聊天模型的输出不仅仅是纯文本。LangChain 允许你取回更丰富的信息供后续环节使用。3.1 获取原始 AIMessageinvoke返回的是一个AIMessage对象除了content文本内容它还包含很多“幕后信息”responsemodel.invoke([HumanMessage(content你好)])print(内容:,response.content)print(消息 ID:,response.id)print(使用的 token 数量:,response.usage_metadata)# 可能包含输入/输出 token 数这些元信息对日志记录、成本监控、调试非常有价值。不需要的时候你只用content需要时它们就在那里。3.2 获取结构化输出我们将在后续文章中深入结构化输出但这里可以提前瞥一眼你可以要求模型返回 JSON 格式然后用解析器直接转成 Python 字典。例如让模型从一段描述中提取姓名和年龄。fromlangchain_core.promptsimportChatPromptTemplatefromlangchain_core.output_parsersimportStrOutputParser promptChatPromptTemplate.from_template(从以下文字中提取姓名和年龄以 JSON 格式返回只包含 name 和 age 字段\n{text})chainprompt|model|StrOutputParser()resultchain.invoke({text:张三今年28岁在北京工作})print(result)# 期望输出 {name: 张三, age: 28}目前我们暂时用字符串接收后续会用专门的 JSON 解析器自动解析成 dict四、灵活定义打造你自己的专属聊天模型上面我们分开看了参数、消息和输出。现在把它们整合成一套可复用的“角色工厂”。假设你的项目里需要一个“毒舌代码审查员”的角色到处复用你可以把它封装成一个独立模块fromlangchain_deepseekimportChatDeepSeekfromlangchain_core.messagesimportSystemMessage,HumanMessageclassCodeReviewer:def__init__(self):self.modelChatDeepSeek(modeldeepseek-chat,temperature0.3,# 保留一点幽默感但不肆意妄为max_tokens200,)self.systemSystemMessage(content你是一位毒舌但专业的代码审查员。你需要指出代码的问题并用带点讽刺但不伤害对方自尊的语气说话。)defreview(self,code:str)-str:messages[self.system,HumanMessage(contentf请审查以下代码\n\n{code})]responseself.model.invoke(messages)returnresponse.content# 使用reviewerCodeReviewer()print(reviewer.review(def add(a,b): return ab))现在毒舌审查员就成了一个你可以随时调用的对象。如果想换一个温柔的审查员只需要改一下SystemMessage的文本。这种将“模型配置角色设定”打包成组件的思路正是 LangChain 设计哲学的缩影。五、今日收获与下篇预告今天你从“会用模型”升级到了“会调模型”你掌握了temperature、max_tokens、stop等关键参数能控制模型的创造力和输出长度。你深入理解了三种消息类型能用SystemMessage设定角色用对话历史实现连续记忆。你学会了将模型配置与角色封装成可复用的组件。现在你手里的聊天模型已经不再是一个黑盒而是一台有刻度盘、有开关、能按你心意调试的精密仪器。但到目前为止模型还只能“自己说”不能“自己查”。你想让它临时算一道根号 7 的近似值它只能凭记忆猜猜错了你也没辙。如果能给模型一把瑞士军刀——让它需要时主动调用外部工具比如搜索引擎、计算器、数据库——它的能力边界会瞬间膨胀。下一篇《给你的模型配上“瑞士军刀”工具调用》我们将打开这个“工具”的黑匣子让模型学会什么时候该自己回答什么时候该掏出一把趁手的工具。这是从“玩具”到“工具”的关键一跃。下一篇见

不只是问答：灵活定义你的聊天模型

相关文章：

不只是问答：灵活定义你的聊天模型

终极开源解决方案：用Video-subtitle-extractor高效提取视频硬字幕的完整指南

NotebookLM API接入倒计时：GCP项目配额收紧前，必须完成的4步合规配置与审计清单

为什么你的Windows任务栏需要一次彻底的美学革命？

Java 数字校验实战：从工具类到正则，性能与场景的深度抉择

深入GORM源码：手把手教你为自定义字段打造专属‘Clause钩子’

一键转载革命：auto_feed_js如何让PT资源分享效率提升10倍

群晖DSM 7.2.2视频站恢复指南：三步搞定Video Station完整功能

Adobe-GenP 3.0终极指南：如何免费激活Adobe CC全系列软件

对比按需计费与TokenPlan在长期项目中的成本体感差异

Discord服务器日活破5万后ChatGPT机器人崩了？百万级消息队列+状态分片架构设计（附GitHub星标1.2k的开源模板）

RAG提示工程失效？NotebookLM上下文压缩机制深度拆解，3类文档结构适配公式即拿即用

员工管理(新增员工)、事务管理和文件上传(阿里云OSS)

NotebookLM笔记整理实战指南：5步打造自动关联知识图谱的智能笔记系统

Docker容器化高可用架构部署方案（二）

给视觉开发新手的保姆级教程：在Ubuntu上从下载源码到成功运行Demo，搞定OpenCV 3环境搭建

Markdown基础功能

Pixel-to-Space 像素到空间一镜到底·跨镜连续技术解析方案

通达信缠论分析插件：如何用开源工具实现智能技术分析

AgentDock：构建可控AI智能体的开源框架与工程实践

OAI 5G核心网搭建后，如何用Docker命令进行日常运维和故障排查？

Python调用MATLAB引擎避坑指南：从安装路径选择到`setup.py` install命令的完整实战

如何在3分钟内安装TrollStore？TrollInstallerX终极指南

别再死记硬背公式了！用“预测-更新”的贝叶斯视角，5分钟看懂卡尔曼滤波核心

PCL2启动器游戏启动失败的终极解决方案：3步快速修复指南

深度理解 C++ 继承与多态：从底层原理到实战技巧

RTKLIB2.4.3进阶：在VS2017中通过.conf与命令行参数高效驱动PPP数据处理

Perplexity学术模式尚未开放的4个隐藏功能（仅限IEEE Fellow级用户测试通道泄露）

别再复制粘贴了！手把手教你从零配置一个生产可用的log4j2.xml文件

AI写专著的技巧与工具：一键生成20万字专著，开启写作新体验！