当前位置: 首页 > article >正文

02. 你必须真正理解的核心概念 大模型学习(基础篇)

1. Prompt 是什么Prompt就是你输入给模型的内容。但在真实系统里Prompt 往往不是一句话而是一整组内容的组合例如system instruction历史消息当前用户问题检索出来的文档片段输出格式约束一个糟糕的 PromptTell me about Java.问题太宽泛没有说明面向谁没有说明要输出什么结构一个更好的 Prompt请向一个有 2 年经验的后端开发解释 Java 是什么。 用通俗语言。 包含 1. Java 的定义 2. 企业为什么常用 Java 3. 一个简单代码例子 总长度控制在 200 字以内。为什么更好目标受众明确范围明确输出结构明确长度约束明确2. System Prompt 和 User Prompt在 Chat 场景里消息通常带有角色。2.1 System PromptSystem Prompt 决定“这个助手整体应该怎么说、怎么做”。例如你是一个 Java 教学助手解释时要尽量通俗每次都给出一个小例子不要使用未解释的术语。2.2 User PromptUser Prompt 则是“当前这一轮具体要完成什么任务”。例如解释一下 Spring Boot 的自动配置是什么意思。2.3 为什么这俩要分开理解你可以把它理解成system prompt 这一轮请求里的长期规则user prompt 这一轮请求里的当前任务这有点像system prompt 决定“这个接口的通用约束”user prompt 决定“这次具体传入了什么业务参数”3. Token 是什么Token是模型内部处理文本时使用的切分单位。它不是严格等于一个字一个单词一个句子不同 tokenizer 对文本的切法不同。例如Hello world可能被切成几个 tokenLangChain4j可能会被切成和你直觉不一样的片段中文通常和字符更接近但也不是绝对一字一 token为什么你必须关心 TokenToken 会直接影响成本响应速度上下文窗口占用历史内容是否会被截断一个实际例子如果你一次请求里塞了这些东西很长的 system prompt十几轮聊天历史三段检索文档一个新的用户问题那么模型在“正式回答前”已经消耗了一大堆 token 预算。而回答本身也会继续消耗输出 token。4. Context Window 是什么Context Window上下文窗口可以简单理解成这次请求中模型一次最多能处理的输入和输出总量。它更像“这一轮请求的工作记忆”而不是永久记忆。如果超出限制常见结果一般是请求失败早期消息被裁剪检索内容被缩减输出被截断一个直观例子假设你的一次请求里包含8000 token 的历史消息6000 token 的检索文档500 token 的当前问题如果你的模型或配置承受不了这么大体量就必须裁掉一部分内容。一定要分清上下文窗口不是记忆系统。如果产品需要“记住之前说过的话”通常是应用层在做这些事重新发送部分历史消息对历史消息做摘要把事实存进数据库后再检索回来5. Temperature 是什么Temperature控制生成时的随机性倾向。你可以先这样理解温度低更保守、更稳定、更像固定答法温度高更发散、更有变化、更像在创作例子Prompt给一家咖啡店写一句宣传语。低温度风格可能更像新鲜咖啡用心呈现。高温度风格可能更像让整座城市在一口烘焙香气里醒来。什么时候适合低温度信息抽取分类事实性总结稳定业务输出什么时候可以适当高一点头脑风暴slogan 生成创意写作需要多个版本时6. 低温度不等于真这是初学者非常容易踩的坑。低温度只能让模型“更稳定地按一种风格输出”不代表它更知道事实。如果它本来就不知道某个事实低温度只是可能让它更稳定地说错。真正影响真实性的通常是有没有可靠上下文有没有做检索有没有调用工具有没有做校验7. 幻觉是什么幻觉就是模型给出了一段流畅、自然、像真的一样但其实没有依据或者是错的内容。例子总结一下公司 X 在 2027 年年报里的收入变化。如果这个年报根本没给它它也可能照样写出一段“看起来很像分析报告”的话。常见诱因没有提供源材料Prompt 模糊问题涉及变化很快的事实强迫模型必须给出答案一个更稳的 Prompt 模式只能基于提供的材料回答。 如果材料中没有答案就明确说“提供的材料中未找到”。这不能百分百杜绝幻觉但会明显降低胡编乱造的概率。8. Structured Output 为什么重要很多时候你根本不想要“一段写得很好看的话”你要的是可解析、可验证、可落库的结构化数据。例如{category:billing,urgency:high,sentiment:negative}对 Java 系统来说结构化输出的价值非常大更容易解析更容易校验更容易进入后续业务流程9. Prompt 是怎么一步步变好的版本 1Analyze this customer message.太模糊。版本 2Analyze this customer message. Tell me the sentiment and urgency.比刚才好但仍然偏松。版本 3分析下面这条客户消息。 以 JSON 返回并且只能包含这些字段 - sentiment: positive、neutral、negative - urgency: low、medium、high - summary: 一句话总结 客户消息 I was charged twice and nobody has replied for three days.这个版本就更接近“可控的业务输入”了。10. 用 Java 后端思维类比 Prompt如果你熟悉 REST API可以这样理解差的 API 契约输入不清楚输出不清楚错误行为不清楚差的 Prompt任务不清楚边界不清楚输出格式不清楚所以 Prompt Engineering 不是什么玄学它更像是为模型设计一个清晰、稳定、可约束的接口契约。11. 本章结论Prompt 质量会直接影响输出质量。Token 是成本、延迟、上下文容量的预算单位。Context Window 是单次请求的工作记忆不是永久记忆。Temperature 控制随机性不控制真伪。幻觉是大模型系统的常见风险必须通过设计来压制。对 Java 项目来说结构化输出尤其关键。

相关文章:

02. 你必须真正理解的核心概念 大模型学习(基础篇)

1. Prompt 是什么 Prompt 就是你输入给模型的内容。 但在真实系统里,Prompt 往往不是一句话,而是一整组内容的组合,例如: system instruction历史消息当前用户问题检索出来的文档片段输出格式约束 一个糟糕的 Prompt Tell me abou…...

AI开发新范式——规范驱动开发(SDD):OpenSpec如何为AI Agent注入项目记忆【SDD实践篇】

1. 为什么AI开发需要"项目记忆"? 想象一下你刚加入一个新项目,面对几十万行代码和一堆文档时的茫然感——这就是AI助手在增量开发时的日常困境。我去年用Cursor开发一个电商推荐系统时就深有体会:每次让AI添加功能,它都…...

OpenClaw健康助手:Qwen3-32B解析智能手表数据生成周报

OpenClaw健康助手:Qwen3-32B解析智能手表数据生成周报 1. 为什么需要本地化的健康数据分析 去年体检报告上的几项异常指标让我意识到,虽然戴着智能手表记录了海量数据,但这些数字从未真正转化为 actionable insights。尝试过几个主流健康应…...

Z-Image-Turbo模型效果对比:不同采样算法与步数下的生成质量

Z-Image-Turbo模型效果对比:不同采样算法与步数下的生成质量 最近在玩图像生成模型,发现一个挺有意思的现象:同一个模型,用不同的“配方”去生成,出来的图片效果天差地别。这“配方”里,最关键的两味料就是…...

DataX动态传参实战:如何灵活配置数据同步任务(含案例解析)

DataX动态传参实战:如何灵活配置数据同步任务(含案例解析) 在企业级数据同步场景中,频繁修改配置文件已成为数据工程师的痛点。DataX作为阿里巴巴开源的高效数据同步工具,其动态传参功能能显著提升复杂场景下的配置效率…...

用Python实现五子棋AI:从蒙特卡洛树搜索到Alpha-Beta剪枝的完整实战指南

用Python实现五子棋AI:从蒙特卡洛树搜索到Alpha-Beta剪枝的完整实战指南 五子棋作为经典的双人策略游戏,其AI实现一直是算法与工程结合的绝佳试验场。本文将带您从零开始构建一个完整的五子棋AI系统,不仅涵盖蒙特卡洛树搜索(MCTS&…...

mPLUG视觉问答体验:无需联网,上传图片问问题,AI帮你分析细节

mPLUG视觉问答体验:无需联网,上传图片问问题,AI帮你分析细节 1. 引言:让图片开口说话的智能助手 想象一下这样的场景:你正在整理旅行照片,看到一张复杂的街景照片,想知道画面中有多少个人、他…...

【开题答辩全过程】以 基于python的天气预测可视化系统为例,包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…...

污水口水质在线监测系统方案

水污染治理工作中,实现排水口、入河口等场景的监测是第一步。建立高效可靠的污水口水质在线监测系统,能够快速识别异常故障信息,从而快速定位诊断采取措施,确保水污染得到及时管控,避免污染事故扩大。通过水利水文网关…...

华为设备实战:3种代理ARP配置全解析(路由式+VLAN内+VLAN间)

华为设备代理ARP配置实战指南:从原理到场景化部署 在复杂的企业网络环境中,代理ARP(Proxy ARP)技术常常是解决特定连通性问题的"秘密武器"。作为网络工程师,你是否遇到过这样的场景:两个 logica…...

HuggingFace模型下载路径修改指南:告别~/.cache/huggingface爆盘困扰

HuggingFace模型下载路径修改指南:告别~/.cache/huggingface爆盘困扰 你是否也遇到过这样的场景:兴致勃勃地准备跑一个最新的开源大模型,结果huggingface-cli download命令一执行,系统盘瞬间飘红,紧接着就是令人头疼的…...

Ghidra vs IDA:逆向工具对比与Java脚本开发指南

Ghidra vs IDA:逆向工程双雄的深度对比与Java脚本开发实战 逆向工程领域的两大标杆工具——Ghidra与IDA Pro,长期占据着安全研究人员的工具箱。本文将深入剖析两者的设计哲学差异,并通过实际案例展示如何利用Ghidra的Java脚本扩展能力构建自动…...

提示词的时代快结束了,下一个是什么?

前两天我做了一件事,让我对Al的理解彻底变了。 在MiniMax Agent中,有一项实用的Expert功能。无论你擅长哪个领域,都能将自己积累的相关经验、成熟的工作流程以及核心判断标准,用通俗的自然语言进行梳理描述,进而封装成…...

DailyTxT+cpolar 打造专属私密日记,外网也能安全看!告别数据泄露!

DailyTxT 是一款主打隐私保护的开源私人日记系统,核心功能围绕日常日记记录展开,支持文字撰写、日期归档、关键词搜索、图片上传以及内容收藏等实用操作,适配想要记录生活、工作点滴,又注重数据隐私的人群 —— 比如职场人记录工作…...

Keil MDK 5.38a实战:3分钟搞定Hex文件生成与烧录(Windows 11环境)

Keil MDK 5.38a高效开发指南:Hex文件生成与烧录全流程解析 在嵌入式开发领域,时间就是竞争力。当项目进入交付阶段,如何快速生成可执行文件并完成烧录,往往成为工程师们最关心的实际问题。特别是在Windows 11环境下使用Keil MDK 5…...

快速体验AI视觉定位:Chord模型Web界面使用详解,上传图片+输入文字=获得结果

快速体验AI视觉定位:Chord模型Web界面使用详解,上传图片输入文字获得结果 1. 引言 你有没有想过,如果电脑能像人一样,看着一张图片,然后根据你的文字描述,准确地找到图片里的某个东西,那该多方…...

使用mPLUG-Owl3-2B构建智能Mathtype公式编辑器:自然语言转数学表达式

使用mPLUG-Owl3-2B构建智能Mathtype公式编辑器:自然语言转数学表达式 让数学公式编辑像说话一样简单 还记得上次写论文时,被复杂的数学公式折磨得焦头烂额的情景吗?一个个符号手动输入,稍有不慎就格式错乱,检查起来更是…...

实测GLM-4V-9B:单卡24G显存,轻松运行最强开源视觉语言模型

实测GLM-4V-9B:单卡24G显存,轻松运行最强开源视觉语言模型 如果你正在寻找一个既能看懂图片,又能用中文和你流畅对话,还能在单张消费级显卡上就跑起来的AI模型,那么GLM-4V-9B可能就是你的答案。 这个由智谱AI在2024年…...

漂亮大气的酒店和旅游业务预订网站模板WordPress主题

HotelBooking是干净的酒店预订设计WordPress主题,适合所有酒店和旅游业务在线预订。模板有一个专门的页面,显示所有住宿细节的预订系统。主题还包括一个简单的搜索过滤器系统,显示所有可以预订的房间。这个WordPress酒店预订模板是100%的响应式设计,在所…...

嵌入式C语言代码优化实战:从编译器到硬件的性能调优

1. 嵌入式C语言代码优化的工程实践指南嵌入式系统开发中,资源约束是永恒的主题。MCU的Flash容量、RAM空间、主频带宽和功耗预算共同构成了硬性边界。在这些边界内,代码执行效率直接决定系统响应能力、实时性保障和电池续航时间。本文基于多年嵌入式硬件项…...

5G核心网核心之辨:从服务化架构(SBA)到网络切片的深度实践解析

前言作为一名通信领域的开发者,在从4G LTE向5G转型的过程中,我深刻感受到:5G不仅比4G多了一个G,它本质上是一次架构层面的彻底重构。4G核心网(EPC)依赖于紧耦合的网元(MME, PGW, SGW&#xff09…...

OFA-VE在金融领域的应用:票据识别与理解

OFA-VE在金融领域的应用:票据识别与理解 1. 引言 金融票据处理一直是银行、保险和会计行业的痛点。每天都有成千上万的发票、支票、汇票需要人工审核,不仅效率低下,还容易出错。传统的光学字符识别(OCR)技术虽然能识…...

STM8 CAN总线Bootloader设计与实现

1. STM8单片机CAN总线Bootloader设计与实现在工业现场、车载电子及长期部署的嵌入式设备中,产品完成量产封装后,物理访问调试接口(如SWIM、JTAG、SWD)往往不可行。当用户端出现功能缺陷或需迭代新特性时,必须依赖远程固…...

OpenClaw+CC Switch:小白也能配置好的小龙虾(2026最新)

在日常 AI 接口开发中,很多开发者都遇到过这样的困境:直连官方 API 不稳定、延迟高,多个供应商的 Key 难以统一管理,项目切换渠道时还要频繁改代码。本文将介绍一套基于 OpenClaw CC Switch 的本地 AI 网关方案,帮你用…...

CD4013触发器实战:如何用双稳态电路驱动继电器(附防烧线圈技巧)

CD4013触发器实战:双稳态电路驱动继电器的工程级解决方案 从理论到实践的跃迁:为什么选择CD4013驱动继电器? 在电子控制系统中,继电器作为强电与弱电之间的桥梁,其稳定性和可靠性直接影响整个系统的运行质量。传统晶体…...

涛的天道观【其九十一】真正的能力

真正的能力是不能依靠任何单位组织依然具备收入或者其他创造的(含生产力),所以成为公司领导、单位干部或拿多少收入都是依靠组织生存的方式。所以工作和生活要分开,不要太卷加班,不要太消耗自己到生存方式中。只有不断…...

51汇编仿真Proteus8.15实战篇一(附源码)

1. 从零搭建你的第一个51汇编仿真项目 第一次接触51单片机和Proteus仿真时,我完全被那些闪烁的LED迷住了。记得当时为了让一个小灯按我的想法亮灭,折腾了整整一个下午。现在回头看,那些踩过的坑都成了宝贵的经验。今天我们就用Proteus 8.15&a…...

解决Quartus 18.1下载失败的5个常见问题:以USB-Blaster配置为例

解决Quartus 18.1下载失败的5个常见问题:以USB-Blaster配置为例 在FPGA开发过程中,Quartus Prime 18.1作为Altera(现Intel FPGA)的主流开发工具,其程序下载环节往往是项目落地的最后一道关卡。然而,许多开发…...

为什么说地平线被低估了?

文|刘俊宏 编|王一粟2025年,是智驾行业势如破竹的一年。在这一年里,高阶智驾渗透率迎来爆发式增长。20万元以内主流市场,智能车比重从年初的5%陡峭上升至年底50%以上,“高阶智驾人人可享”已经成为现实。智…...

Qwen3-32B-Chat多场景落地:智能写作助手、会议纪要生成、研发文档自动摘要案例

Qwen3-32B-Chat多场景落地:智能写作助手、会议纪要生成、研发文档自动摘要案例 1. 私有部署镜像介绍 1.1 硬件与软件配置 本镜像专为RTX 4090D 24GB显存显卡优化,包含以下核心组件: 基础模型:Qwen3-32B完整权重计算框架&#…...