当前位置: 首页 > article >正文

老码农和你一起学AI系列:语言模型采样方法

语言模型在生成文本时每一步都会计算出下一个词的概率分布比如“吃”0.4“喝”0.3“玩”0.2……。那么具体选哪个词作为输出呢这就涉及采样方法。根据是否追求“概率最大化”这些方法可以分为两大类确定性方法总是选最可能的词和随机采样方法按概率随机抽取。下面我们分别详解。一、概率最大化方法这类方法的核心思想是每一步都选择概率最高的词或者在整个序列层面寻找概率最高的组合。它们生成的结果是确定的即同样的输入永远得到同样的输出。1. 贪心搜索Greedy Search做法每一步直接挑出概率最大的那个词。例子预测下一个词时“吃”概率0.4最大那就输出“吃”。优点简单、速度快适合对准确性和确定性要求高的任务如机器翻译、拼写检查。缺点容易陷入重复循环如“好的好的好的……”。缺乏多样性生成的文本死板。局部最优不一定全局最优——当前选最可能的词但连成句子后可能不如另一个稍低概率的词开头整体通顺。2. 束搜索Beam Search做法为了缓解贪心搜索的短视束搜索每一步保留概率最高的k 个候选序列k 称为束宽。最后从这 k 个完整序列中选择总概率最高的一个。例子束宽2第一步保留“吃”0.4和“喝”0.3两个开头第二步对每个开头分别计算下一个词的概率再保留总概率最高的两个序列……直到句子结束。优点比贪心搜索更可能找到全局最优序列在机器翻译、摘要生成等任务中表现优秀。缺点依然倾向于生成保守、常见的句子缺乏惊喜。随着束宽增大计算量增加且可能生成过于通用的结果比如“我不知道”之类的安全回答。总结概率最大化方法追求精准和稳定适合需要明确答案的场景但不适合需要创造力的开放式生成。二、随机采样方法这类方法的核心是按照模型给出的概率分布进行随机抽样概率高的词被抽中的几率大但概率低的也有可能被选中。这样生成的文本具有多样性每次输出都可能不同。1. 原始随机采样Random Sampling做法直接以模型输出的概率分布为权重随机抽取一个词。例子“吃”占40%面积“喝”占30%“玩”占20%……做一个不均匀的骰子掷出哪个就选哪个。优点完全尊重模型学到的分布引入自然多样性。缺点有可能抽到概率极低的词比如“吃石头的”导致生成不连贯或无意义的句子。2. 温度采样Temperature Sampling做法在应用softmax之前将模型的输出 logits 除以一个温度参数T改变分布的陡峭程度。T 1分布变得更尖锐高概率词更突出模型更“保守”。T 1保持原始分布。T 1分布变平滑低概率词被选中的机会增加模型更“有创意”。优点通过调节 T 可以灵活控制随机性和确定性之间的平衡。缺点仍然无法完全避免抽取到离谱的低概率词即使平滑后那些原本极低的词依然可能被选中。3. Top-k 采样做法每一步只保留概率最高的k个词然后重新归一化这 k 个词的概率再从中随机采样。例子k3那么只考虑“吃”“喝”“玩”这三个词忽略所有其他词然后在这三个词中按归一化概率采样。优点截断了长尾的低概率词保证候选词都是模型比较“确信”的生成更稳定。缺点k 是固定值不能适应不同上下文。有时有效词可能少于 k 个会强行拉进一些不太相关的词有时有效词可能多于 k 个会遗漏好词。4. Top-p 采样核采样Nucleus Sampling做法设定一个概率阈值p如0.9然后从累计概率超过 p 的最小词集合中采样。这个集合的大小会根据当前分布动态变化。例子如果“吃”(0.4)“喝”(0.3)“玩”(0.2)累计概率正好0.9那么这三个词就是候选集。如果下一个词分布非常集中可能两个词就达到0.9如果分布分散候选集会更大。优点动态调整候选集大小既能截断不合理低概率词又能保留多样性和适应性是目前开放式文本生成如对话、故事生成中最常用的方法。缺点相比 top-k 稍复杂但现代库都高效支持。三、两大类的对比与选择方面概率最大化方法随机采样方法输出确定性确定同输入同输出随机同输入可不同输出多样性低容易重复高每次可能不同风险死板、保守可能不连贯、跑题适用场景机器翻译、摘要、问答答案唯一对话、故事生成、创意写作需要多样性常用技巧束搜索、贪心温度、top-k、top-p最后小结实际应用中两者也可以结合。例如在束搜索中加入随机采样如多样束搜索或者在随机采样中通过调节温度和 top-p 来达到最佳平衡。理解这些采样方法能帮助你更精准地控制语言模型的输出风格让 AI 既可靠又有创意。如果你对某个方法的实现细节或调参技巧感兴趣欢迎继续探讨

相关文章:

老码农和你一起学AI系列:语言模型采样方法

语言模型在生成文本时,每一步都会计算出下一个词的概率分布(比如“吃”:0.4,“喝”:0.3,“玩”:0.2……)。那么,具体选哪个词作为输出呢?这就涉及采样方法。根…...

CSDN一亿技术人员的千载难逢机遇:个人如何转型,平台如何进化

CSDN一亿技术人员的千载难逢机遇:个人如何转型,平台如何进化 2026年,中国技术圈正在经历一场前所未有的范式转移。 这不是一次技术迭代,不是一次框架升级,不是一次语言更替——而是一次权力结构的根本性重构。 当大…...

SRMAS工作室简介

小红书、抖音 搜‘科研连连看’ ‘srmas工作室’ SRMAS英文全称Smart Research Multi Agent System,是多智能体协作(MAS)驱动的专业生产力实验室.一 定位srmas工作室是一家专注于复杂逻辑自动化与多智能体协同的技术工作室。通过自研的可视化 Mul…...

经典2DMMORPG手游【石器时代H5内购版】服务端图文手工搭建教程

游戏截图搭建环境信息 系统:Centos 7.6 配置:2核4G内存 搭建资源获取 资源网站:www.woniuyxdj.cn 宝塔面板安装 通用自动安装命令 if [ -f /usr/bin/curl ];then curl -sSO https://download.bt.cn/install/install_panel.sh;else wget -O in…...

2026大专国际经济与贸易就业方向有哪些?

2026年企业对于国贸类岗位的描述越来越清晰。外贸业务、跟单、报关报检等传统岗位的需求持续存在,具备实务经验的求职者往往能获得更多的面试机会。与此同时,随着跨境电商和各类新业态的快速发展,涉及海外市场运营、数字营销等方向的新岗位也…...

越南《人工智能法》具体内容详解(附中越互译)

越南《人工智能法》(第134/2025/QH15号)于2025年12月10日由越南国会以90.70%的高赞成率表决通过,2026年3月1日正式生效,共8章35条,是东盟首部全面规范人工智能领域的专项法律。该法以“管理以促进发展”为核心方针,在风险管控与创新激励间寻求平衡,既借鉴国际惯例,又立…...

习题3.12 另类循环队列

习题3.12 另类循环队列分数 20作者 DS课程组单位 浙江大学如果用一个循环数组表示队列,并且只设队列头指针Front,不设尾指针Rear,而是另设Count记录队列中元素个数。请编写算法实现队列的入队和出队操作。函数接口定义:bool AddQ(…...

springboot+vue预报名管理系统--毕业论文

目录系统设计与技术选型需求分析与功能模块数据库设计后端实现前端实现系统安全与优化测试与部署总结与展望项目技术支持源码LW获取详细视频演示 :文章底部获取博主联系方式!同行可合作系统设计与技术选型 阐述SpringBoot和Vue的技术优势,说…...

【AI】大语言模型 (LLM) 产品的开发流程参考

🔥小龙报:个人主页 🎬作者简介:C研发,嵌入式,机器人等方向学习者 ❄️个人专栏:《AI》 ✨ 永远相信美好的事情即将发生 文章目录前言一、个人开发者的大语言模型 (LLM) 产品的开发流程参考1.1 准…...

网络协议红蓝对抗:从TCP重传到QUIC的可靠性战争

网络协议红蓝对抗:从TCP重传到QUIC的可靠性战争原创深度技术长文 | 14,200字 | 含6大协议栈剖析、5个网络故障实验、4段可复现抓包分析 本文以高强度红蓝对抗形式,深入网络协议栈最核心战场——可靠性机制。从TCP的超时重传、快速恢复,到HTTP…...

文件系统红蓝对抗:从ext4到ZFS的数据持久性战争

文件系统红蓝对抗:从ext4到ZFS的数据持久性战争原创深度技术长文 | 13,800字 | 含7大文件系统对比、5个数据损坏实验、4段可复现代码 本文以高强度红蓝对抗形式,深入剖析ext4、XFS、Btrfs、ZFS、NTFS等主流文件系统在数据持久性、崩溃一致性、性能权衡上…...

操作系统红蓝对抗:从页表到调度器的血性博弈

操作系统红蓝对抗:从页表到调度器的血性博弈原创深度技术长文 | 13,200字 | 含8大核心机制剖析、6段可运行代码、5个性能陷阱预警 本文以高强度红蓝对抗形式,深入操作系统内核最敏感区域——内存管理、进程调度、中断处理、同步原语等核心子系统。通过1v…...

MySQL--八股文(一)

一、什么是MySQL?二、MySQL常用的储存引擎有什么?它们有什么区别?三、数据库的三大范式有哪些?四、MySQL的数据类型有哪些?五、索引六、B树和B树一、什么是MySQL?MySQL是一种开放源代码的关系型数据库管理系…...

(论文速读)SFAFBR:一种自监督的人工特征偏置校正框架

论文题目:Artificial Feature Bias Rectified by Self-Supervised Learning for Rolling Bearings Fault Diagnosis Under Limited Labeled Vibration Signals(有限标记振动信号下滚动轴承故障诊断的自监督学习修正人工特征偏差)期刊&#xf…...

从0实现OnCall基于Python语言框架

Step01第一步做的事情,先把 Python 版 OnCall 的后端外壳搭起来。也就是说,先验证了一件最关键的事:这个项目能不能先以 Python 服务的形式真正跑起来,并且具备最基础的对外通信能力。只有这一步成立,后面接模型、接 R…...

计院操作系统实验10

基于QEMU将UART串口重定向至控制台的实现,使用UART串口作为输入设备,通过设置信号量和中断,每次用户输入字符串,GIC会接收到中断号33,随后调用shell进程存储输入至缓冲区并在控制台上回显输入,实现简单的sh…...

[特殊字符] OpenClaw(小龙虾)CentOS 7 完整安装手册

🔧 **适用系统**:CentOS 7.x(本文基于 CentOS 7.9 编写) 🏗️ **架构要求**:x86_64 👤 **操作用户**:root(为简化操作,本文全程使用 root 用户&#xff0…...

打不开游戏提示缺少D3DCompiler_47.dll文件 分享免费下载

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…...

【小程序】✈️一口气用AI肝了50+功能的小程序(已上线)

💥💥✈️✈️欢迎阅读本文章❤️❤️💥💥 🏆本篇文章阅读大约耗时5分钟。 ⛳️motto:不积跬步、无以千里 📋📋📋本文目录如下:🎁🎁&am…...

构建StructBERT模型集群:负载均衡与高可用部署架构

构建StructBERT模型集群:负载均衡与高可用部署架构 最近和几个做企业服务的同行聊天,大家普遍遇到一个头疼的问题:单个模型服务扛不住业务高峰期的流量。平时跑得好好的,一到促销或者活动,服务就卡顿甚至挂掉&#xf…...

Emoji国旗代码大全:如何在网页和App中正确显示各国旗帜(附完整Unicode列表)

Emoji国旗代码实战指南:跨平台兼容方案与Unicode最佳实践 在全球化数字产品设计中,emoji国旗已成为用户界面不可或缺的视觉元素。从社交平台的用户国籍标识到电商网站的物流追踪,这些彩色小旗帜背后却隐藏着令人头疼的技术挑战——不同设备显…...

Qwen3-VL-2B-Instruct如何保护隐私?数据安全指南

Qwen3-VL-2B-Instruct如何保护隐私?数据安全指南 在AI应用日益普及的今天,我们享受技术便利的同时,也面临着数据隐私的挑战。当你使用一个能“看懂”图片的AI模型时,一个核心问题自然浮现:我上传的图片和数据安全吗&a…...

Coze-Loop游戏AI开发:强化学习算法加速

Coze-Loop游戏AI开发:强化学习算法加速 1. 引言 游戏AI开发正在经历一场革命性的变化。传统的游戏AI往往依赖于预设的行为树和有限状态机,虽然稳定可控,但缺乏真正的智能和适应性。随着强化学习技术的成熟,我们现在可以创建能够…...

哪吒监控面板SSH功能安全关闭指南:保护你的VPS不被入侵

哪吒监控面板SSH功能安全管理全指南 对于使用哪吒监控面板的VPS管理员来说,SSH功能的安全管理是一个需要谨慎对待的议题。这个功能虽然在某些紧急情况下能提供便利,比如服务器失联时的远程访问,但它也可能成为潜在的安全隐患。特别是在当前网…...

2026 论文写作工具实测:Paperxie 领衔 9 款 AI 工具,搞定初稿 / 绘图 / 排版 / AI 率全流程

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/aippthttps://www.paperxie.cn/ai/dissertationhttps://www.paperxie.cn/ai/dissertation 毕业季的论文焦虑,从来都不是「不会写」,而是「写不完、写不好、通不过」。从选题卡壳到格…...

论文人救星!Paperxie:从初稿到终稿,一站式搞定写作 / 绘图 / 排版 / AI 率

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/aippthttps://www.paperxie.cn/ai/dissertationhttps://www.paperxie.cn/ai/dissertation 谁懂啊家人们!写毕业论文的苦,只有经历过的人才懂:选题抓耳挠腮、大纲逻辑混乱…...

C#上位机+AI视觉:基于Halcon/OpenCV的工业缺陷检测系统开发(汽车零部件厂真实落地案例 | 附完整可复用代码 | 漏检率从15%降至0.5%)

我在天津滨海新区的汽车密封条厂做了8年工业上位机开发,见过90%的工厂都面临同一个质检痛点: 人工检测密封条的表面划痕、气泡、缺胶,一天8小时盯着看,眼睛花了漏检率高达15%,客户投诉不断; 后来上了一套国外的视觉检测系统,贵得离谱,一套200万,还只能检测一种产品,换…...

论文初稿不再熬夜:PaperXie 把写作、绘图、排版、降 AI 率全打包,本科生也能一键通关

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/aippthttps://www.paperxie.cn/ai/dissertationhttps://www.paperxie.cn/ai/dissertation 一、毕业季的 “隐形加班”:谁在为论文的细枝末节买单? 凌晨两点的宿舍灯还亮着&#xff…...

绑定 控件与数据的绑定 控件与控件的绑定 DAY4

引出&#xff1a;需要slider与textbox互相影响互相绑定 “双向绑定”事件驱动private void Slider_ValueChange(object sender, RoutedPropertyChangedEventArgs<double> e){text1.Text slider.Value.ToString();text2.Text slider.Value.ToString();text3.Text slide…...

记录项目基于HAL+STM32+Freertos的天气桌面(暂时就叫这个了)(day1)

简介&#xff1a;主控STM32F103C8T6&#xff0c;元器件ESP01S。主频为72mhz&#xff0c;开启usart1与usart2&#xff0c;usart1用于回传esp01s发送的信息&#xff0c;usart2用于连接esp01s。freertos新建1个任务&#xff0c;大小128*4&#xff0c;1个用于获取心知天气内的数据。…...