当前位置：首页 > news >正文

Huggingface的GenerationConfig 中的top_k与top_p详细解读

news 2026/2/10 19:57:26

Huggingface的GenerationConfig 中的top_k与top_p详细解读

Top_k
Top_p
联合共用

Top_k

top-k是指只保留概率最高的前k个单词，然后基于剩余单词的概率进行归一化，从中随机抽取一个单词作为最终输出。这种方法可以限制输出序列的长度，并仍然保持样本的一定多样性。

举个例子，在使用语言模型生成「这个周末天气很」的句子时，top-k保留概率最高的三个单词为「好」「热」「冷」，此时将剩余单词进行概率归一化，把它们的概率设定为0，之后在三个保留的单词中随机选择一个，比如选择了「好」后，这个句子就变成了「这个周末天气很好」。这个过程可以反复进行，直到生成的句子已经满足需要。

通过使用top-k，我们可以限制输出序列的长度，并尽可能地保持语句的一定多样性，同时控制结果的生成质量。需要注意的是，取值过小会导致结果过于随机，而过大可能会限制生成的单词种类和多样性，这个超参的设定需要根据任务需求和经验进行调整。

Top_p

top-p是一种用于在文本生成中控制输出的策略。top-p算法保留累计概率之和达到一个给定阈值p的概率分布中的词汇，然后在这个分布中进行随机采样，从而生成一个单词。

举一个例子，假设我们选择的p值为0.8，然后通过语言模型预测下一个单词。假设根据模型，我们得到了10个可选单词，它们分别具有不同的概率分布。下面是假设的10个单词和它们的概率：

单词1: 0.25
单词2: 0.20
单词3: 0.15
单词4: 0.1
单词5: 0.07
单词6: 0.06
单词7: 0.05
单词8: 0.04
单词9: 0.03
单词10: 0.01

根据top-p算法，我们会按照概率从大到小的顺序，逐个累加单词的概率，直到累计概率达到0.8。上面10个单词累计概率为：

单词1: 0.25
单词1+单词2: 0.45
单词1+单词2+单词3: 0.60
单词1+单词2+单词3+单词4: 0.70
单词1+单词2+单词3+单词4+单词5: 0.77
单词1+单词2+单词3+单词4+单词5+单词6: 0.83

累加到单词6时，累计概率已经达到了0.83，因此我们会从这6个单词中进行随机抽样，以选择最终的输出。

top-p算法可以控制输出单词的多样性，因为它可以保留给定阈值下的累计概率的单词。如果阈值设置的比较小，如0.3，则选择的单词就更少，结果可能不够多样化；如果阈值设置的比较大，如0.9，则选择的单词就更多，结果可能会过于随机。因此，选择一个合适的阈值需要结合任务需求和实际情况进行测试和调整。

联合共用

假设我们要生成一个关于水果的简短文本，我们的模型输出了以下10个单词和它们的概率分别是：

苹果：0.2
橙子：0.2
香蕉：0.1
葡萄：0.1
草莓：0.1
芒果：0.1
桃子：0.05
菠萝：0.05
柚子：0.04
火龙果：0.03

我们想要生成多样性的语句，那么可以在top-k和top-p的约束下进行采样，下面来具体说明。

首先，我们可以设置top-k为5，表示保留概率最高的5个单词。这样就会保留苹果、橙子、香蕉、葡萄和草莓这5个单词，并去掉其他单词，也就是

苹果：0.2
橙子：0.2
香蕉：0.1
葡萄：0.1
草莓：0.1

接下来，我们可以使用top-p的方法，保留概率的累计和达到0.9的单词，也就是选取橙子、苹果、草莓三种水果。我们对这三种水果重新进行归一化，概率分别为：

苹果：0.4
橙子：0.4
草莓：0.2

接着，我们可以从上述分布中进行随机采样，选取一个单词作为最终的生成结果。最终生成的水果可能是苹果或橙子或草莓，并且橙子和苹果的概率要比草莓的概率高一些，因为它们的概率更大。

从这个例子可以看出，top-k和top-p可以结合使用，确保我们生成的语句既具有多样性，又具有合理性，同时可以吸引读者的注意力。在不同的任务和需求中，我们可以根据实际情况来调节参数，从而得到更好的输出结果。

Huggingface的GenerationConfig 中的top_k与top_p详细解读

Huggingface的GenerationConfig 中的top_k与top_p详细解读 Top_kTop_p联合共用 Top_k top-k是指只保留概率最高的前k个单词，然后基于剩余单词的概率进行归一化，从中随机抽取一个单词作为最终输出。这种方法可以限制输出序列的长度，并仍然保持…...

编程日记 2023/4/29 1:50:34

学生信息管理系统简易版(文件读写操作)

功能模块具体功能如下： 添加学生信息修改学生信息（按学号）排序（分别按总分升序、降序、以及按姓名升序）查找学生（按学号）删除学生查看所有学生信息数据结构体设计本表设计一个学生信息的结…...

编程日记 2023/4/29 1:45:33

C/C++每日一练(20230426)

目录 1. 不喜欢带钱的小C 🌟🌟 2. 数组排序 ※ 3. 超级素数 ※ 🌟 每日一练刷题专栏 🌟 Golang每日一练专栏 Python每日一练专栏 C/C每日一练专栏 Java每日一练专栏 1. 不喜欢带钱的小C 小C不喜欢带钱&#xff0c…...

编程日记 2023/4/29 1:40:31

halcon灰度积分投影/垂直积分投影

简介：关于灰度投影积分可以用到的场合很多，例如分割字符，分割尺子上的刻度等，适用于有规律的变化这些内容的检测。本文复现了论文《基于深度学习和灰度纹理特征的铁路接触网绝缘子状态检测》中灰度积分投影实现了对绝缘子缺陷位置的检测。见（图1）灰度积分垂直方向投影获得…...

编程日记 2023/4/29 1:35:30

Unity打包的apk在安卓4.4.2盒子上碰到的问题

项目场景： Unity开发的项目需要在安卓4.4.2盒子上运行。问题描述 1、会出"从顶部向下滑动即可退出全屏模式。"的弹框，这是android4.4的一个特性，叫做沉浸模式（Full-screen Immersive Mode)，当app启用该模…...

编程日记 2023/4/29 1:30:29

docker的简单使用（centos7中为例）

安装： yum -y install docker 启动： service start docker 搜索镜像： docker search centos:7.9 下载镜像： docker pull docker.io/18703283952/mycentos 查看所有镜像： docker images 启动并进入镜像&#xff1a…...

编程日记 2023/4/29 1:25:28

Stable Diffusion人工智能图像合成

AI 图像生成大有来头。新发布的开源图像合成模型称为Stable Diffusion，它允许任何拥有 PC 和像样的 GPU 的人想象出他们能想象到的几乎任何视觉现实。它几乎可以模仿任何视觉风格，如果你给它输入一个描述性的短语，结果就会像魔术一样出现在你…...

编程日记 2023/4/29 1:20:26

【Java EE】-CSS详解

作者：学Java的冬瓜博客主页：☀冬瓜的主页🌙 专栏：【JavaEE】分享: 且视他人如盏盏鬼火，大胆地去走你的道路。——史铁生《病隙碎笔》主要内容：CSS引入html的三种方式，CSS八大选择器&#xff…...

编程日记 2023/6/1 3:40:18

C#_语言简介

目录 1. C# 简介 2. Visual Studio 窗口界面显示 1. C# 简介什么是程序？ 程序（Program）简单来说就是： 计算机是无法听懂我们人类的语言的，也可以说我们通过我们日常交流的语言是无法控制计算机的，计算机…...

编程日记 2023/4/29 1:10:23

【Python_Opencv图像处理框架】直方图与傅里叶变换

写在前面本篇文章是opencv学习的第五篇文章，主要讲解了直方图与傅里叶变换的有关操作，作为初学者，我尽己所能，但仍会存在疏漏的地方，希望各位看官不吝指正🥰 写在中间一、直方图 （ 1 &…...

编程日记 2023/4/29 1:05:21

Know-Evolve: Deep Temporal Reasoning for Dynamic Knowledge Graphs

Know-Evolve: Deep Temporal Reasoning for Dynamic Knowledge Graphs Rakshit Trivedi 1 Hanjun Dai 1 Yichen Wang 1 Le Song 1 知识背景 Temporal Knowledge Graph : facts occur,recur or evolve over time in these graphs,and each edge in the graphs have temporal …...

编程日记 2023/4/29 1:00:20

电脑高效率工作、学习工具软件推荐

本文介绍在学习、工作时，实测很好用、明显提高工作效率的几个免费电脑软件与小工具。 1 Microsoft To Do 官方网站：https://todo.microsoft.com/tasks/ Microsoft To Do是一款由Microsoft公司开发的待办事项管理应用程序。它提供了一个简单易用的界面&a…...

编程日记 2023/4/29 0:55:19

Java8新特性函数式编程 - Lambda、Stream流、Optional

1.Lambda表达式 1.1 概述 Lambda是JDK8中一个语法糖。他可以对某些匿名内部类的写法进行简化。它是函数式编程思想的一个重要体现。让我们不用关注是什么对象。而是更关注我们对数据进行了什么操作。 1.2 核心原则可推导可省略 1.3 基本格式 (参数列表)->{代码}例一…...

编程日记 2023/4/29 0:50:17

AutoGPT安装教程

最近安装AutoGPT时遇到了一些问题，写下这篇文章记录一下 1 下载AutoGPT AutoGPT链接：https://github.com/Significant-Gravitas/Auto-GPT/tree/v0.2.2 下载AutoGPT 推荐下载stable 版本 2 申请openai 的api key 获取api的key，这里就不介…...

编程日记 2023/4/29 0:45:16

轻量级服务器nginx:负载均衡

负载均衡就是让每个设备，以同样的概率，处理用户对于服务器的任务请求，默认采用的负载调度策略就是轮流询问，Nginx作为反向代理服务器安装在服务端，Nginx的功能就是把请求转发给后面的应用服务器. 这里写目录标题一负…...

编程日记 2023/4/29 0:40:15

陶渊明最有名的10首诗，闲适美好

他是中国第一位田园诗人，被誉为“古今隐逸诗人之宗”、“田园诗派之鼻祖”。他是诗人、辞赋家、散文家。他是陶渊明。欧阳修：晋无文章，唯陶渊明《归去来兮辞》。陶渊明不为五斗米折腰，挂冠而去，给后世留下一段…...

编程日记 2023/5/30 10:46:10

最好用的六款虚拟机软件，赶紧收藏

在日常工作和学习中，我们常常需要在一台电脑上运行多个操作系统，以便进行软件测试、开发、学习以及实验等任务。虚拟机软件就是一种崭新的技术，它可以在一台电脑上运行多个操作系统，为用户提供了更高效、安全、稳定和智能化的工作和学习环境。今天我为大家介绍6款优秀的虚拟…...

编程日记 2023/4/29 0:30:10

LSSANet:一种用于肺结节检测的长、短切片感知网络

文章目录 LSSANet: A Long Short Slice-Aware Network for Pulmonary Nodule Detection摘要方法Long Short Slice GroupingLong Short Slice-Aware Network 实验结果 LSSANet: A Long Short Slice-Aware Network for Pulmonary Nodule Detection 摘要提出了一个长短片感知网…...

编程日记 2023/4/29 0:25:09

LVS负载均衡群集部署—NAT

目录一、群集的概述1、群集的含义2、出现高并发的解决方法3、群集的三种分类3.1负载均衡群集3.2高可用群集3.3高性能运算群集 4、负载均衡的结构三、LVS调度器用的调度方法四、LVS的工作模式及其工作过程1.NAT模式（VS-NAT）2.直接路由模式（V…...

编程日记 2023/4/29 0:20:08

【Access】win 10 / win 11：Access 下载、安装、使用教程（「管理信息系统」实践专用软件）

目录一、前言二、卸载 Office 三、下载 Office Tool Plus 四、安装 Office（内含 Access） （1）启动 Office Tool Plus （2）部署 （3）安装 Office（内含 Access&#…...

编程日记 2023/5/29 19:41:03

网络六边形受到攻击

大家读完觉得有帮助记得关注和点赞！！！ 抽象现代智能交通系统 （ITS） 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 （…...

编程新知 2026/2/8 5:22:04

脑机新手指南（八）：OpenBCI_GUI：从环境搭建到数据可视化（下）

一、数据处理与分析实战 （一）实时滤波与参数调整基础滤波操作 60Hz 工频滤波：勾选界面右侧 “60Hz” 复选框，可有效抑制电网干扰（适用于北美地区，欧洲用户可调整为 50Hz）。平滑处理&…...

编程新知 2025/11/19 22:56:53

React Native 导航系统实战（React Navigation）

导航系统实战（React Navigation） React Navigation 是 React Native 应用中最常用的导航库之一，它提供了多种导航模式，如堆栈导航（Stack Navigator）、标签导航（Tab Navigator）和抽屉…...

编程新知 2025/10/15 5:04:46

微软PowerBI考试 PL300-选择 Power BI 模型框架【附练习数据】

微软PowerBI考试 PL300-选择 Power BI 模型框架 20 多年来，Microsoft 持续对企业商业智能 (BI) 进行大量投资。 Azure Analysis Services (AAS) 和 SQL Server Analysis Services (SSAS) 基于无数企业使用的成熟的 BI 数据建模技术。同样的技术也是 Power BI 数据…...

编程新知 2026/2/1 19:08:45

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

蛋白质结合剂（如抗体、抑制肽）在疾病诊断、成像分析及靶向药物递送等关键场景中发挥着不可替代的作用。传统上，高特异性蛋白质结合剂的开发高度依赖噬菌体展示、定向进化等实验技术，但这类方法普遍面临资源消耗巨大、研发周期冗长…...

编程新知 2026/1/25 13:18:12

大数据零基础学习day1之环境准备和大数据初步理解

学习大数据会使用到多台Linux服务器。一、环境准备 1、VMware 基于VMware构建Linux虚拟机是大数据从业者或者IT从业者的必备技能之一也是成本低廉的方案所以VMware虚拟机方案是必须要学习的。 （1）设置网关打开VMware虚拟机，点击编辑…...

编程新知 2026/1/25 14:43:07

微信小程序 - 手机震动

一、界面 <button type"primary" bindtap"shortVibrate">短震动</button> <button type"primary" bindtap"longVibrate">长震动</button> 二、js逻辑代码注：文档 https://developers.weixin.qq…...

编程新知 2026/1/29 8:41:55

uniapp微信小程序视频实时流+pc端预览方案

方案类型技术实现是否免费优点缺点适用场景延迟范围开发复杂度WebSocket图片帧定时拍照Base64传输✅ 完全免费无需服务器纯前端实现高延迟高流量帧率极低个人demo测试超低频监控500ms-2s⭐⭐RTMP推流TRTC/即构SDK推流❌ 付费方案 （部分有免费额度&#x…...

编程新知 2026/1/31 6:12:33

ABAP设计模式之---“简单设计原则(Simple Design)”

“Simple Design”（简单设计）是软件开发中的一个重要理念，倡导以最简单的方式实现软件功能，以确保代码清晰易懂、易维护，并在项目需求变化时能够快速适应。其核心目标是避免复杂和过度设计，遵循“让事情保…...

编程新知 2026/1/27 18:13:23

C++.OpenGL （20/64）混合（Blending）

混合（Blending）透明效果核心原理 #mermaid-svg-SWG0UzVfJms7Sm3e {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-SWG0UzVfJms7Sm3e .error-icon{fill:#552222;}#mermaid-svg-SWG0UzVfJms7Sm3e .error-text{fill…...

编程新知 2026/1/20 5:33:17

Huggingface的GenerationConfig 中的top_k与top_p详细解读

Top_k

Top_p

联合共用

相关文章：