简单理解机器学习中top_k、top_p、temperature三个参数的作用
在机器学习中,top_k、top_p 和 temperature 是用于控制生成模型(如语言模型)输出质量的参数,尤其在文本生成任务中常见。然而,网上文章很多很全,但大多晦涩难懂,今天我们来用最简单的语言谈谈它们的具体作用:
1. 点菜式筛选法:top_k参数
英文全称:top-k
中文名称:前k个
具体意义:
top_k参数就像是你在餐厅点菜时,服务员只给你推荐菜单上前k名的招牌菜。在AI文本生成中,top_k参数用于限制模型在每个词生成时考虑的候选词数量。当设置top_k=n时,模型会从预测概率最高的n个词中随机挑选一个作为下一个生成的词。
举例说明:
假设我们要让AI续写“举头望明月”,如果设置top_k=3,AI可能会从以下候选词中选择一个:
低头思故乡(概率58%)
对影成三人(概率27%)
疑似地上霜(概率10%)
这时,AI生成的句子很可能是“举头望明月,低头思故乡”,既符合语境又经典。但如果设置top_k=50,就可能出现一些意想不到的组合,比如“举头望明月,外卖还没到”,这样的句子虽然有趣,但可能并不符合我们的预期。
2. 智能购物车模式:top_p参数
英文全称:top-p(有时也被称为Nucleus Sampling,即核采样)
中文名称:前p%
具体意义:
top_p参数则更像是你在超市购物时,设定了一个预算上限。当购物车里的商品总价达到这个上限时,你就停止购物。在AI文本生成中,top_p参数用于限制模型考虑的候选词的累积概率。当设置top_p=p时,模型会选取累积概率达到p%的候选词作为可选范围,然后从中随机挑选一个。
举例说明:
假设我们要让AI续写“人工智能将”,如果设置top_p=0.9,AI可能会从以下候选词中选择:
改变世界(45%)
引领未来(30%)
替代人类(15%)
帮我写作业(10%)
做蛋炒饭(5%)
这时,AI会考虑累积概率达到90%的候选词,即前四个词,并自动过滤掉“做蛋炒饭”这种低概率且不太相关的词。最终生成的句子可能是“人工智能将改变世界,引领未来”,既专业又合理。
3. 创意温度计:temperature参数
具体意义:
temperature参数就像是你调节火锅火力的开关。低温时,火锅清汤寡水,味道保守;高温时,火锅麻辣鲜香,味道多变。在AI文本生成中,temperature参数用于控制模型生成文本的随机性。低温值使模型生成更保守、更确定的文本;高温值则使模型生成更随机、更多样化的文本。
举例说明:
低温(0.2):生成如“床前明月光,疑是地上霜”这种稳妥诗句,适合写公文或正式文件。
中温(0.7):可能产出如“月光洒键盘,代码写成诗”的跨界组合,适合写广告文案或创意写作。
高温(1.2):会创造如“明月照冰箱,剩菜在发光”的神奇脑洞,适合写玄幻小说或进行脑暴创意。
参数组合实战案例
生成情人节文案:
保守方案:top_p=0.8 + temperature=0.3 → 生成如“你是我心中的日月星辰,永远照亮我前行的路”这样稳妥而深情的文案。
创意方案:top_k=20 + temperature=0.9 → 生成如“我们的爱情,就像WiFi满格,无论走到哪里都不断线”这样富有创意的比喻。
脑洞方案:top_p=0.95 + temperature=1.5 → 生成如“在平行宇宙的咖啡厅,我点了杯加糖的量子纠缠,只为与你共享这份跨越时空的甜蜜”这样充满奇幻色彩的文案。
综合使用:找到生成文本的完美平衡
在实际应用中,我们通常会结合使用这三个参数,以找到生成文本的完美平衡。比如:
对于学术论文或技术文档的生成,可以设置较低的top_k(如5)、top_p(如0.8)和temperature(如0.2),以确保生成内容严谨、逻辑性强。
对于创意写作或诗歌生成,则可以设置较高的top_k(如50)、top_p(如0.9)和temperature(如1.2),以生成内容丰富多彩、富有诗意的文本。
总结
top_k: 限制候选词数量,提升文本质量。
top_p: 动态调整候选词集,平衡质量与多样性,想创意高点,top_p就大点。
temperature: 控制生成文本的随机性,影响文本的确定性与多样性。温度高就多样性高,确定性低。
相关文章:
简单理解机器学习中top_k、top_p、temperature三个参数的作用
在机器学习中,top_k、top_p 和 temperature 是用于控制生成模型(如语言模型)输出质量的参数,尤其在文本生成任务中常见。然而,网上文章很多很全,但大多晦涩难懂,今天我们来用最简单的语言谈谈它…...
Java面试黄金宝典6
1. 什么是 CAS 原理: CAS (Compare-And-Swap)是一种硬件级别的原子操作指令,在 Java 并发编程中常被用于实现无锁算法。其核心逻辑是:在进行数据更新时,会先将内存位置 V 的值与预期原值 A 进行比较&#x…...
【深度学习新浪潮】AI ISP技术与手机厂商演进历史
本文是关于AI ISP(人工智能图像信号处理器)的技术解析、与传统ISP(图像信号处理器)的区别、近三年研究进展,以及各大手机厂商在该领域演进历史的详细报告。本报告综合多个权威来源的信息,力求全面、深入地呈现相关技术发展脉络与行业动态。 第一部分:AI ISP的定义及与传…...
C语言基础08
内容提要 数组 排序算法:冒泡排序 二维数组 字符数组 数组 冒泡排序 排序思想(向前冒泡) 一次只排好一个数,针对n个数,最差情况需要n-1次就可以排好 每次排序假定第一个元素是最大或者最小,用第一个…...
基于Arm GNU Toolchain编译生成的.elf转hex/bin文件格式方法
基于Arm GNU Toolchain编译生成的.elf转hex/bin文件格式方法 已经弃用的版本(Version 10.3-2021.10):gcc-arm-none-eabi:https://developer.arm.com/downloads/-/gnu-rmArm GNU Toolchain当前版本:https://developer.a…...
1.angular介绍
初級使用视频添加链接描述 angular工具 angular.module(‘名’, [依赖模块]) 模块 angular.bind(*) : 修改this指向 angualr.copy() // a angular.copy(a, b) —a完全覆盖了b,c就是a angular.extend(a, b) a里面集成了b属性 angular.isArray angular.isDate angular.isDefin…...
java项目40分钟后token失效问题排查(40分钟后刷新页面白屏)
项目40分钟后token失效问题排查(40分钟后刷新页面白屏) 经过我 对比失效前token 可以正常访问接口,失效后的token 不能访问系统, 得出结论,我系统对接第三方 sso 系统,token 失效时间 在他们那边配置&…...
音频进阶学习二十——DFT离散傅里叶变换
文章目录 前言一、FT、FS、DTFT、DFS1.FT和FS2.DTFT和DFS 二、DFT定义1.对于DFT的理解1)DTFT和DFT2)DFS和DFT3)有限长序列和周期序列 2.圆周卷积1)线性卷积2)圆周卷积 三、频率采样和插值恢复1.频率采样的影响2.频率采…...
【Rust】集合的使用——Rust语言基础16
文章目录 1. 前言2. Vector2.1. 构建一个 vector2.2. 获取 vector 中的元素2.3. 遍历 vector2.4. 使用枚举来储存多种类型 3. String3.1. 新建字符串3.2. 更新字符串3.3. 字符串的内部结构3.3.1. 字符串如何访问内部元素?3.3.2. 字节、标量值和字形簇 3.4. 字符串 s…...
centos 7 部署ftp 基于匿名用户
在 CentOS 7 上搭建基于匿名用户的 FTP 服务,可按以下步骤进行: 1. 安装 vsftpd 服务 vsftpd 是一款常用的 FTP 服务器软件,可使用以下命令进行安装: bash sudo yum install -y vsftpd2. 启动并设置开机自启 vsftpd 服务 bash …...
Apache SeaTunnel脚本升级及参数调优实战
最近作者针对实时数仓的Apache SeaTunnel同步链路,完成了双引擎架构升级与全链路参数深度调优,希望本文能够给大家有所启发,欢迎批评指正! Apache SeaTunnel 版本 :2.3.9 Doris版本:2.0.6 MySQL JDBC Conne…...
算法 | 优化算法比较
===================================================== github:https://github.com/MichaelBeechan CSDN:https://blog.csdn.net/u011344545 ===================================================== 优化算法 一、主流优化算法分类1、传统梯度类算法2、启发式算…...
破局 MySQL 死锁:深入理解锁机制与高效解决方案
死锁的原理 1. 什么是死锁? 当 多个事务 在并发执行时,每个事务都 持有其他事务需要的锁,同时又在 等待对方释放锁,导致所有事务都无法继续执行的状态,称为 死锁(Deadlock)。 2. 死锁的四个必要…...
学习记录-cssjs-综合复习案例(二)
目录 商城复合案例功能实现(二)商城首页实现步骤1.准备工作2. 搭建html框架3. 编写js代码 完整实例代码完整项目心得 商城复合案例功能实现(二) 使用html,css,基于bootstrap框架以及媒体查询搭建响应式布局…...
使用 JDBC 插入数据并获取自动生成的主键(如 MySQL 的 AUTO_INCREMENT 或 Oracle 的序列) 的完整示例代码,包含详细注释
以下是使用 JDBC 插入数据并获取自动生成的主键(如 MySQL 的 AUTO_INCREMENT 或 Oracle 的序列) 的完整示例代码,包含详细注释: import java.sql.*;public class GeneratedKeysExample {// 数据库连接参数private static final St…...
图解AUTOSAR_CP_EEPROM_Abstraction
AUTOSAR EEPROM抽象模块详细说明 基于AUTOSAR标准的EEPROM抽象层技术解析 目录 1. 概述 1.1 核心功能1.2 模块地位2. 架构概览 2.1 架构层次2.2 模块交互3. 配置结构 3.1 主要配置容器3.2 关键配置参数4. 状态管理 4.1 基本状态4.2 状态转换5. 接口设计 5.1 主要接口分类5.2 接…...
汇川EASY系列之以太网通讯(MODBUS_TCP做从站)
汇川easy系列PLC做MODBUS_TCP从站,不需要任何操作,但是有一些需要知道的东西。具体如下: 1、汇川easy系列PLC做MODBUS_TCP从站,,ModbusTCP服务器默认开启,无需设置通信协议(即不需要配置),端口号为“502”。ModbusTCP从站最多支持31个ModbusTCP客户端(ModbusTCP主站…...
QT 图表(拆线图,栏状图,饼状图 ,动态图表)
效果 折线图 // 创建折线数据系列// 创建折线系列QLineSeries *series new QLineSeries;// series->append(0, 6);// series->append(2, 4);// series->append(3, 8);// 创建图表并添加系列QChart *chart new QChart;chart->addSeries(series);chart->setTit…...
基于vue框架的在线影院系统a079l(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
系统程序文件列表 项目功能:用户,电影,电影类别,电影库 开题报告内容 基于Vue框架的在线影院系统开题报告 一、研究背景与意义 随着文化娱乐产业的蓬勃发展,电影院作为人们休闲消遣的重要场所,其管理效率和服务质量直接影响着顾客的观影体…...
vscode/cursor中python运行路径设置 模块导入问题
vscode/cursor中python运行路径设置 ## 文件路径设置 问题描述 pycharm的项目用cursor运行,出现目录找不到 后来利用 os.getcwd(),经过打印调试发现是IDE的本身配置问题 pycharm中,os.getcwd()默认打开当前脚本所在目录 vscode/cursor中…...
OpenCV图像拼接(1)概述
操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 此图说明了在Stitcher类中实现的拼接模块流程。使用该类,可以配置/移除某些步骤,即根据特定需求调整拼接流程。流程中的所…...
NFS 安装与测试
NFS 安装与测试 服务器 # NFS 共享目录 mkdir -p ${HOME}/Share/nfs && sudo chown -R nobody:nogroup ${HOME}/Share/nfs# 安装 NFS Server sudo apt install nfs-kernel-server# 配置 NFS 目录 sudo cp -arf /etc/exports /etc/exports.bak sudo tee -a /etc/exports…...
深度学习与传统算法在人脸识别领域的演进:从Eigenfaces到ArcFace
一、传统人脸识别方法的发展与局限 1.1 Eigenfaces:主成分分析的经典实践 算法原理 Eigenfaces是基于主成分分析(PCA)的里程碑式方法。其核心思想是将人脸图像视为高维向量,通过协方差矩阵计算特征向量(即特征脸&…...
基于ssm学科竞赛小程序的设计及实现(源码+lw+部署文档+讲解),源码可白嫖!
摘要 随着信息时代的来临,过去的学科竞赛管理方式的缺点逐渐暴露,本次对过去的学科竞赛管理方式的缺点进行分析,采取计算机方式构建学科竞赛小程序。本文通过阅读相关文献,研究国内外相关技术,提出了一种关于竞赛信息…...
【嵌入式学习】触发器 - ADC - DAC
# 触发器 基本概念:一种能够存储一位二进制信息的数字逻辑电路,其输出不仅取决于当前输入,还与之前的状态有关。 常见触发器类型: ①RS触发器:最基本的双稳态电路,包含两个输入(置位S和复位R&…...
[特殊字符][特殊字符][特殊字符][特殊字符][特殊字符][特殊字符]壁紙 流光染墨,碎影入梦
#Cosplay #🧚♀️Bangni邦尼🐰. #📷 穹妹 Set.01 #后期圈小程序 琼枝低垂,霜花浸透夜色,风起时,微光轻拂檐角,洒落一地星辉。远山隐于烟岚,唯余一抹青黛,勾勒出天光水…...
虚拟机的三种 Linux 网络配置原理图解读
前言 虚拟机的网络连接方式主要有 三种模式:桥接模式(Bridged)、NAT 模式(Network Address Translation)、仅主机模式(Host-Only)。每种模式都有不同的使用场景和网络适应性,具体解释…...
AI Agent系列(七) -思维链(Chain of Thought,CoT)
AI Agent系列【七】 前言一、CoT技术详解1.1 CoT组成1.2 CoT的特点 二、CoT的作用三、CoT的好处四、CoT适用场景五、CoT的推理结构 前言 思维链(Chain of Thought,CoT),思维链就是一系列中间的推理步骤(a series of intermediate reasoning steps),通过…...
SpringBoot实现异步调用的方法
在Java中使用Spring Boot实现异步请求和异步调用是一个常见的需求,可以提高应用程序的性能和响应能力。以下是实现这两种异步操作的基本方法: 一、异步请求(Asynchronous Request) 异步请求允许客户端发送请求后立即返回&#x…...
PurpleLlama大模型安全全套检测方案
1. 引入 PurpleLlama是Meta的大模型安全整体解决方案(参考1),它包括了 (1)安全评估 CyberSecEval是一个用于评估大型语言模型(LLMs)安全风险的基准套件,其目标是解决随着 LLMs 的广…...
