当前位置: 首页 > article >正文

别把 `temperature`、`top-k`、`top-p`、`beam search` 当成四个并列旋钮:很多生成问题,先调错的是“分布”还是“搜索”

别把temperature、top-k、top-p、beam search当成四个并列旋钮:很多生成问题,先调错的是“分布”还是“搜索”很多人一看到模型输出太飘、太保守,第一反应就是一起改temperature、top-k、top-p,最后再顺手试beam search。但这四个名字根本不在同一层:前三个改的是下一步 token 分布,beam search改的是整条序列怎么搜。把它们当并列旋钮,调参只会越来越乱。这篇文章不做“参数定义大全”,而是把这四个常见名字放回真实上下文里:它们各自作用在什么阶段,为什么经常被混用,什么时候应该调,什么时候根本不该碰。1. 先把最容易混的说法摆出来我最近在看一些 API 使用代码、本地推理脚本和教程时,最常见的混法主要有 4 种:把temperature当成“格式约束强度”,以为温度越低,JSON 就越规范。把top-k和top-p当成同一件事,只是一个写整数、一个写小数。把beam search理解成“更高级的 top-k”。把所有问题都归因到“采样不稳定”,却没先区分

相关文章:

别把 `temperature`、`top-k`、`top-p`、`beam search` 当成四个并列旋钮:很多生成问题,先调错的是“分布”还是“搜索”

别把 temperature、top-k、top-p、beam search 当成四个并列旋钮:很多生成问题,先调错的是“分布”还是“搜索” 很多人一看到模型输出太飘、太保守,第一反应就是一起改 temperature、top-k、top-p,最后再顺手试 beam search。但这四个名字根本不在同一层:前三个改的是下…...

在 Taotoken 控制台回顾与分析团队月度大模型用量消耗

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在 Taotoken 控制台回顾与分析团队月度大模型用量消耗 对于项目管理者或团队负责人而言,清晰、透明地掌握大模型 API 的…...

硬件开发如何对抗延迟:构建高速度创新体系的策略与实践

1. 项目概述:当“延迟”成为创新的头号杀手在硬件工程和半导体设计领域,我们常常陷入一个误区:认为项目的成败取决于一个绝妙的架构、一颗顶级的芯片,或是一支由天才工程师组成的团队。然而,二十多年的从业经验告诉我&…...

基于云端OpenClaw的情绪互动机器人系统-Milk-V Duo S + 机器人 端开发(5)

上周我打通了Milk-V Duo S和机器人的串口控制的脉络,同时制作了两个动作组:下蹲、自由飞翔。 阶段状态环境搭建✅ 完成网络配置✅ 完成串口控制✅ 完成动作调度✅ 完成序列执行控制✅ 完成时间控制✅ 完成部分动作组制作✅ 完成线程执行锁✅ 完成云端接…...

力扣-最后一个单词长度(58)

重点:1.循环初始值:注意不能越界。如果直接取字符串长度则下标会溢出,所以要减1.2.循环条件:注意等于号,i >0,等号不成立的话会遗漏没有空格的情况3.循环中判断条件:考虑字符串最后面为空格的情况。clas…...

如何使用AI从文档中准确提取所有内容

如何使用AI从文档中准确提取所有内容 作者:AI拉呱(Errol Yan) 定位:AI领域深度内容与实战方法分享 TL;DR 文档解析器在处理现实文档中常见的复杂布局时面临困难,例如具有合并单元格的表格、跨页符号和错位的文本。此外,大量信息存在于图表或图形中,需要准确提取。本文将…...

Arm Cortex-A720 PMU与多核功耗管理实战解析

1. Cortex-A720 PMU架构解析在嵌入式系统开发中,性能监控单元(PMU)如同汽车的仪表盘,为开发者提供处理器运行状态的实时数据。Arm Cortex-A720的PMU架构采用内存映射寄存器设计,通过硬件计数器实现指令周期、缓存命中率等关键指标的采集。与早…...

别再瞎调WPF Grid布局了!Auto和*的实战用法,看完这篇就够了

WPF Grid布局实战:用Auto和*构建自适应界面的黄金法则 刚接触WPF开发时,我总被各种布局容器搞得晕头转向。直到有次接手一个企业级后台系统,在连续加班三天解决界面错位问题后,才真正明白Grid布局中Auto和的精妙配合有多重要。不同…...

Spring 参数验证使用示例(基于 RuoYi 项目)

一、触发方式 进入系统管理 → 角色管理,点新增,在权限字符里填入超过100个字符的内容,点确定。 二、前端现象 2.1 页面报错提示 前端弹出红色提示框,显示"权限字符长度不能超过100个字符"。 2.2 HTTP 请求信息 从浏…...

智象科技AI数智员工:重构运维效率的智能引擎

在企业数字化转型不断深入的今天,运维体系正从“被动响应”走向“智能驱动”。智象科技基于大语言模型与数据智能能力,推出全新“AI数智员工”,以“全栈智能协同”为核心理念,构建覆盖感知、分析、决策与执行的智能运维闭环&#…...

大模型---LangGraph的循环与迭代

目录 1.LangGraph的循环 2.典型的迭代方式 3.循环退出条件 1.LangGraph的循环 LangGraph的循环可以分为3个部分:① State:保存迭代过程中的状态,② node:每轮执行的逻辑,③ conditional edge:判断继续循环还是结束。 最简单的循环方法就是固定迭代次数,即让一个节点…...

马拦过河卒

棋盘上A点有一个过河卒,需要走到目标B点。卒行走的规则:可以向下、或者向右。同时在棋盘上C点有一个对方的马,该马所在的点和所有跳跃一步可达的点称为对方马的控制点。因此称之为“马拦过河卒”。 棋盘用坐标表示,A点&#xff08…...

软考中级数据库系统工程师考试大纲

数据库系统工程师考试大纲一、考 试 说 明1.考试目标通过本考试的合格人员能参与信息系统的规划、设计、 构建、运行和管理,能按照用户需求,设计、建立、运行、 维护数据库系统;能管理信息系统中的数据资源,建立和维 护…...

关于hopfield 网络和受限玻尔兹曼机,其如何为现代深度学习奠基?

0 感知机、hopfield网络、受限玻尔兹曼机、mlp之间的历史关系 近几年入门深度学习的大多数学习者,可能已经很少听说hopfield网络、受限玻尔兹曼机了,很多书籍和博客在讲解深度学习基础的时候也只会讲到感知机和mlp这种结构,而提及hopfield网…...

SON自动添加邻站功能

该功能主要依赖于ANR自动添加邻区。在邻区添加完成后,源基站会从邻区的CGI信息中解析出目标基站的eNB ID,然后向核心网(MME)发送一条eNB Configuration Transfer消息,用于请求该eNB ID对应的X2接口传输层地址。若核心网…...

普通机床改造成键槽铣床

普通机床在机械加工领域应用广泛,但功能相对单一,若想拓展其加工范围,将其改造成键槽铣床是个不错的选择。改造的核心在于通过加装特定部件,让机床具备铣削键槽的能力。普通机床原本的直线运动和旋转运动基础,为改造提…...

如何高效阅读c语言函数(形成线思维和面思维)

最近,我在阅读linux内核源码,由于代码量太大了,有成百个源文件,源文件中有成千上万的函数,我本来的计划是对每一个源文件中的函数自上而下粗略读一遍(不会跳转到子函数中去看子函数是如何实现的&#xff09…...

机器学习40讲-10:特征预处理

分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请轻击人工智能教程​​​https://www.captainai.net/troubleshooter 华盛顿大学教授、《终极算法》(The Master Algorithm)的作者佩德罗多明戈斯曾在Communications of The ACM…...

探讨CSS复合属性的实际应用与交互设计

在CSS中,我们经常使用到的一些复合属性包括:font(字体)、border(边框)、background(背景)、padding(内边距)以及margin(外边距)等。接…...

常用代码知识

一、算法题常用 1.1 CSTL中哈希表(std::unordered_map和std::unordered_multimap) unordered_map和unordered_multimap区别在与mult的值可以重复。 方法insert、erase、size、count(统计出现次数) 其他操作: unorder…...

当AI写小说——一个被严重低估的工程化战场

当AI写小说——一个被严重低估的工程化战场本文收录于《工程化AI人机协同方法论》系列专栏,对应系列第54篇核心文章 核心结论前置:AI写小说从来不是「一句prompt生成全文」的创意魔法,而是一套涵盖设定治理、记忆管理、文风校准、节奏管控、合…...

3401黄大年茶思屋榜文保姆级全落地解法「34期 1题」全系统可编程安全易用高效统一架构重构与原约束双路径落地解法

华夏之光永存・开源:黄大年茶思屋榜文保姆级全落地解法「34期 1题」 小标题:全系统可编程安全易用高效统一架构重构与原约束双路径落地解法 一、摘要 全系统可编程赛道当下全球现代工程技术已触达绝对性能天花板,现有eBPF、Wasm分立方案、传统内核可编程框架、常规工具链…...

3分钟搞定!终极游戏模组管理器XXMI-Launcher完整使用指南

3分钟搞定!终极游戏模组管理器XXMI-Launcher完整使用指南 【免费下载链接】XXMI-Launcher Modding platform for GI, HSR, WW and ZZZ 项目地址: https://gitcode.com/gh_mirrors/xx/XXMI-Launcher XXMI-Launcher是一款专业的游戏模组启动器,专为…...

VAP模型:视频生成技术的语义控制革新

1. 项目概述:视频生成技术的范式革新去年在做一个短视频特效项目时,我遇到了一个棘手问题:客户想要一段"夕阳下穿红裙的舞者在沙漠中旋转"的视频素材,但实拍成本太高,而用传统AI视频生成工具要么人物动作不连…...

V-REX框架:评估视觉推理模型的渐进式问题链方法

1. 项目背景与核心价值去年在开发一个跨模态问答系统时,我深刻体会到现有评估方法对复杂视觉推理任务的局限性。传统benchmark往往只关注最终答案的正确性,却忽视了模型在推理过程中的思维链条。这正是V-REX框架试图解决的关键问题——它像一位严格的考官…...

V-REX框架:多步视觉推理评估的创新解决方案

1. 项目概述V-REX是一个专注于多步探索式视觉推理的评估框架,它通过创新的Chain-of-Questions方法,为视觉推理任务提供了系统化的评估解决方案。这个框架的核心价值在于解决了传统视觉问答系统在复杂推理场景下的评估难题。在实际应用中,我们…...

视频预测与深度估计的联合优化方法解析

1. 项目概述视频预测与深度估计是计算机视觉领域的两大基础任务,前者要求模型根据历史帧预测未来画面,后者需要从2D图像推断3D场景结构。传统方法通常将这两个任务分开处理,忽视了它们之间天然的互补关系。我们提出的"概率结构集成"…...

EDA工具链整合与硬件仿真平台如何重塑芯片验证流程

1. 行业动态速览:从GSA奖项到EDA工具链整合又到了每周梳理半导体与电子设计自动化领域动态的时候。这周的新闻看似零散,但串联起来,恰好勾勒出行业几个清晰的脉络:对行业先驱的致敬、先进验证工具在复杂设计中的落地、开发环境的持…...

QOwnNotes:基于Markdown文件与脚本的本地知识管理方案解析

1. 项目概述:一个为Markdown而生的本地笔记应用如果你和我一样,是一个重度依赖Markdown来组织知识、记录灵感和管理项目的用户,那么你一定经历过这样的困境:市面上很多笔记应用要么过于臃肿,要么云同步功能让你对数据隐…...

TC3xx汽车以太网实战:手把手教你用MCAL配置RGMII接口与125MHz时钟(避坑GETH初始化失败)

TC3xx汽车以太网实战:手把手教你用MCAL配置RGMII接口与125MHz时钟(避坑GETH初始化失败) 在车载以太网开发中,TC3xx系列芯片的GETH模块配置一直是工程师们面临的棘手问题。特别是当项目进度紧迫,而GETH初始化却频频失败…...