当前位置：首页 > article >正文

探秘LLM推理模型：hidden states中藏着的self verification的“钥匙”

article 2026/2/8 11:21:24

推理模型在数学和逻辑推理等任务中表现出色，但常出现过度推理的情况。本文研究发现，推理模型的隐藏状态编码了答案正确性信息，利用这一信息可提升推理效率。想知道具体如何实现吗？快来一起来了解吧！

论文标题
Reasoning Models Know When They’re Right: Probing Hidden States for Self-Verification
来源
arXiv:2504.05419v1 [cs.AI] 7 Apr 2025
https://arxiv.org/abs/2504.05419

文章核心

研究背景

近年来，推理模型在复杂推理能力上取得显著进展，如OpenAI的o1和DeepSeekR1等在数学和逻辑推理任务中表现出色，其基于搜索的推理方式是重要优势。

研究问题

推理模型存在过度思考的问题，在得到正确答案后仍会进行不必要的推理步骤。
不清楚模型在推理过程中对中间答案正确性的评估能力如何。
模型虽能编码答案正确性信息，但在推理时未能有效利用该信息。

主要贡献

验证信息编码：证实推理模型的隐藏状态编码了答案正确性信息，通过简单的探测就能可靠地提取，且探测结果校准度高，在分布内和分布外示例上都有良好表现。
提前预测正确性：发现模型隐藏状态包含“前瞻性”信息，能在中间答案完全生成前预测其正确性。
提升推理效率：将训练好的探测模型用作验证器，实施基于置信度的提前退出策略，在不降低性能的情况下，可减少24%的推理令牌数量，揭示了模型在利用内部正确性信息方面的潜力。

方法论精要

核心算法/框架：使用两层多层感知器（MLP）作为探测模型，在推理模型生成的长思维链（Chain-of-Thought，CoT）基础上，将其分割为包含中间答案的多个块，利用该探测模型从这些块对应的隐藏状态中提取信息，进而预测中间答案的正确性。
关键参数设计原理：由于数据集存在类别不平衡问题，多数中间答案正确，因此使用加权二元交叉熵损失函数。其中， $w$ 是训练数据中负样本与正样本的比例， $\alpha$ 是缩放不平衡权重的超参数，通过调整这些参数来优化探测模型的训练。
创新性技术组合：

数据处理创新：设计了一套独特的数据处理流程。首先，收集推理模型针对任务数据集中每个问题的响应，将推理过程中封装在标记内的推理痕迹提取出来，并以 “\n\n” 为分隔符拆分成段落。通过检测段落中的 “wait”“double-check”“alternatively” 等关键词来识别新推理路径的起始点，然后将同一推理路径的段落合并成一个块。接着，借助 Gemini 2.0 Flash 工具，从每个块中提取中间答案（若存在），并与真实答案对比判断其正确性。对于相邻且不包含中间答案的块，将其与最近的含答案块合并。最终，每个合并后的块都包含一个中间答案以及由 Gemini 生成的表示答案正确性的二进制标签，形成 ${(c_{1}, y_{1}),(c_{2}, y_{2}), ...(c_{k}, y_{k})}$ 这样的数据结构，为后续探测模型的训练提供了丰富且准确的数据。
模型训练创新：在训练探测模型时，采用将长 CoT 分段处理后得到的块数据进行训练。对于每个块 $c_{i}$ ，选取其最后一个令牌位置的最后一层隐藏状态作为该块的表示 $e_{i}$ ，以此构建探测数据集 $D={(e_{i}, y_{i})}_{i=1}^{N}$ ，这种基于块的隐藏状态表示方式能够有效捕捉推理过程中每个中间步骤的特征信息，为准确训练探测模型奠定了基础。同时，结合加权二元交叉熵损失函数进行训练，进一步提升了模型在不平衡数据上的训练效果。

实验验证方式：选择数学推理（GSM8K、MATH、AIME）和逻辑推理（KnowLogic）任务的数据集，使用开源的DeepSeek - R1 - Distill系列模型以及QwQ - 32B模型。通过在不同数据集上训练和测试探测模型，对比不同模型的性能，并将训练好的探测模型作为验证器，与静态提前退出策略对比，评估推理效率和准确性。

实验洞察

性能优势：在分布内实验中，所有探测模型的ROC - AUC得分均高于0.7，预期校准误差（ECE）低于0.1。例如，R1 - Distill - Qwen - 32B在AIME数据集上的ROC - AUC得分超过0.9。在跨数学推理数据集的实验中，部分探测模型具有良好的泛化性，如在MATH和GSM8K数据集上训练的探测模型在两个数据集之间转移时，ROC - AUC和ECE表现良好。
效率突破：使用基于探测模型置信度的提前退出策略，在MATH数据集上，当置信度阈值设为0.85时，推理准确率与不提前退出时大致相同（88.2%），但生成的令牌数量减少了约24%；当阈值设为0.9时，推理准确率为88.6%，令牌数量减少19%。且在节省相同数量令牌的情况下，该策略比静态提前退出策略的准确率高5%。
消融研究：训练非推理模型（Llama - 3.1 - 8B - Instruct）的探测模型并与推理模型对比，发现非推理模型探测模型的性能更差，分类得分更低，校准误差更高，表明答案正确性的编码信息在推理模型中更显著，与长CoT推理能力相关。同时，研究发现推理模型在中间答案生成前，隐藏状态就编码了正确性信息，且靠近答案生成位置的段落，探测模型性能更好。

本文由AI辅助完成。

探秘LLM推理模型：hidden states中藏着的self verification的“钥匙”

推理模型在数学和逻辑推理等任务中表现出色，但常出现过度推理的情况。本文研究发现，推理模型的隐藏状态编码了答案正确性信息，利用这一信息可提升推理效率。想知道具体如何实现吗？快来一起来了解吧！ 论文标题 Reasoni…...

编程日记 2026/2/6 1:07:40

大数据开发环境的安装，配置（Hadoop）

1. 三台linux服务器的安装 1. 安装VMware VMware虚拟机软件是一个“虚拟PC”软件，它使你可以在一台机器上同时运行二个或更多Windows、DOS、LINUX系统。与“多启动”系统相比，VMWare采用了完全不同的概念。我们可以通过VMware来安装我们的linux虚拟机…...

编程日记 2026/2/6 0:58:30

【GCC bug】libstdc++.so.6: version `GLIBCXX_3.4.29‘ not found

在 conda 环境安装 gcc/gxx 之后，运行开始遇到了以下的报错 File "/mnt/data/home/xxxx/miniforge3/envs/GAGAvatar/lib/python3.12/site-packages/google/protobuf/internal/wire_format.py", line 13, in <module>from google.protobuf import de…...

编程日记 2026/2/7 0:02:56

Android killPackageProcessesLSP 源码分析

该方法用于终止指定包名/用户ID/应用ID下符合条件的应用进程，涉及多进程管理、资源冻结、进程清理及优先级更新等操作。核心流程分为进程筛选、资源冻结、进程终止与资源恢复三个阶段。 /*** 从已排序的进程列表中，提取从指定起始索引 startIdx 开始的连…...

编程日记 2026/2/5 9:07:10

驱动开发硬核特训 · Day 16：字符设备驱动模型与实战注册流程

🎥 视频教程请关注 B 站：“嵌入式 Jerry” 一、为什么要学习字符设备驱动？ 在 Linux 驱动开发中，字符设备（Character Device）驱动是最基础也是最常见的一类驱动类型。很多设备（如 LED、按键、…...

编程日记 2026/2/6 1:18:34

CDN加速http请求

一、CDN加速定义 CDN（Content Delivery Network，内容分发网络）是通过全球分布式节点服务器缓存网站内容，使用户就近获取数据的技术。其核心目标是缩短用户与内容之间的物理距离，解决网络拥塞、带宽不足等问题&#xff…...

编程日记 2025/12/12 5:46:05

SpringCloud微服务架构设计与实践 - 面试实战

SpringCloud微服务架构设计与实践 - 面试实战第一轮提问面试官：马架构，请问在SpringCloud微服务架构中，如何实现服务注册与发现？ 马架构：在SpringCloud中，Eureka是常用的服务注册与发现组件。服务提供…...

编程日记 2025/12/13 19:16:05

关于位运算的一些小记

目录 1.判断一个整数是不是2的幂 2.判断一个整数是不是3的幂 3.大于n的最小的2次幂的数 4.交换两个数 5.找到1-n中缺失的数字 6.判断数组中2个出现次数为奇数的数 6.求给定范围内所有数字&的结果 7. 求出现次数少于m的数 1.判断一个整数是不是2的幂提取出二进制里最…...

编程日记 2025/12/27 8:37:04

Virtuoso ADE采用Spectre仿真中出现MOS管最小长宽比满足要求依然报错的情况解决方法

在ADE仿真中错误问题如下： ERROR (CMI-2440): "xxx.scs" 46338: I2.M1: The length, width, or area of the instance does not fit the given lmax-lmin, wmax-wmin, or areamax-areamin range for any model in the I2.M3.nch_hvt group. The channel w…...

编程日记 2026/2/5 9:26:59

图论---朴素Prim（稠密图）

O( n ^2 ) 题目通常会提示数据范围： 若 V ≤ 500，两种方法均可（朴素Prim更稳）。若 V ≤ 1e5，必须用优先队列Prim vector 存图。 // 最小生成树 —朴素Prim #include<cstring> #include<iostream> #i…...

编程日记 2025/12/12 15:32:28

Java知识日常巩固（四）

什么是 Java 中的自动装箱和拆箱? 在Java中，自动装箱（Autoboxing）和拆箱（Unboxing）是Java 5引入的特性，它们允许基本数据类型（如 int、double 等）和它们对应的包装类（如 Integer、Double 等）之间进行自动转换。自动装箱是指将基本数据类型的值自动…...

编程日记 2025/11/11 8:42:31

go.mod介绍

在 Go 项目中，.mod 文件（全称 go.mod）是 Go 语言模块（Module）系统的核心配置文件，用于定义和管理项目的依赖关系、模块名称及兼容性规则。以下是其核心作用与结构的详细说明： 一、go.mod 文件的…...

编程日记 2025/12/12 20:36:47

大模型应用开发之LLM入门

一、大模型概述 1、大模型概念 LLM是指用有大量参数的大型预训练语言模型，在解决各种自然语言处理任务方面表现出强大的能力，甚至可以展现出一些小规模语言模型所不具备的特殊能力 2、语言模型language model 语言建模旨在对词序列的生成概率进行建模…...

编程日记 2026/2/5 10:09:42

算法之回溯法

回溯法回溯法定义与概念核心思想回溯法的一般框架伪代码表示C语言实现框架回溯法的优化技巧剪枝策略实现剪枝的C语言示例记忆化搜索案例分析N皇后问题子集和问题全排列问题寻路问题回溯法的可视化理解决策树状态空间树回溯过程回溯法与其他算法的比较回溯法与动态规划的区…...

编程日记 2025/12/12 18:40:20

武汉昊衡科技OLI光纤微裂纹检测仪：高密度光器件的精准守护者

随着AI技术应用越来越广，算力需求激增，光通信系统正加速向小型化、高密度、多通道方向演进。硅光芯片、高速光模块等核心器件内部的光纤通道数量成倍增加，波导结构愈发精细，传统检测手段因分辨率不足、效率低下，难以精…...

编程日记 2026/2/8 1:05:19

SQL 函数进行左边自动补位fnPadLeft和FORMAT

目录 1.问题 2.解决方式1 方式2 3.结果 1.问题例如在SQL存储过程中，将1 或10 或 100 长度不足的时候，自动补足长度。例如 1 → 001 10→ 010 100→100 2.解决方式1 SELECT FORMAT (1, 000) AS FormattedNum; SELECT FORMAT(12, 000) AS Form…...

编程日记 2026/2/5 18:42:02

Tailwind CSS实战：快速构建定制化UI的新思路

引言在当今快节奏的前端开发环境中，开发者不断寻找能够提高效率并保持灵活性的工具。Tailwind CSS作为一个功能型优先的CSS框架，正在改变开发者构建用户界面的方式。与Bootstrap和Material UI等传统组件库不同，Tailwind不提供预设组件&…...

编程日记 2026/2/1 14:29:16

【数据可视化-25】时尚零售销售数据集的机器学习可视化分析

🧑 博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个…...

编程日记 2026/2/8 3:21:16

UML 活动图深度解析：以在线购物系统为例

目录一、UML 活动图的基本构成要素二、题目原型三、在线购物系统用户购物活动图详细剖析 （一）概述 （二）节点分析三、注意事项四、活动图绘画五、UML 活动图在软件开发中的关键价值六、总结在软件开发与系统设计领…...

编程日记 2026/2/8 1:31:56

利用车联网中的 V2V 通信技术传播公平的紧急信息

与移动自组织网络 (MANET) 相比，车载自组织网络 (VANET) 的节点移动速度更快。网络连接的节点可以在自身内部或其他基础设施之间交换安全或非安全消息，例如车对车 (V2V) 或车对万物 (V2X)。在车载通信中，紧急消息对于安全至关重要，必须分发给所有节点，以提醒它们注意潜在问…...

编程日记 2025/7/19 12:18:19

文件的读取操作

#import time # 导入time 库 # 打开文件 fileopen("E:\Dasktape/python_test.txt","r",encoding"UTF-8")# 读取文件 print(f"读取文件的所有内容内容:{file.read()}\n") #\n是换行字符 print(f"读取10个字节的文件内容:{file.re…...

编程日记 2025/7/19 20:57:33

数学基础 -- 欧拉恒等式的魅力：让复数旋转起来！

公式推导： e i π − 1 e^{i\pi} -1 eiπ−1 被誉为数学中最美的公式之一，它连接了五个数学中最重要的常数： e i π 1 0 (欧拉恒等式) e^{i\pi} 1 0 \tag{欧拉恒等式} eiπ10(欧拉恒等式) 这不仅是巧合，而是复数与三角函数…...

编程日记 2025/12/15 17:25:32

【android bluetooth 协议分析 06】【l2cap详解 6】【L2CA_Register函数解析】

L2CA_Register() 函数的实现，它的作用是： 注册一个 L2CAP 服务（基于 PSM）并设置回调函数、MTU、安全等级、传输模式等信息，供 L2CAP 层用于处理连接、配置、数据、断开等事件。 1. L2CA_Register2/L2CA_Register 参数…...

编程日记 2025/5/28 2:24:16

【MFC】 VS2022打开低版本的MFC，双击.rc文件，DIalog加载失败，页面弹窗fatal error RC*:cannot open***

打开以前的MFC示例报错，打开VS2019的实例以及更早VS版本的实例都一样,打不开，还报错； 错误 MSB8041 此项目需要 MFC 库。从 Visual Studio 安装程序(单个组件选项卡)为正在使用的任何工具集和体系结构安装它们。 GxCameraEvents_VS2015 C:\P…...

编程日记 2026/2/2 12:27:06

Centos9 安装 nginx 及配置

1. 安装nginx 安装依赖软件，安装之前可以看一下是否已经安装过以下软件，dnf list installed | grep zlib dnf install gcc-c dnf install zlib dnf install pcre pcre-devel dnf install openssl openssl-devel下载nginx，这里是下载到opt文…...

编程日记 2026/2/8 1:09:16

使用Handsontable实现动态表格和下载表格

1.效果 2.实现代码首先要加载Handsontable，在示例中我是cdn的方式引入的，vue的话需要下载插件 let hot null;var exportPlugin null;function showHandsontable(param) {const container document.getElementById("hot-container");// 如果…...

编程日记 2026/2/4 16:34:20

Action:Update your application‘s configuration

在使用Maven项目时，有一个报错信息是：Update your applications configuration 这类问题，就是我们的application.yml文件或者 application.properties文件内容哪里写错了最有可能就是对齐方式有问题...

编程日记 2026/2/2 21:59:59

【计算机网络】IP地址

IPv4 五类地址 1.0.0.0 ~ 126.255.255.255A类子网8位，主机24位128.0.0.0 ~ 191.255.255.255B类子网16位，主机16位192.0.0.0 ~ 223.255.255.255C类子网24位，主机8位224.0.0.0 ~ 239.255.255.255D类不分网络地址和主机地址，作为组播…...

编程日记 2026/2/8 2:56:35

Rundeck 介绍及安装：自动化调度与执行工具

Rundeck介绍概述：Rundeck 是什么？ Rundeck 是一款开源的自动化调度和任务执行工具，专为运维场景设计，帮助工程师通过统一的平台管理和执行跨系统、跨节点的任务。它由 PagerDuty 维护（2016 年收购）&#…...

编程日记 2026/2/8 1:05:48

vue element使用el-table时，切换tab，table表格列项发生错位问题

展示问题问题描述：使用el-table的fixed"right"属性后，如果切换tab时，回出现最后一列错误的问题官网提供解决方法：doLayout 需要注意的事项：我这里是通过组件使用的table组件，涉及多层组件封装…...

编程日记 2026/2/5 10:08:05