当前位置：首页 > news >正文

【Paper Reading】6.RLHF-V 提出用RLHF的1.4k的数据微调显著降低MLLM的虚幻问题

news 2026/2/9 22:36:12

分类	内容
论文题目	RLHF-V: Towards Trustworthy MLLMs via Behavior Alignment from Fine-grained Correctional Human Feedback
作者	作者团队：由来自清华大学和新加坡国立大学的研究者组成，包括Tianyu Yu, Yuan Yao, Haoye Zhang, Taiwen He, Yifeng Han, Ganqu Cui, Jinyi Hu, Zhiyuan Liu, Hai-Tao Zheng, Maosong Sun, Tat-Seng Chua。
发表年份	CVPR 2024
摘要	文章针对多模态大型语言模型（MLLMs）在生成与图片不符的文本（即幻觉问题）提出了RLHF-V框架。通过从细粒度的人类反馈中学习，显著减少基础MLLM的幻觉率，提高了模型的可信度和实用性。
引言	强调了MLLMs在多模态理解、推理和交互方面的能力，同时指出其存在的幻觉问题，即生成与关联图片不符的文本，这一问题限制了MLLMs在实际应用中的可信度。
主要内容	RLHF-V框架：论文提出了RLHF-V，一种旨在通过细粒度人类反馈对多模态大型语言模型（MLLMs）行为进行校准的框架，以解决模型产生的幻觉问题，即生成的文本与关联图片不符。这种框架的关键思想是通过人类偏好的形式收集细粒度的反馈，并利用这些反馈来优化模型，从而提高其在处理多模态输入时的可靠性和准确性。细粒度的人类反馈收集：RLHF-V的一个创新之处在于其收集人类反馈的方式。不同于以往依赖粗粒度或整体排名的反馈，RLHF-V要求人类注释者对模型输出中的具体错误或幻觉部分进行细节级的校正。这种细粒度的反馈不仅提供了更明确的学习信号，而且还避免了因语言多样性或偏见而引起的误导。密集直接偏好优化（DDPO）：为了有效利用收集到的细粒度人类反馈，RLHF-V采用了一种名为密集直接偏好优化（DDPO）的技术。DDPO是一种新的优化策略，专门设计用来处理细粒度的反馈，并能够直接在偏好数据上进行模型训练。通过强化学习方法，DDPO能够精确地调整模型的行为，以减少幻觉产生，增强模型输出的事实依据。
实验	实验设计：为了验证RLHF-V的有效性，作者在五个基准数据集上进行了广泛的实验。这些实验旨在评估RLHF-V在减少幻觉、提高模型可靠性方面的性能。实验包括自动评估和人类评估两部分，分别从模型的准确性、可信度以及与人类偏好的一致性进行评价。基准数据集：实验涉及的基准数据集包括图像描述、视觉问答和多模态对话等任务，旨在全面评估RLHF-V在多种多模态交互场景下的表现。通过与当前最先进的MLLMs（包括未使用RLHF-V优化的基线模型）进行对比，实验结果展示了RLHF-V在这些任务上的显著改进。主要结果：实验结果表明，使用RLHF-V框架进行优化的MLLMs在减少幻觉、提高文本与图片一致性方面表现出色。具体而言，与基线模型相比，RLHF-V能够显著降低幻觉率，改善模型输出的可信度和准确性。在人类评估方面，RLHF-V优化后的模型产生的输出更加符合人类的偏好和期望，显示出对复杂多模态输入的更好理解。效率与性能：除了提升模型性能，RLHF-V还显示出良好的数据和计算效率。即使在有限的标注数据下，RLHF-V也能通过其细粒度的反馈学习机制有效地改进模型行为，证明了其在实际应用中的可行性和效率。
结论	RLHF-V通过细粒度的人类反馈校准MLLMs的行为，显著提高了模型的可信度，并在开源MLLMs中取得了最先进的性能。
阅读心得	亮点：制作了一个用于解决幻觉问题的精细化微调的数据集，共有1.4K个样本(HF上现在已经更新到5.7k)。 RLHF-V提供了一种有效的方法来解决MLLMs中的幻觉问题，通过精细的人类反馈和新颖的优化技术，提高了模型在多模态任务中的可信度和实用性。提出DDPO这种方式，源于DPO这篇论文，DPO是说可以直接通过调整模型参数来实现RLHF无需单独训练强化学习模型(可以看我这篇博客)，而DDPO在此基础上做了改进，就是把一段话中的虚幻部分和真实部分切分成了segment，对这些segment分别计算损失来实现细粒度的监督。

【Paper Reading】6.RLHF-V 提出用RLHF的1.4k的数据微调显著降低MLLM的虚幻问题

分类内容论文题目 RLHF-V: Towards Trustworthy MLLMs via Behavior Alignment from Fine-grained Correctional Human Feedback 作者作者团队：由来自清华大学和新加坡国立大学的研究者组成，包括Tianyu Yu, Yuan Yao, Haoye Zhang, Taiwen He, Y…...

编程日记 2024/3/19 2:24:13

Aloudata 倾力打造，《Data Fabric 白皮书 2.0》正式发布

数字经济时代，越来越多企业开始寻求全新的数据管理范式，以更有效地管理、利用不断增长的数据资产。在此背景下，Data Fabric 的概念应运而生，被视为面向未来的数据管理解决方案。距离第一版白皮书问世已经过去一年多时间&#xff…...

编程日记 2024/3/19 2:17:04

docker内部无法使用ping等网络工具解决方案

通常docker内部没有网络，所以我们先离线安装需要的依赖包，然后再使用sh脚本容器内部访问宿主机同网络端其他服务器ip,实现监测远程ip telnet包依赖于netbase包，但是netbase包没有安装。你需要先安装netbase包，然后再尝试安装teln…...

编程日记 2024/3/19 2:15:02

后端工程师快速使用vue和Element

文章目录 Vue1 Vue概述2 快速入门3 Vue指令3.1 v-bind和v-model3.2 v-on3.3 v-if和v-show3.4 v-for3.5 案例 4 生命周期 Element快速使用1 Element介绍2 快速入门3 当前页面中嵌套另一个页面案例代码案例截图 Vue 1 Vue概述通过我们学习的htmlcssjs已经能够开发美观的页面了…...

编程日记 2024/3/19 2:13:00

自学rabbitmq入门到精通

交换机的fault （发布与订阅模式） 因为消息是由生产者发送给excahnge，exchange发送给队列， 然后由队列发送给消费者的。展示使用图形化界面使用fanout模式。创建交换机然后创建三个队列，绑定对应的交换机&#xff…...

编程日记 2024/3/19 2:06:54

由浅到深认识C语言（13）：共用体

该文章Github地址：https://github.com/AntonyCheng/c-notes 在此介绍一下作者开源的SpringBoot项目初始化模板（Github仓库地址：https://github.com/AntonyCheng/spring-boot-init-template & CSDN文章地址：https://blog.csdn…...

编程日记 2024/3/19 2:05:53

1、获取动态加载的数据 1、在开发者工具中查看动态数据找到csdn的门户的开发者工具后到这一页面。 2、加载代码 import requests headers {User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36…...

编程日记 2024/3/19 2:04:53

phpstudy自定义安装mysql8.3并启动

phpstudy自定义安装mysql8.3并启动先去官网:https://dev.mysql.com/downloads/下载压缩包文件然后按下面的图片一步一步操作选择版本，选择第一个压缩包文件，下载下载完成后，解压到phpstudy环境目录下，如下图然后进入mysq…...

编程日记 2024/3/19 2:02:51

Netty 学习资料

Netty 学习资料搜集了一下Java网络库Netty的学习资料，整理如下，有空花时间研究一下。 1、Netty学习手册《尚硅谷 Netty 核心技术及源码剖析》课程学习手册本课程不适合零基础的学员，需要掌握常用的设计模式和数据结构掌握 Java 的面向对…...

编程日记 2024/3/19 2:01:49

【概率论中的两种重要公式：全概率和贝叶斯】

贝叶斯公式（Bayes’ Theorem）是概率论中的一条重要定理，用于计算条件概率。它描述了在已知某一事件发生的条件下，另一事件发生的概率。贝叶斯公式如下所示： P ( A ∣ B ) P ( B ∣ A ) ⋅ P ( A ) P ( B ) P(A|B) \…...

编程日记 2024/3/19 1:59:47

python中的闭包

一、闭包 1、作用域在Python代码中，作用域分为两种情况：全局作用域与局部作用域 2、变量的作用域在全局定义的变量 > 全局变量在局部定义的变量 > 局部变量 3、全局变量与局部变量的访问范围 ① 在全局作用域中可以访问全局变量&#…...

编程日记 2024/3/19 1:58:46

成功解决RuntimeError: OpenSSL 3.0‘s legacy provider failed to load

报错 RuntimeError: OpenSSL 3.0s legacy provider failed to load. This is a fatal error by default, but cryptography supports running without legacy algorithms by setting the environment variable CRYPTOGRAPHY_OPENSSL_NO_LEGACY. If you did not expect this er…...

编程日记 2024/3/19 1:57:45

【 React 】React 组件之间如何通信？

相关文章： React Context的使用方法 react Provider Consumer 使用方法 1. 是什么我们将组件间通信可以拆分为两个词： 组件通信组件是vue中最强大的功能之一，同样组件化是React的核心思想相比vue，React的组件更加灵活和多样…...

编程日记 2024/3/19 1:54:42

汇总全网免费API，持续更新（新闻api、每日一言api、音乐。。。）

Public&FreeAPI 网址：apis.whyta.cn （推荐） UomgAPI 网址：https://api.uomg.com 教书先生网址：https://api.oioweb.cn/ 山海API https://api.shserve.cn/ 云析API铺 https://api.a20safe.com/ 韩小韩…...

编程日记 2024/3/19 1:53:41

Android SystemServer进程解析

SystemServer进程在android系统中占了举足轻重的地位，系统的所有服务和SystemUI都是由它启动。一、SystemServer进程主函数流程 1、主函数三部曲 //frameworks/base/services/java/com/android/server/SystemServer.java /** * The main entry point from zy…...

编程日记 2024/3/19 1:52:40

Github主页设置贪吃蛇详细教程

先看最终实现结果： 有条贪吃蛇放在主页还是蛮酷的哈哈哈。接下来我来讲一讲怎么在Github主页添加一条贪吃蛇。首先要修改自己的Github的主页，我们得有一个特殊的仓库——这个仓库必须与你的Github用户名保持一致，并且需要公开&#xff0c…...

编程日记 2024/3/19 1:45:34

二、实现fastdfs文件上传与延迟删除功能的Spring Boot项目

如何在Spring Boot项目中集成FastDFS实现文件上传功能，并添加支持延迟删除功能的实现。一、Spring Boot 中集成 fastdfs 使用 1、文件上传功能实现首先，让我们看一下如何实现文件上传功能的接口方法： RestController public class File…...

编程日记 2024/3/19 1:44:34

Android FrameWork 学习路线

目录前言学习路线： 1.基础知识 2、AOSP 源码学习 3. AOSP 源码编译系统 4. Hal与硬件服务 5.基础组件 6. Binder 7. 系统启动过程分析 8. 应用层框架编辑 9. 显示系统 10. Android 输入系统 11. 系统应用前言 Android Framework 涉及的行业相当广…...

编程日记 2024/3/19 1:40:28

前端开发者如何打造自己的生态以及ip

作为独立开发者，在公司的岗位上面，经常面对的是页面，但我们不能局限页面，页面是切入点。 1在需求页面的过程中，我们会接触ui，原型，软件，需求， 2在接口对接的过程中&#…...

编程日记 2024/3/19 1:38:26

C语言实现一个两个数加减乘除的答题代码（含文件保存），用户增加，题目增加，题目测试，题目答题等等

目录 1、这是我大一自己写的小代码，现在翻到了就分享出来，高手勿喷。 2、项目运行 3、获取完整源码网址 1、这是我大一自己写的小代码，现在翻到了就分享出来，高手勿喷。 2、项目运行 （1）测试模块每次…...

编程日记 2024/3/19 1:36:23

观成科技：隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具，该工具基于TUN接口实现其功能，利用反向TCP/TLS连接建立一条隐蔽的通信信道，支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式，适应复杂网…...

编程新知 2026/2/8 4:37:24

安宝特方案丨XRSOP人员作业标准化管理平台：AR智慧点检验收套件

在选煤厂、化工厂、钢铁厂等过程生产型企业，其生产设备的运行效率和非计划停机对工业制造效益有较大影响。随着企业自动化和智能化建设的推进，需提前预防假检、错检、漏检，推动智慧生产运维系统数据的流动和现场赋能应用。同时，…...

编程新知 2026/2/5 17:57:20

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个生活电费的缴纳和查询小程序

一、项目初始化与配置 1. 创建项目 ohpm init harmony/utility-payment-app 2. 配置权限 // module.json5 {"requestPermissions": [{"name": "ohos.permission.INTERNET"},{"name": "ohos.permission.GET_NETWORK_INFO"…...

编程新知 2025/11/26 13:15:57

BCS 2025｜百度副总裁陈洋：智能体在安全领域的应用实践

6月5日，2025全球数字经济大会数字安全主论坛暨北京网络安全大会在国家会议中心隆重开幕。百度副总裁陈洋受邀出席，并作《智能体在安全领域的应用实践》主题演讲，分享了在智能体在安全领域的突破性实践。他指出，百度通过将安全能力…...

编程新知 2026/2/1 11:33:19

C++八股 —— 单例模式

文章目录 1. 基本概念2. 设计要点3. 实现方式4. 详解懒汉模式 1. 基本概念线程安全（Thread Safety） 线程安全是指在多线程环境下，某个函数、类或代码片段能够被多个线程同时调用时，仍能保证数据的一致性和逻辑的正确性&#xf…...

编程新知 2025/12/2 3:35:50

大数据学习（132）-HIve数据分析

🍋🍋大数据学习🍋🍋 🔥系列专栏： 👑哲学语录: 用力所能及，改变世界。 💖如果觉得博主的文章还不错的话，请点赞👍收藏⭐️留言&#x1f4…...

编程新知 2025/10/7 8:52:21

Netty从入门到进阶（二）

二、Netty入门 1. 概述 1.1 Netty是什么 Netty is an asynchronous event-driven network application framework for rapid development of maintainable high performance protocol servers & clients. Netty是一个异步的、基于事件驱动的网络应用框架，用于…...

编程新知 2026/1/26 5:44:16

git: early EOF

macOS报错： Initialized empty Git repository in /usr/local/Homebrew/Library/Taps/homebrew/homebrew-core/.git/ remote: Enumerating objects: 2691797, done. remote: Counting objects: 100% (1760/1760), done. remote: Compressing objects: 100% (636/636…...

编程新知 2025/10/12 2:03:36

DiscuzX3.5发帖json api

参考文章：PHP实现独立Discuz站外发帖(直连操作数据库)_discuz 发帖api-CSDN博客简单改造了一下，适配我自己的需求有一个站点存在多个采集站，我想通过主站拿标题，采集站拿内容使用到的sql如下 CREATE TABLE pre_forum_post_…...

编程新知 2025/11/25 17:20:50

Visual Studio Code 扩展

Visual Studio Code 扩展 change-case 大小写转换EmmyLua for VSCode 调试插件Bookmarks 书签 change-case 大小写转换 https://marketplace.visualstudio.com/items?itemNamewmaurer.change-case 选中单词后，命令 changeCase.commands 可预览转换效果 EmmyLua…...

编程新知 2026/1/21 17:44:45