当前位置: 首页 > article >正文

虚假新闻检测数据集中的隐藏偏见

在2021年欧洲计算语言学协会EACL会议上我们的论文《虚假新闻检测数据集中的隐藏偏见》荣获最佳长篇论文提名。该论文研究了研究社区用于开发自动识别虚假新闻模型的数据集发现这些数据集存在偏见而这些偏见正是以往论文所报告的高准确率的主要原因。这表明基于这些数据集构建的模型在现实场景中将难以有效泛化。数据收集中的偏见创建虚假新闻数据集需要收集新闻文章及其对应的标签例如“可靠”或“不可靠”。事实核查网站如PolitiFact为单个文章分配标签虽准确但耗时且成本高导致数据集规模较小。另一种方法是给每个新闻网站如cnn.com分配一个可靠性评分这能轻松创建大规模数据集但会产生噪音标签。我们的研究考察了这两种方法网站级和文章级标注所构建数据集的偏见。关键词相关性带来的偏见以流行的FakeNewsNet数据集文章级标注为例我们训练了一个简单的逻辑回归模型仅基于关键词预测新闻的可靠性其准确率78%几乎与基于BERT的最先进模型81%相当。分析发现像“Brad”、“Pitt”等名人名字倾向于预测“不可靠”标签而“2018”、“season”等中性词则预测“可靠”标签。这表明模型可能只是捕捉到了主题词与“虚假新闻”标签之间的表面相关性例如数据集中的名人新闻多被标记为不可靠而非真正理解了内容的虚假性。这反映出数据集构成存在偏差主题词与标签之间存在强烈且不真实的关联。造成这种现象的部分原因是事实核查网站选择文章时的固有偏见另一部分原因则是在构建FakeNewsNet时作者使用搜索引擎检索全文可能导致原本的虚假内容被替换为可靠内容而标签未更新。网站分类带来的问题在考察使用网站级标签的NELA数据集时我们发现了更多问题。文献中报道的模型在该类数据集上准确率很高但我们发现大部分准确率归因于训练集和测试集中包含了来自相同网站的文章。这意味着模型可以忽略识别虚假内容的任务而只是简单地记住特定网站是可靠还是不可靠。我们通过一个“随机标签”实验证明了这一点将网站标签完全随机打乱使其不再代表网站的真实可靠性。结果发现使用这些随机标签训练的模型其准确率与使用真实标签训练的模型相比差距仅在2%以内。这表明模型实际上是在学习识别网站而非判断内容真伪这在实践中毫无用处因为网址本身就包含了网站名。我们还发现即使采用干净的训练/测试集网站划分也不足以衡量模型的泛化能力。模型性能的高低与训练集和测试集中网站的相似性密切相关相似度越高准确率越高。模型性能的深层偏差在使用合理划分训练集与测试集网站相似度低的数据集进行训练后我们分析了模型最容易出错的文章类型。结果发现模型在政治和世界新闻等主题上的表现最差而在体育和娱乐新闻上表现最好。新闻的真实性对所有主题都至关重要模型在政治等关键领域的表现不佳凸显了改进虚假新闻检测数据的紧迫性。改进建议我们的研究表明为确保模型性能的提升真正反映了其识别虚假新闻的能力研究社区需要在数据收集、数据集构建和实验设计方面做出多项改变。为此我们提供了最佳实践指南表格见原文并公开了所有代码基于Apache 2.0许可可在GitHub上获取希望以此推动虚假新闻建模、分析和数据质量的提升。FINISHED更多精彩内容 请关注我的个人公众号 公众号办公AI智能小助手或者 我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享

相关文章:

虚假新闻检测数据集中的隐藏偏见

在2021年欧洲计算语言学协会(EACL)会议上,我们的论文《虚假新闻检测数据集中的隐藏偏见》荣获最佳长篇论文提名。该论文研究了研究社区用于开发自动识别虚假新闻模型的数据集,发现这些数据集存在偏见,而这些偏见正是以…...

2026年必看!开源AI编程工具OpenCode全面解析

2026年必看!开源AI编程工具OpenCode全面解析 前言:AI编程工具的范式跃迁 2025年无疑是AI编程的"大航海"之年。从ChatGPT回答编程问题,到GitHub Copilot的代码补全,再到Cursor这样的AI原生IDE,最终演进到了终…...

17:无人机远程执行路径规划:A*算法与GPS精准打击

作者: HOS(安全风信子) 日期: 2026-03-15 主要来源平台: GitHub 摘要: 本文深入探讨了无人机远程执行的路径规划技术,重点分析了A*算法的应用和GPS精准定位的实现。通过详细的技术架构设计和代码实现,展示了…...

OpenClaw 爆火却没空折腾?构建 Skills 释放自己,玩转AI

引言 最近OpenClaw等新一代AI产品工具爆火,眼看着大家都在折腾各种高端的Agent玩法,自己想花时间去深度玩转,但工作又太忙,深陷在“每天帮业务查同一类报错”、“每天帮业务汇总同样的信息”等高频重复动作中,怎么办&a…...

2024 必看!分离焦虑与孩子刚上幼儿园哭闹的关联,至德幼儿园深度剖析

家中有孩子刚上幼儿园的家长们,是不是常常在想:“分离焦虑会导致孩子刚上幼儿园哭闹吗🧐?” 孩子初入幼儿园的哭闹,着实让家长们揪心。选对幼儿园,不仅能解答疑惑,还能提供专业应对方法。接下来…...

自定义UDP协议视频传输环形缓冲区重构(真正的一次分配,循环使用)

问题分析环形缓冲区需要注意的问题:数据复制:每次读写都调用 memcpy 复制数据内存浪费:每个元素独立存储,没有利用连续内存缺乏零拷贝:没有提供直接访问缓冲区的方法效率低下:不适合大量数据的循环使用解决…...

徐子崴罗姣《赴一场前世的约定》再续“歌坛知音”佳话

近日,青年歌唱家、词曲作家、音乐制作人徐子崴和知名民族女高音、“民歌网红”罗姣的全新单曲《赴一场前世的约定》全网上线!2025年,“歌坛知音”徐子崴与罗姣一路高歌。从年初的浪漫之作《终于把你遇见》,到端午时寄托乡愁的《我…...

城市级地下管网与海绵城市物联感知网建设全景指南:打造韧性城市的“数字神经”(WORD)

摘要 随着城市化进程的极速推进,城市地下管网作为维持城市运行的“生命线”,其安全稳定性与防涝能力直接关系到城市的韧性与居民的生命财产安全。面对极端天气频发、管网老化严重以及传统管理模式滞后等多重挑战,构建一套全域覆盖、实时感知、…...

QMetaObject::invokeMethod跨线程调用方法

创建工作类 #include <QObject>class Worker : public QObject {Q_OBJECT public:explicit Worker(QObject *parent nullptr);Q_INVOKABLE bool outputThread(const QString &text){qDebug()<<text << "thread "<<QThread::currentThr…...

串联构型混合动力汽车Simulink仿真模型建模:基于成熟软件架构与功率跟随控制策略的完整正向...

串联构型混合动力汽车Simulink仿真模型建模&#xff0c;正向仿真模型&#xff0c;采用成熟人车路软件架构&#xff0c;基于功率跟随控制策略&#xff0c;包含完整的初始化文件&#xff0c;整车模型&#xff0c;以及说明文档&#xff0c;可进行适当。 也可提供其他变种构型&…...

DynamicLake:为Mac带来灵动岛交互体验,支持应用与通知 | ProductHunt 今日热榜 - 03月16日

今日榜单登顶产品 DynamicLake 以 343 票登顶今日热榜&#xff01;这是一款为Mac移植灵动岛交互体验的工具&#xff0c;整合通知、快捷转换等多种功能&#xff0c;让桌面交互更直观高效。 本期亮点产品介绍 本期Product Hunt热榜AI相关产品占比超一半&#xff0c;围绕OpenCla…...

Thinkphp和Laravel框架微信小程序的健康管理系统医院挂号预约

目录技术选型与架构设计用户端功能实现医生管理后台支付与通知系统性能优化策略安全防护措施项目技术支持可定制开发之功能创新亮点源码获取详细视频演示 &#xff1a;文章底部获取博主联系方式&#xff01;同行可合作技术选型与架构设计 后端框架选择ThinkPHP或Laravel&#…...

AI写论文必备!4款AI论文生成工具,高效解决论文写作难题!

学术论文写作难题与AI工具解决方案 在撰写学术论文时&#xff0c;无论是期刊论文、毕业论文还是职称论文&#xff0c;研究人员往往会遇到许多棘手的问题。面对海量的文献资料&#xff0c;寻找相关的信息如同大海捞针&#xff1b;而复杂的格式要求则常常让人苦不堪言&#xff1…...

开启外部中断的标准步骤

步骤1&#xff1a;初始化GPIO GPIO_InitTypeDef GPIO_InitStructure; // 1. 开启GPIO时钟 RCC_APB2PeriphClockCmd(RCC_APB2Periph_GPIOA, ENABLE);// 2. 配置GPIO为输入模式&#xff08;通常是浮空输入或上拉输入&#xff09; GPIO_InitStructure.GPIO_Pin GPIO_Pin_0; GPIO_…...

无人机与手机照片POS信息提取工具|支持JPG批量读取与导出

温馨提示&#xff1a;文末有联系方式工具核心功能概述 本工具专为地理信息与航测工作者设计&#xff0c;可高效提取无人机航拍影像及普通智能手机拍摄的JPG照片中嵌入的POS&#xff08;Position and Orientation System&#xff09;元数据&#xff0c;涵盖经度、纬度、海拔、拍…...

7×24小时智能值守的企业微信AI智能客服系统源码

温馨提示&#xff1a;文末有资源获取方式为企业打造全天候、智能化的客户服务体系&#xff0c;基于PHP原创开发&#xff0c;源码获取方式在源码闪购网&#xff0c;深度集成企业微信&#xff0c;提供以下核心功能&#xff1a;全天候智能值守系统724小时自动响应客户咨询&#xf…...

罗克韦尔 1440-SCDB9FXM2通信电缆

1440-SCDB9FXM2 是罗克韦尔自动化旗下 Allen-Bradley 品牌&#xff0c;专为 1440 XM 系列设备状态监测模块设计的原厂专用串行通信电缆&#xff0c;是 XM 系统组态调试、现场运维的核心配件。一、产品特性专属原生适配&#xff1a;专为 XM 全系列设备状态监测模块&#xff08;X…...

AI教材生成工具推荐,低查重率为教材质量保驾护航!

教材格式的复杂性一直困扰着许多编写者。比如说&#xff0c;标题的字体大小应该设定为多少&#xff1f;参考文献是按照GB/T7714标准还是应该遵循某些出版机构的独特规范&#xff1f;习题的排版是选择单栏&#xff0c;还是双栏更合适&#xff1f;这些不同的要求让人眼花缭乱&…...

手把手拆解工业级ISP算法源码

ISP算法源码 资料最齐全&#xff0c;全网最低&#xff0c;包含Cmodel执行文件&#xff0c;可读源代码等等。 也有骗子搞成号称有Cmodel执行文件注意甄别&#xff0c;甚至宝贝描述都是抄我的 也可以在xilinx平台例化图形界面&#xff0c;方便使用 功能涵盖&#xff1a; DPC坏点缺…...

考虑集流体的 Comsol sofc固体氧化物燃料电池仿真(温度场分布,气体分布,极化曲线

考虑集流体的 Comsol sofc固体氧化物燃料电池仿真&#xff08;温度场分布&#xff0c;气体分布&#xff0c;极化曲线&#xff0c;性能曲线&#xff09;凌晨三点盯着屏幕上的温度云图&#xff0c;我手里的冰美式已经见底。集流体的边缘区域突然出现一块诡异的低温区&#xff0c;…...

N 3 串口

一、串口UART&#xff1a;Unervisal Async Recveiver Transimitter&#xff0c;通用异步收发器。&#xff08;全双工&#xff0c;串行&#xff09;RXD&#xff1a;接收信号线TXD&#xff1a;发送信号线CH340&#xff1a;电平转换芯片单工&#xff1a;通信时&#xff0c;数据接收…...

513. 找树左下角的值-day16

本地要找出树的最后一行找到最左边的值。此时大家应该想起用层序遍历是非常简单的了&#xff0c;反而用递归的话会比较难一点。我们依然还是先介绍递归法。咋眼一看&#xff0c;这道题目用递归的话就就一直向左遍历&#xff0c;最后一个就是答案呗&#xff1f;没有这么简单&…...

DO-254通读--11.0 附加考虑

11.0 附加考虑 本节提供了前几节未涵盖的设计保证附加考虑事项的指南。申请人可酌情使用这些附加考虑来满足第2节至第9节的部分目标。任何附加考虑的使用均应征得审定机构的同意。 11.1 使用先前已开发的硬件 本节讨论与使用先前已开发的硬件相关的问题。指南包括对硬件修改…...

AI写教材的秘密武器!实现低查重教材生成的实用工具推荐

撰写教材现状及 AI 工具的作用 撰写教材的进度总是会在“慢节奏”中踩到许多雷区。本来框架和资料都已经齐备&#xff0c;却在内容写作上遭遇瓶颈——一句话反复琢磨半天&#xff0c;依旧觉得表达不够准确&#xff1b;章节之间的衔接&#xff0c;总是绞尽脑汁也找不到合适的语…...

内窥镜加热器如何选择红外LED加热光源

内窥镜加热器在医疗和工业领域中扮演着关键角色&#xff0c;特别是在低温环境下需要确保内窥镜的正常工作。选择合适的红外LED加热光源对于提高内窥镜的性能和可靠性至关重要。本文将从内窥镜加热方式的发展、红外LED光源的选择、内窥镜加热器的应用案例和方案&#xff0c;以及…...

Vivado FPGA输入时钟约束

## 40mhz时钟输入 set_property PACKAGE_PIN F17 [get_ports f_clk40mhz] set_property IOSTANDARD LVCMOS33 [get_ports f_clk40mhz] create_clock -period 25.000 -name f_clk40mhz -waveform {0.000 12.500} [get_ports f_clk40mhz]前两行是引脚约束&#xff0c;后一行是时…...

昆仑通态触摸屏485通讯恒压供水程序(一拖二)

昆仑通态触摸屏485通讯ABB做的恒压供水程序&#xff0c;不需要PLC 恒压供水一拖二程序 1.触摸屏程序MCGpro版本&#xff0c;也有优盘格式文件 2.有ABB变频器一拖二设置参数及接线图纸&#xff0c;(可不用触摸屏) 3.有CAD图纸&#xff0c;二次图&#xff0c;昆仑通态的触摸屏直接…...

高德地图车机版9.1.0.600087美化包

资源编号235_高德地图车机版9.1.0.600087正式版。 更新自定义dex版本至20260311。 全新自定义修改脚本&#xff0c;修复已知bug&#xff0c;增加稳定性。 支持悬浮/原包/共存_鹰眼预警/ai预测/红绿灯播报/变灯提醒/超速提醒/天气播报等 点我下载 ❗关于系统版本&#xff1…...

【最新】OpenClaw(Clawdbot)本地6分钟搭建及使用萌新步骤

【最新】OpenClaw&#xff08;Clawdbot&#xff09;本地6分钟搭建及使用萌新步骤。OpenClaw&#xff08;Clawdbot/Moltbot&#xff09;作为开源、本地优先的AI助理框架&#xff0c;凭借724小时在线响应、多任务自动化执行、跨平台协同等核心能力&#xff0c;成为个人办公与轻量…...

多策略混合的北方苍鹰优化算法:基于立方混沌与透镜反向学习的种群初始化及最差最优策略对比原始NG...

多策略混合改进的北方苍鹰优化算法--MATLAB 改进&#xff1a; 1、立方混沌和透镜反向学习初始化种群 2、最差最优反向策略和透镜反向学习 对比原始NGO算法江湖上优化算法多如牛毛&#xff0c;今儿咱们来盘一盘这个自带猛禽气质的北方苍鹰优化算法&#xff08;Northern…...