AAAI论文阅读
文章目录
- Open-Vocabulary Multi-Label Classifcation via Multi-Modal Knowledge Transfer——知识蒸馏的范畴
- Med-EASi: Finely Annotated Dataset and Models for Controllable Simplifcation of Medical Texts——医学领域数据集构建
- “Nothing Abnormal”: Disambiguating Medical Reports via Contrastive Knowledge Infusion
- Self-Supervised Logic Induction for Explainable Fuzzy Temporal Commonsense Reasoning——时序信息
Open-Vocabulary Multi-Label Classifcation via Multi-Modal Knowledge Transfer——知识蒸馏的范畴
多模式知识传播

我们的 MKT 主要由视觉和语言预训练(VLP)模型和视觉转换器模型组成。VLP 模型旨在提取输入图像-文本对的多模态知识,而视觉转换器则用于提取输入图像的语义特征。此外,还利用知识提炼来保证图像及其相关标签嵌入的一致性,并通过及时调整来进一步更新标签嵌入。(最佳彩色效果)

主要贡献:
- 我们提出了一种基于开放词汇的多模态知识转移(MKT)框架,该框架基于 VLP 模型,利用图像-文本对中的语义多模态信息进行多标签分类。 据我们所知,这是第一项探索开放词汇多标签分类任务的工作。
- 我们的 MKT 框架主要由提取图像特征的图像编码器和提取图像/标签嵌入的 VLP 图像/文本编码器组成。为了保证图像和标签嵌入的一致性,我们在 MKT 框架中加入了知识蒸馏策略,并通过及时调整来迭代更新标签嵌入。此外,为了进一步提高我们方法的特征表达能力,我们提出了双流特征提取模块,通过联合捕捉局部特征和全局特征来提高特征提取的能力。
- 大量结果表明,我们的 MKT 方法明显优于之前的 ML-ZSL 方法,并在两个大规模基准测试中为开放词汇多标签分类建立了新的技术水平
Med-EASi: Finely Annotated Dataset and Models for Controllable Simplifcation of Medical Texts——医学领域数据集构建
MedEASi(简化和抽象医学数据集)是一个独特的众包和注释数据集,用于监督医学短文的简化。
我们采用多角度训练方法,为文本简化添加了两种可控性:位置感知(使用原位注释输入和输出)和位置无关(模型只知道要编辑的内容,但不知道它们的位置)。
- 数据集 我们对现有的两个并行医学文本简化语料库进行了四种文本转换注释,即阐述、替换、删除和插入新内容。
“Nothing Abnormal”: Disambiguating Medical Reports via Contrastive Knowledge Infusion
"没有异常 通过对比知识注入消除医疗报告的歧义
我们探讨了医疗保健领域的受众期望差距,并将导致患者对其诊断感到困惑的常见歧义归纳为三类:医学术语、自相矛盾的结论和误导性语法错误。
我们的医疗团队对结果进行了分析,并将产生歧义的主要原因归纳为三类:报告句子含糊不清的原因是:(1)医学术语的含义与日常一般用法不同,如unsmarkable;(2)同一句子中的结论相互矛盾;(3)误导性语法错误,如完整句子之间没有句号。
解决方案(模型):我们首先通过对比学习对医学领域的 Seq2Seq 模型进行预训练。然后,通过扰动模型的隐藏状态,使用该模型改写模棱两可的输入,并将生成的结果推向对其考试结果更加明确的方向。
任务表示形式:
对于异常标签为 y(是否存在异常)的模棱两可的句子 x,我们将输出一个对 y 更明确的消歧义句子 x˜。
For an ambiguous sentence x whose abnormality label is y (abnormality presents or not), we will output a disambiguated sentence x˜ that is more explicit about y.

预训练阶段损失函数:

重写阶段(Rewriting framework):

Self-Supervised Logic Induction for Explainable Fuzzy Temporal Commonsense Reasoning——时序信息
问题来源: 最近的一项研究表明,经过大规模预训练的 LM 在复杂语境(如对话)下仍难以进行这种时间推理,因为它们只能隐式地编码相关语境,而不能显式地揭示复杂推理的基本逻辑组合。
定义了三个模块化组件:时态依赖诱导器和时态概念模糊器,以及逻辑验证器。
模型结构:
LECTER 框架。我们利用逻辑归纳模块(logic induction module)来解决模糊时态常识推理的中间推理步骤(intermediate inference steps)。逻辑验证器(The logic validator)从依赖诱导器和概念模糊器中获取预测概率分布,计算时态逻辑蕴含损失。它与基于回归的时值恢复损失一起,以端到端的方式训练模型(regression-based temporal value recovery loss to train the model in an end-to-end manner)。

we propose two self-supervised learning objectives, i.e., the Regression-based Temporal Value Recovery and Temporal Logical Entailment.
我们提出了两个自监督学习目标,即基于回归的时域价值恢复和时域逻辑不一致
(小trick:将时序做了变换处理,比如7:30 pm →19 + 30/60 → 19.5)
损失函数:
- 回归损失(mean square loss——均方误差):

- 分类损失
给定训练示例 X 和作为查询的 q,模型需要调整权重,使所有训练示例的查询概率 Pθ(q|X ) 最大化。这可以通过最小化查询的平均负对数似然来实现:

- 总损失函数

相关文章:
AAAI论文阅读
文章目录 Open-Vocabulary Multi-Label Classifcation via Multi-Modal Knowledge Transfer——知识蒸馏的范畴Med-EASi: Finely Annotated Dataset and Models for Controllable Simplifcation of Medical Texts——医学领域数据集构建“Nothing Abnormal”: Disambiguating M…...
填补5G物联一张网,美格智能快速推进RedCap商用落地
自5G R17版本标准冻结以来,RedCap一直引人注目。2023年更是5G RedCap突破性发展的一年,从首款5G RedCap调制解调器及射频系统——骁龙X35发布,到国内四大运营商发布RedCap技术白皮书,芯片厂商、模组厂商、运营商及终端企业都在积极…...
服务器杂七杂八的知识/常识归纳(不断更新)
一.pID与端口号不一样吗? pID(Process ID,进程标识符)和端口号是不同的概念。 pID是操作系统中用来唯一标识一个正在运行的进程的数字。每个正在运行的进程都会被分配一个唯一的pID,它可以用来追踪和管理进程。 而端口号是在网…...
掌握Java排序算法:实现主流排序方法与性能对比
一,C语言,主流的排序方法介绍 当谈论主流的排序方法时,通常指的是在实际应用中表现优秀且被广泛采用的排序算法。以下是常见的主流排序方法及其介绍、时间复杂度、空间复杂度和简单的C语言代码实现: 冒泡排序(Bubble S…...
jdk17 SpringBoot JPA集成多数据库
switchRegion(切换地区)功能, 客户端可手动切换地区 , 查询不同的数据库, 后台根据地区切换数据库, 请求头添加region的key 配置类 import org.springframework.boot.context.properties.ConfigurationProperties; import org.springframework.boot.jdbc.DataSourceBuilder; im…...
vue 新学习 06 js的prototype ,export暴露,vue组件,一个重要的内置关系
01 在js中: 原型链 注意:构造函数.prototype实例化对象.__proto__,都是指向函数的原型。 export: -export用于对外输出本模块(一个文件可以理解为一个模块)变量的接口 -import用于在一个模块中加载另一个…...
冠达管理:“高温超导”不是“室温超导”,5天4板百利电气再次澄清
短短半个月,“室温超导”在惊喜、质疑间回转,但资本市场对“超导概念股”的炒作还在进行,8月7日室温超导概念持续疯涨。同花顺显现,到8月7日收盘,18只超导概念股中,有16只股票飘红。 广东研山私募证券投资&…...
CS 144 Lab Four 收尾 -- 网络交互全流程解析
CS 144 Lab Four 收尾 -- 网络交互全流程解析 引言Tun/Tap简介tcp_ipv4.cc文件配置信息初始化cs144实现的fd家族体系基于自定义fd体系进行数据读写的adapter适配器体系自定义socket体系自定义事件循环EventLoop模板类TCPSpongeSocket详解listen_and_accept方法_tcp_main方法_in…...
Linux面试专题
Linux面试专题 1 Linux中主要有哪几种内核锁?2 Linux 中的用户模式和内核模式是什么含意?3 怎样申请大块内核内存?4用户进程间通信主要哪几种方式?5通过伙伴系统申请内核内存的函数有哪些?6) Linux 虚拟文件系统的关键数据结构有哪些?(至少写出四个)7) 对文件或设备的操作…...
MySQL错误日志(Error Log)详解
错误日志(Error Log)是 MySQL 中最常用的一种日志,主要记录 MySQL 服务器启动和停止过程中的信息、服务器在运行过程中发生的故障和异常情况等。 作为初学者,要学会利用错误日志来定位问题。下面介绍如何操作查看错误日志。 启动…...
Qt应用开发(基础篇)——LCD数值类 QLCDNumber
一、前言 QLCDNumber类继承于QFrame,QFrame继承于QWidget,是Qt的一个基础小部件。 QLCDNumber用来显示一个带有类似lcd数字的数字,适用于信号灯、跑步机、体温计、时钟、电表、水表、血压计等仪器类产品的数值显示。 QLCDNumber可以显示十进制…...
新版百度、百家号旋转验证码识别
昨天突然发现,百度旋转验证码发生了变化,导致使用老版本验证码训练出来的识别模型效果不佳。所有昨天花了一天时间完成了新版模型的训练。 老版本验证码 新版本验证码 新版的验证码感觉像是AI绘画随机生成的,还有随机阴影出现。 验证码识别…...
PMP考试每日一练(8月8日)
1、项目经理正在领导一个正在努力协作的多元文化团队。项目经理一开始将此视为团队建设的典型震荡阶段,但团队未能成功通过该阶段。结果,项目开始落后于进度。 项目经理在第一次发现这个问题时应该做哪两项工作?(选两个࿰…...
机器学习实战1-kNN最近邻算法
文章目录 机器学习基础机器学习的关键术语 k-近邻算法(KNN)准备:使用python导入数据实施kNN分类算法示例:使用kNN改进约会网站的配对效果准备数据:从文本文件中解析数据分析数据准备数据:归一化数值测试算法…...
【eNSP】静态路由
【eNSP】静态路由 原理网关路由表 实验根据图片连接模块配置路由器设备R1R2R3R4 配置PC的IP地址、掩码、网关PC1PC2PC3 配置静态路由查看路由表R1R2R3R4测试能否通信 原理 网关 网关与路由器地址相同,一般路由地址为.1或.254。 网关是当电脑发送的数据的目标IP不在…...
算法训练Day42|1049. 最后一块石头的重量 II ● 494. 目标和 ● 474.一和零
背包类别 01背包:有n种物品,每种物品只有一个. 完全背包:有n种物品,每种物品有无限个. 多重背包:有n种物品,每种物品个数各不相同. 区别:仅仅体现在物品个数上的不同而已。 确定dp[i][j]数组的…...
HBase-组成
client 读写请求HMaster 管理元数据监控region是否需要进行负载均衡,故障转移和region的拆分RegionServer 负责数据cell的处理,例如写入数据put,查询数据get等 拆分合并Region的实际执行者,由Master监控,由regionServ…...
第一部分:领域中的基本概念
目录 一、什么是模型 二、什么是领域 三、什么是领域模型 四、什么是领域建模 一、什么是模型 模型是一种简化、它是对现实的解释,它与解决问题密切相关的方面抽象出来,而忽略无关细节。 二、什么是领域 领域是指某一专业或事物方面范围的涵盖。比如…...
react使用ref调用子组件的方法
Class类组件 import React, { useRef } from react;const MyComponent () > {const myComponentRef useRef(null);const handleClick () > {// 调用MyComponent组件的方法myComponentRef.current.myMethod();};return (<div><MyComponent ref{myComponentRe…...
JVM面试突击班2
JVM面试突击班2 对象被判定为不可达对象之后就“死”了吗 对象的生命周期 创建阶段 (1)为对象分配存储空间 (2)开始构造对象 (3)从超类到子类对static成员进行初始化 (4)超类成…...
告别Python程序分发难题:Auto PY to EXE图形化打包终极指南
告别Python程序分发难题:Auto PY to EXE图形化打包终极指南 【免费下载链接】auto-py-to-exe Converts .py to .exe using a simple graphical interface 项目地址: https://gitcode.com/gh_mirrors/au/auto-py-to-exe 还在为Python程序分享而烦恼吗&#x…...
8大网盘高速下载终极指南:免费实现全平台直链解析,告别限速烦恼
8大网盘高速下载终极指南:免费实现全平台直链解析,告别限速烦恼 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 /…...
为AI智能体工作流构建高可用的模型调用后端
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 为AI智能体工作流构建高可用的模型调用后端 在构建基于OpenClaw或Hermes Agent的自动化工作流时,模型调用的稳定性直接…...
N_m3u8DL-RE终极指南:如何高效下载加密流媒体视频
N_m3u8DL-RE终极指南:如何高效下载加密流媒体视频 【免费下载链接】N_m3u8DL-RE Cross-Platform, modern and powerful stream downloader for MPD/M3U8/ISM. English/简体中文/繁體中文. 项目地址: https://gitcode.com/GitHub_Trending/nm3/N_m3u8DL-RE 还…...
从‘看不见’到‘毁不掉’:深入聊聊数字水印的鲁棒性到底怎么测(附常见攻击模拟方法)
数字水印鲁棒性测试实战指南:从理论到攻击模拟 数字水印技术已经从单纯的学术研究走向了广泛的商业应用,成为版权保护领域不可或缺的一环。但真正决定一个水印系统实用价值的,是其抵抗各种攻击的鲁棒性——这项指标直接关系到水印能否在现实…...
长鑫存储逆袭:从近10年亏损超366亿到盈利超预期,能否成“中国海力士”?
长鑫存储逆袭:从巨亏到盈利超预期,能否成为“中国海力士”?“韩国巨头布局存储,中国巨头热衷于外卖。”这一波存储涨价潮,很多人用戏谑的方式来表达对中国几家互联网公司的“恨铁不成钢”。但长鑫存储却凭借一份极度亮…...
AI系统的四层缓存架构
别再被“提示词缓存”“语义缓存”绕晕了,它们根本不是一回事 先上关系图:AI系统里的四层缓存 很多人把缓存当一个东西聊,其实它们是四个不同的层,各管各的,又互相喂数据。 第一层 长期知识源 项目记忆缓存&#x…...
FNF-PsychEngine终极指南:3个Lua脚本技巧让游戏体验飙升
FNF-PsychEngine终极指南:3个Lua脚本技巧让游戏体验飙升 【免费下载链接】FNF-PsychEngine Engine originally used on Mind Games mod 项目地址: https://gitcode.com/gh_mirrors/fn/FNF-PsychEngine FNF-PsychEngine是一款功能强大的节奏游戏引擎ÿ…...
3个核心优化:让你的华硕笔记本性能翻倍且更省电
3个核心优化:让你的华硕笔记本性能翻倍且更省电 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zenbook, Expertbo…...
告别硬编码!在UE5 GAS里用曲线表格(Curve Table)动态管理RPG技能数值
告别硬编码!在UE5 GAS里用曲线表格(Curve Table)动态管理RPG技能数值 在开发RPG游戏时,技能数值的调整往往是一个频繁且耗时的过程。传统的硬编码方式不仅效率低下,还容易导致版本混乱。本文将介绍如何利用UE5的GAS系统…...
