论文阅读:Dual Anchor Graph Fuzzy Clustering for Multiview Data

论文地址:Dual Anchor Graph Fuzzy Clustering for Multiview Data | IEEE Journals & Magazine | IEEE Xplore
代码地址:https://github.com/BBKing49/DAG_FC
摘要
多视角锚图聚类近年来成为一个重要的研究领域,催生了多个高效的方法。然而,当前的多视角锚图聚类方法仍然面临三个主要挑战。
首先,现实世界数据通常表现出不确定性和较差的可辨识性,导致直接从原始数据提取的锚图质量较低,影响聚类效果。其次,大多数现有方法假设视角之间存在公共信息,并主要利用这些信息进行聚类,从而忽略了视角特有的信息。第三,如何进一步探索和利用所学习的锚图以提升聚类性能仍然是一个开放性问题。
为了解决这些问题,本文提出了一种新的双锚图模糊聚类方法。首先,提出了一种基于矩阵分解的双锚图学习方法,以解决前两个问题。该方法能够提取各个视角的高度可辨识隐藏表示,并在此基础上分别构建公共锚图和特有锚图。然后,为了解决第三个问题,本文提出了一种锚图模糊聚类方法,通过协同学习机制充分利用和挖掘公共与特有锚图。此外,构建了一种基于双锚图的模糊隶属度结构保持机制,以进一步提升聚类性能。最后,引入负香农熵,自适应地调整各视角的权重。
在多个数据集上的大量实验结果表明,该方法具有良好的聚类效果和有效性。
引言
随着数字技术的进步,收集到的数据种类大幅增加。例如,在生物信息学领域,酶可以用序列信息和结构信息来表示;同样,肿瘤也可以通过不同的医学成像方式(如 CT 和 MRI 扫描)进行描述。在过去的十年里,如何构建高效的模型来处理这些多表示或多源数据已成为研究的重点。多视角聚类学习是一种强大的技术来处理这些数据,并基于该技术已发展出多种有效的方法。其中,基于图的多视角子空间聚类方法是最重要的代表之一。该方法通过学习不同视角之间的公共相似性矩阵,并利用谱聚类算法来获得最终的聚类结果。
为了提高聚类效果,研究者们提出了不同的改进策略。例如,基于多核方法,Zhou 等人提取了不同视角之间的一致性相似性矩阵用于聚类建模;基于自表示学习,Cao 等人提取了各个视角的相似性矩阵,并引入Hilbert-Schmidt 独立性准则来增强相似性矩阵的多样性,最终将这些矩阵融合为一个公共相似性矩阵以进行谱聚类。此外,为了解决不完整多视角数据的问题,Xu 等人将潜在表示学习和公共相似性矩阵学习统一到一个过程当中。此外,为了提取高可辨识性的公共图,Liang 等人和 Cai 等人分别探索了不同视角之间的一致性和不一致性,并去除不一致信息,融合一致信息构建公共图进行聚类。
然而,现有的基于图的多视角聚类方法仍然存在计算成本较高的问题。例如,在计算相似性矩阵、执行谱聚类以及离散化谱嵌入时需要较长的计算时间。为了降低计算成本,近年来研究人员提出了多种锚图(anchor graph)方法,其高效性使其成为研究热点。这些方法的基本思路是:从多视角数据中选择或学习代表性锚点实例,并基于这些锚点生成锚图进行聚类。
目前,已有多种基于锚图的建模框架。例如,Kang 等人提出的方法通过预训练一组聚类中心作为锚点,并为每个视角学习锚图,最终通过后处理将其融合为公共表示;Zhang 等人则提出了一种更具灵活性的方法,该方法学习多组锚点实例并构建多级锚图,同时设计了一种多锚点融合机制,以高效地融合这些锚图。此外,Wang 等人在 Kang 等人的基础上,提出了一种新的锚点匹配机制和锚图融合框架,以进一步提升聚类性能。

尽管现有的锚图方法取得了一定的进展,但仍然面临以下挑战:
-
直接从原始数据构建锚图的鲁棒性问题:原始数据通常包含噪声和错误,直接构造的锚图可能缺乏可辨识性,进而影响聚类效果。因此,需要设计更鲁棒的锚图学习方法。
-
公共信息和特有信息的兼顾问题:现有方法通常仅关注公共锚图或分别构建所有视角的特有锚图并后期融合,但多视角数据同时包含公共信息和特有信息,现有方法无法同时利用这两类信息。因此,如何同时探索公共和特有锚图成为提升聚类性能的关键问题。
-
锚图聚类方法的优化问题:当前方法通常直接在锚图上执行传统的单视角聚类方法,尚缺乏针对锚图的更有效的聚类策略,这限制了聚类性能的进一步提升。
本文贡献
针对上述问题,本文提出了一种双锚图模糊聚类方法,其核心创新点包括:
-
提出了一种新的多视角双锚图学习方法,该方法不仅统一了隐藏表示学习和锚图学习,还能够同时挖掘公共信息和特有信息。
-
提出了一种基于锚图的多视角模糊聚类方法,通过构建模糊隶属度结构保持机制和引入负香农熵,充分利用双锚图提升聚类性能。
-
在多个多视角数据集上的实验验证了所提出方法的有效性。
模型

A. 提出方法的框架
为了解决引言中提出的三个问题和挑战,本节提出了一种新的高效聚类方法,其框架如图 2 所示。该方法包括两个主要步骤:第一步是基于矩阵分解的多视角双锚点图学习,第二步是基于双锚点图的协同学习模糊聚类。
在第一步中,为了确保提取的锚点图具有良好的可区分性,首先引入矩阵分解来净化原始数据并提取每个视角的隐藏表示。同时,为了充分挖掘多视角数据,通过专门设计的双锚点图学习机制,提取隐藏表示之间的公共锚点图以及每个隐藏表示的特定锚点图。此外,隐藏表示学习和双锚点图学习被整合到一个优化过程中,使这两个部分能够相互促进学习。
随后,在第二步中,为了充分利用双锚点图,引入了一种新的基于多视角模糊聚类的方法,并通过协同学习提升聚类性能。此外,设计了一种成员结构保持机制,进一步增强聚类效果。
B. 多视角双锚点图学习
为了解决前面提到的如何设计更稳健的锚点图学习方法以及如何同时挖掘多视角数据中的公共和特定信息这两个问题,本节提出了一种双锚点图学习框架,并定义其优化目标函数如下:

其中:
-
第一项 J1(Bk,Hk)通过引入矩阵分解来净化原始多视角数据。
-
第二项 J2(Hk,Ac,Zc,Aks,Zks)负责提取双锚点图。
现有的多视角锚点图学习方法大致可分为两类:
-
直接学习公共锚点实例 并构建公共锚点图。
-
分别学习每个视角的锚点实例和锚点图,然后在后处理阶段将所有锚点图融合成一个公共表示。
然而,这两类方法都存在一个局限性:无法充分挖掘多视角数据的潜在信息。研究【17】、【18】表明,多视角数据通常同时包含跨视角共享的公共信息以及每个视角独有的特定信息,如图 3 所示。因此,本研究借鉴这一思想,在优化目标的第二项中创新性地同时提取公共锚点图和特定锚点图,以充分挖掘多视角数据。

创新性
总体而言,该方法在数据净化、隐藏锚点图学习和聚类划分三个方面对多视角聚类做出了贡献,具体如下:
首先,尽管近年来已有一些多视角锚点图学习方法被提出,但几乎所有现有方法都是直接从原始数据中提取锚点图,而原始数据通常包含噪声和错误。这可能会削弱学习到的锚点图的可区分性,进而影响后续聚类任务的性能。因此,开发能够结合表示学习以净化原始数据并提高锚点图质量的新型锚点图学习方法至关重要。在本研究中,我们引入矩阵分解并将其创新性地与锚点图学习融合,使这两个部分能够相互作用、共同优化。
其次,如图 1 所示,现有方法通常采用两种策略:
-
分别学习每个视角的独立锚点实例矩阵,然后构造公共锚点图用于聚类。
-
直接学习一个共享的锚点实例矩阵,用于所有视角的锚点图构建。
然而,这两种方法的共同缺陷是:它们仅关注视角间的公共信息,而忽略了每个视角的特定信息。然而,已有研究【18】表明,在聚类过程中,公共信息与特定信息同样重要。因此,开发一种能够同时提取公共和特定锚点图的多视角锚点图学习方法至关重要。为此,我们提出了一种新机制,同时挖掘公共锚点图和特定锚点图,使后续聚类任务能够充分利用双锚点图信息,从而提升聚类性能。实验结果进一步验证了该机制的有效性。
最后,现有的多视角锚点图学习方法通常使用SVD提取公共表示,并在此基础上采用单视角聚类方法(如 K-means)进行聚类。然而,本研究提出的方法同时提取公共和特定锚点图。尽管可以将这些锚点图组合后采用上述传统方法进行聚类,但这一策略可能会忽略二者之间的一致性和互补性信息。因此,设计高效的双锚点图聚类方法是关键。考虑到模糊聚类(fuzzy clustering)在处理数据不确定性方面表现优异,并且具有较强的聚类能力【26】, 本研究基于其提出了一种新的双锚点图模糊聚类方法。此外,为了进一步利用双锚点图并提升聚类效果,我们设计了一种模糊成员结构保持机制,用于优化锚点图的聚类表现。实验结果进一步证明了所提出方法的有效性。
综上所述,本研究在多视角聚类领域的多个方面做出了重要贡献。
实验


双锚点图在多视图中主要用于同时挖掘公共信息和特定信息,提升数据的可区分性,从而提高聚类的准确性和鲁棒性。
相关文章:
论文阅读:Dual Anchor Graph Fuzzy Clustering for Multiview Data
论文地址:Dual Anchor Graph Fuzzy Clustering for Multiview Data | IEEE Journals & Magazine | IEEE Xplore 代码地址:https://github.com/BBKing49/DAG_FC 摘要 多视角锚图聚类近年来成为一个重要的研究领域,催生了多个高效的方法。然而&#…...
Lambda 表达式是什么以及如何使用
目录 📌 Kotlin 的 Lambda 表达式详解 🎯 什么是 Lambda 表达式? 🔥 1. Lambda 表达式的基本语法 ✅ 示例 1:Lambda 基本写法 ✅ 示例 2:使用 it 关键字(单参数简化) ✅ 示例 3…...
乐橙R10 AI智能锁:以「技术减法」终结智能家居「参数内卷」
1 行业迷思:当「技术内卷」背离用户真实需求 “三摄猫眼”、“0.3秒人脸解锁”、“DeepSeek大模型”……智能锁行业的营销话术日益浮夸,但用户体验却陷入“功能冗余”与“操作复杂”的泥潭。 一位用户在社交平台直言:“我的智能锁有六个摄像…...
如何使用 FastAPI 构建 MCP 服务器
哎呀,各位算法界的小伙伴们!今天咱们要聊聊一个超酷的话题——MCP 协议!你可能已经听说了,Anthropic 推出了这个新玩意儿,目的是让 AI 代理和你的应用程序之间的对话变得更顺畅、更清晰。不过别担心,为你的…...
基于Python的Django框架的手机购物商城管理系统
标题:基于Python的Django框架的手机购物商城管理系统 内容:1.摘要 随着互联网的快速发展,手机购物逐渐成为人们日常生活中不可或缺的一部分。本研究的目的是开发一个基于Python的Django框架的手机购物商城管理系统,以提高购物商城的管理效率和用户体验。…...
【UE5.3.2】初学1:适合初学者的入门路线图和建议
3D人物的动作制作 大神分析:3D人物的动作制作通常可以分为以下几个步骤: 角色绑定(Rigging):将3D人物模型绑定到一个骨骼结构上,使得模型能够进行动画控制。 动画制作(Animation):通过控制骨骼结构,制作出人物的各种动作,例如走路、跳跃、打斗等。 动画编辑(Ani…...
当 EcuBus-Pro + UTA0401 遇上 NSUC1500
文章目录 1.前言2.EcuBus-Pro简介2.1 官方地址2.2 概览 3.纳芯微NSUC1500简介3.1 NSUC1500概述3.2 产品特性 4.测试环境5.基础功能5.1 数据发送5.2 数据监控 6.自动化功能6.1 脚本创建6.2 脚本编辑6.3 脚本编辑与测试 7.音乐律动7.1 导入例程7.2 效果展示 ECB工程 1.前言 最近…...
qml 中的anchors
理解 QML 中的 anchors(锚定) 在 QML 中,anchors 是一种强大的布局机制,用于相对于父元素或同级元素定位和调整组件大小。它比简单的 x/y 坐标定位更灵活,能够自动适应不同屏幕尺寸。 基本概念 在你的代码中&#x…...
【FreeRTOS】裸机开发与操作系统区别
🔎【博主简介】🔎 🏅CSDN博客专家 🏅2021年博客之星物联网与嵌入式开发TOP5 🏅2022年博客之星物联网与嵌入式开发TOP4 🏅2021年2022年C站百大博主 🏅华为云开发…...
Deepseek API+Python 测试用例一键生成与导出 V1.0.4 (接口文档生成接口测试用例保姆级教程)
接口文档生成接口测试用例保姆级教程 随着测试需求的复杂性增加,测试用例的设计和生成变得愈发重要。Deepseek API+Python 测试用例生成工具在 V1.0.4 中进行了全方位的优化和功能扩展,特别是对接口测试用例设计的支持和接口文档的智能解析处理。本文将详细介绍 V1.0.4 版本…...
CET-4增量表
CET-4词表-增量表 注: 【1】所谓增量,是相对于高中高考之增量 即,如果你是在读大学生,高中英语单词过关了,准备考CET-4,那么侧重下面的增量词表的学习,也算是一条捷径吧 ^_^ 【2】本结果数据 官…...
DeepSeek详解:探索下一代语言模型
文章目录 前言一、什么是DeepSeek二、DeepSeek核心技术2.1 Transformer架构2.1.1 自注意力机制 (Self-Attention Mechanism)(a) 核心思想(b) 计算过程(c) 代码实现 2.1.2 多头注意力 (Multi-Head Attention)(a) 核心思想(b) 工作原理(c) 数学描述(d) 代码实现 2.1.3 位置编码 (…...
深入解析主线程退出与子线程管理:何时 Join(),何时 Detach()?
在多线程编程中,主线程退出时如何正确管理子线程是一个关键问题。如果子线程没有 Join() 或 Detach(),不同的操作系统会有不同的行为,可能导致内存泄漏、资源竞争、甚至程序崩溃。本文将深入探讨主线程退出时子线程的管理策略,并提…...
AWS API Gateway Canary部署实战:Lambda到ECS的平滑迁移指南
在云原生架构中,如何实现服务平滑迁移是一个常见挑战。本文将详细介绍如何利用AWS API Gateway的Canary部署功能,实现从Lambda函数到ECS服务的无缝迁移,同时保证客户端无感知并提供便捷的回退机制。 一、迁移方案概述 在本方案中,我们将实现以下目标: 将现有Lambda服务平…...
Docker学习--容器操作相关命令--docker export 命令
docker export 命令的作用: 用于将 Docker 容器的文件系统导出为一个 tar 归档文件。主要用于备份或迁移容器的文件系统,而不包括 Docker 镜像的所有层和元数据。 语法: docker export [参数选项] CONTAINER(要操作的容器&#x…...
【Easylive】获取request对象的两种方式
【Easylive】项目常见问题解答(自用&持续更新中…) 汇总版 1. 通过方法参数直接注入(Spring MVC 推荐) 在 Controller 方法中直接声明 HttpServletRequest 参数,Spring 会自动注入当前请求的 request 对象&#…...
FOC 控制笔记【三】磁链观测器
一、磁链观测器基础 1.1 什么是磁链 磁链(magnetic linkage)是电磁学中的一个重要概念,指导电线圈或电流回路所链环的磁通量。单位为韦伯(Wb),又称磁通匝。 公式为: 线圈匝数 穿过单匝数的…...
SpringBoot项目读取自定义的配置文件
先说使用场景: 开发时在resource目录下新建一个 config 文件夹, 在里面存放 myconf.properties 文件, 打包后这个文件会放到与jar包同级的目录下, 如下图 关键点:自定义的文件名(当然后缀是.properties),自定义的存放路径。 主要的要求是在打包后运行过…...
UniApp快速表单组件
环境:vue3 uni-app 依赖库:uview-plus、dayjs 通过配置项快速构建 form 表单 使用 <script setup>import CustomCard from /components/custom-card.vue;import { ref } from vue;import CustomFormItem from /components/form/custom-form-it…...
在PyCharm 中免费集成Amazon CodeWhisperer
CodeWhisperer 是Amazon发布的一款免费的AI 编程辅助小工具,可在你的集成开发环境(IDE)中生成实时单行或全函数代码建议,帮助你快速构建软件。简单来说,Amazon CodeWhisperer就是你写一段注释(支持中文&…...
语音克隆(Voice Cloning)
要将文字转化为“自己声音”的音频,需要用到语音克隆(Voice Cloning)技术。这种技术通常要求用户提供一定量的语音样本(几分钟到几小时不等),然后通过 AI 模型生成与你声音相似的音频。目前市面上完全免费且…...
[7-02-02].第15节:生产经验 - 消费者相关操作
Kafka笔记大纲 五、生产经验——分区的分配以及再平衡: 4.1.生产经验——分区的分配以及再平衡 4.2.参数: 5.4.1 Range 以及再平衡...
Matlab_Simulink中导入CSV数据与仿真实现方法
前言 在Simulink仿真中,常需将外部数据(如CSV文件或MATLAB工作空间变量)作为输入信号驱动模型。本文介绍如何高效导入CSV数据至MATLAB工作空间,并通过From Workspace模块实现数据到Simulink的精确传输,适用于运动控制…...
vue3大屏适配
最近写大屏,发现适配真的好难统一,不是这有问题就是那有问题,要不然页面拉伸的就变形了,在网上找到了一个好用的插件,暂时用起来没问题,如果后续有问题或者大家有什么好的想法可以在评论区说一下。 插件 bi…...
文件操作与IO—File类
目录 1 属性 2 构造方法 3 常用方法 4 示例代码 1 属性 修饰符与类型 属性 含义 static String pathSeparator 依赖于系统的路径分隔符,String类型的表示 static char pathSeparator 依赖于系统的路径分隔符,char类型的表示 2 构造方法 构造…...
音频进阶学习二十四——IIR滤波器设计方法
文章目录 前言一、滤波器设计要求1.选频滤波器种类2.通带、阻带、过度带3.滤波器设计指标 二、IIR滤波器的设计过程1.设计方法2.常见的模拟滤波器设计1)巴特沃斯滤波器(Butterworth Filter)2)切比雪夫滤波器(Chebyshev…...
OpenBMC:BmcWeb 处理http请求2 查找路由对象
OpenBMC:BmcWeb 处理http请求1 生成Request和AsyncResp对象_bmc web-CSDN博客 当接收到http请求,并且完成解析后,调用了App::handle处理请求 而App::handle又调用了router.handle(req, asyncResp);来处理请求 1.Router::handle void handle(const std::shared_ptr<Requ…...
MVC编程
MVC基本概述 例子——显示本地文件系统结构 先分别拖入ListView,TableView,TreeView 然后在进行布局 在widget.cpp 结果 mock测试 1,先加入json测试对象 2.创建后端目录 3,在src添加新文件 在models文件夹里 在mybucket.h,添加测试用例的三个字段 4.在…...
怎么对asp.web api进行单元测试?
在 ASP.NET Web API 中进行单元测试是一种确保代码质量和功能正确性的重要实践。单元测试的重点是针对 API 控制器中的逻辑进行测试,而不依赖于外部依赖(如数据库、文件系统或网络请求)。以下是实现 ASP.NET Web API 单元测试的步骤和方法&am…...
Qt进阶开发:对象树与拥有权
文章目录 一、对象树的概念二、对象拥有权(Ownership)三、Qt Widgets 中的特殊情况四、对象树与拥有权的实例 一、对象树的概念 在 Qt 中,对象树(Object Tree)与对象的拥有权(Ownership)密切相…...

