顶会新热门:机器学习可解释性
🧀机器学习模型的可解释性一直是研究的热点和挑战之一,同样也是近两年各大顶会的投稿热门。
🧀这是因为模型的决策过程不仅需要高准确性,还需要能被我们理解,不然我们很难将它迁移到其它的问题中,也很难进行算法的debug。
🧀更重要的是,提高机器学习可解释性可以帮助我们提高模型的透明度和用户信任度,还能引导模型的开发和优化过程,有效识别和防止潜在的偏差问题,这对金融、医疗等领域至关重要。
🧀目前这方向有四种主流方法:局部解释性方法、全局解释性方法、基于规则的解释性方法和机制性解释性方法。为了方便大家找idea,我根据这四种方法整理好了15篇最新的论文,开源代码已附,想发论文的朋友别错过。
有需要的小伙伴可以关注人人人人公众号(AI科技探寻)免费领取
我还整理出了相关的论文+开源代码,以下是精选部分论文
论文1
标题:
Further Insights: Balancing Privacy, Explainability, and Utility in Machine Learning-based Tabular Data Analysis
进一步见解:平衡基于机器学习的表格数据分析中的隐私性、可解释性和效用性
方法:
-
隐私保护机制:采用(𝜖,𝛿)-差分隐私与生成对抗网络(GAN)相结合的方法,通过向数据中添加噪声来保护隐私。
-
效用评估:通过比较模型在原始数据集和匿名化数据集上的准确率来量化数据效用损失。
-
可解释性评估:使用多种模型解释方法,如模型性能评估、变量重要性分析、部分依赖曲线(PD)和累积局部依赖(AL)曲线,来评估模型的可解释性。
-
优化方法:定义了一个综合的权衡标准,通过线性优化方法和兼容性矩阵,系统地探索不同的隐私参数配置,以找到最优的隐私增益和可解释性相似度,同时最小化效用损失。
创新点:
-
隐私与效用的平衡:通过优化方法,成功地在保护隐私的同时,最小化了数据效用的损失。例如,在使用Logistic回归分类器时,当隐私参数𝜎=1时,隐私增益达到最大,同时效用损失保持在较低水平。
-
可解释性的提升:通过引入多种解释方法,显著提高了模型的可解释性。例如,对于Gaussian NB分类器,使用变量重要性解释方法时,可解释性相似度在𝜎=0.8时达到0.58,表明模型在隐私保护下仍能提供高质量的解释。
-
综合权衡标准:提出了一个综合的权衡标准,能够同时考虑隐私、效用和可解释性,为实际应用中平衡这些因素提供了有效的工具。通过兼容性矩阵,能够为不同的分类器和数据集找到最优的配置,确保在隐私保护和模型解释性之间达到最佳平衡。
论文2
标题:
Investigating Adversarial Attacks in Software Analytics via Machine Learning Explainability
通过机器学习可解释性研究软件分析中的对抗性攻击
方法:
-
对抗性攻击方法:提出了一种基于机器学习可解释性的对抗性攻击方法,通过修改模型解释技术识别的前𝑘个重要特征来生成对抗性样本。
-
特征重要性评估:使用SHAP、LIME和PyExplainer等可解释性技术来识别对模型决策影响最大的特征。
-
攻击效果评估:通过攻击成功率(ASR)指标来评估对抗性攻击的效果,同时考虑了攻击的不可感知性(ℓ0扰动)。
-
多目标优化:采用多目标优化方法,同时最大化ASR和最小化需要修改的特征数量,以实现攻击效果和不可感知性之间的平衡。
创新点:
-
攻击成功率的显著提升:通过修改仅前3个重要特征,攻击成功率(ASR)最高可达86.6%,显著高于现有方法。例如,在使用SHAP解释方法时,对Postgres数据集的攻击成功率达到了80.3%。
-
不可感知性的优化:在保持高攻击成功率的同时,通过最小化ℓ0扰动,确保了攻击的不可感知性。与现有方法相比,该方法在不可感知性方面表现更优,例如在对CLCDSA数据集的攻击中,仅需修改1个特征即可达到61.4%的ASR。
-
对多种模型和数据集的普适性:该方法不仅适用于单一模型或数据集,而且在多种机器学习模型和软件分析任务数据集上均表现出色,具有广泛的适用性。
论文3
标题:
Regulating Explainability in Machine Learning Applications – Observations from a Policy Design Experiment
监管机器学习应用中的可解释性——政策设计实验的观察
方法:
-
跨学科合作:通过跨学科团队(包括AI和政策背景的研究人员)的持续合作,进行为期十周的实验研究,共同设计可解释性政策。
-
迭代政策设计:采用迭代方法,每周进行政策草案的制定、尝试遵守和评估,逐步改进政策内容。
-
证据评估:讨论和评估不同类型的证据(如技术解释、用户研究等)在证明政策合规性中的作用。
-
案例研究:基于医疗和金融领域的实际案例,评估政策在不同场景下的适用性和有效性
创新点:
-
政策设计的可行性验证:通过实验验证了跨学科团队在短时间内设计出可行的可解释性政策的可能性,为政策制定提供了新的思路和方法。
-
政策内容的改进:通过迭代过程,显著改进了政策内容,使其更加具体、可操作和可执行。例如,在第七周的政策草案中,详细规定了对最终用户和受影响用户的解释要求。
-
证据评估的重要性:强调了在政策设计过程中讨论证据的重要性,特别是用户研究在评估解释有效性中的关键作用。这一发现为政策制定提供了新的视角,确保政策不仅在技术上可行,而且在实际应用中有效。
论文4
标题:
The efficacy of machine learning models in lung cancer risk prediction with explainability
机器学习模型在肺癌风险预测中的效能与可解释性
方法:
-
数据集分析:使用包含22个肺癌相关特征的公开数据集,分析特征之间的关系和分布。
-
模型选择与训练:选择并训练了四种机器学习模型(SVM、KNN、DT、RF),通过网格搜索算法进行超参数调优,以提高模型性能。
-
模型解释方法:使用决策边界、LIME和决策树提取等方法对模型的预测结果进行解释,提高模型的可解释性。
-
性能评估:通过交叉验证和测试集评估模型的准确率、精确率、召回率和F1分数,同时分析学习曲线以评估模型的训练效果。
创新点:
-
模型性能的显著提升:通过超参数调优,四种模型的准确率均达到了99%以上,其中SVM和KNN的准确率从95%和92%分别提升到100%和99%,显著提高了模型的预测性能。
-
可解释性的增强:通过多种解释方法,为非技术用户提供了模型决策的逻辑解释,增强了用户对模型的信任。例如,使用LIME方法解释KNN模型时,能够清晰地展示影响预测结果的关键特征及其值范围。
-
实际应用的可行性:研究结果表明,这些机器学习模型不仅在性能上表现出色,而且在实际应用中具有高度的可行性和可解释性,为肺癌风险预测提供了有力的工具。
相关文章:

顶会新热门:机器学习可解释性
🧀机器学习模型的可解释性一直是研究的热点和挑战之一,同样也是近两年各大顶会的投稿热门。 🧀这是因为模型的决策过程不仅需要高准确性,还需要能被我们理解,不然我们很难将它迁移到其它的问题中,也很难进…...
ReactJS 中的 JSX工作原理
文章目录 前言✅ 1. JSX 是什么?🔧 2. 编译后的样子(核心机制)🧱 3. React.createElement 做了什么?🧠 4. JSX 与组件的关系🔄 5. JSX 到真实 DOM 的过程📘 6. JSX 与 Fr…...

《STL--stack 和 queue 的使用及其底层实现》
引言: 上次我们学习了容器list的使用及其底层实现,相对来说是比较复杂的,今天我们要学习的适配器stack和queue与list相比就简单很多了,下面我们就开始今天的学习: 一:stack(后进先出ÿ…...
ArcGIS Pro 3.4 二次开发 - 地理处理
环境:ArcGIS Pro SDK 3.4 + .NET 8 文章目录 地理处理1 通用1.1 如何执行模型工具1.2 设置地理处理范围环境1.3 在 Geoprocessing 窗格中打开脚本工具对话框1.4 打开特定工具的地理处理工具窗格1.5 获取地理处理项目项1.6 阻止通过GP创建的特征类自动添加到地图中1.7 GPExecut…...

基于springboot的医护人员排班系统设计与实现(源码+文档+部署讲解)
技术范围:SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码编写、论文编写和辅导、论文…...
Asp.Net Core FluentValidation校验框架
文章目录 前言一、使用步骤1.安装 NuGet 包2.创建模型3.创建验证器4.配置 Program.cs5.创建控制器6.测试结果 二、常见问题及注意事项三、性能优化建议总结 前言 FluentValidation 是一个流行的 .NET 库,用于构建强类型的验证规则。它通常用于验证领域模型、DTO等对…...

CRISPR-Cas系统的小型化研究进展-文献精读137
Progress in the miniaturization of CRISPR-Cas systems CRISPR-Cas系统的小型化研究进展 摘要 CRISPR-Cas基因编辑技术由于其简便性和高效性,已被广泛应用于生物学、医学、农学等领域的基础与应用研究。目前广泛使用的Cas核酸酶均具有较大的分子量(通…...

利用python工具you-get下载网页的视频文件
有时候我们可能在一个网站看到一个视频(比如B站),想下载,但是页面没有下载视频的按钮。这时候,我们可以借助python工具you-get来实现下载功能。下面简要说下步骤 (一)因为使用的是python工具&a…...
Wi-Fi 切换 5G 的时机
每天都希望 Wi-Fi 在我离开信号覆盖范围时能尽快切到 5G,但每次它都能坚挺到最后半格信号,我却连看个天气预报都看不了…我不得不手工关闭 Wi-Fi,然后等走远了之后再打开,如此反复,不厌其烦。 早上出门上班,…...
【请关注】各类数据库优化,抓大重点整改,快速优化空间mysql,Oracle,Neo4j等
各类数据库优化,抓大重点整改,快速优化,首先分析各数据库查询全部表的空间大小及记录条数的语句: MySQL -- 查看所有表的空间大小 SELECT TABLE_SCHEMA AS 数据库名, TABLE_NAME AS 表名, ENGINE AS 存储引擎, CONCAT(ROUND(DAT…...
Mybatis Plus JSqlParser解析sql语句及JSqlParser安装步骤
MyBatis Plus 整合 JSqlParser 进行 SQL 解析的实现方案,主要包括环境配置和具体应用。通过 Maven 添加mybatis-plus-core 和 jsqlparser 依赖后,可用 CCJSqlParserUtil 解析 SQL 语句,支持对 SELECT、UPDATE 等语句的语法树分析和重构。技术…...
React从基础入门到高级实战:React 高级主题 - 性能优化:深入探索与实践指南
React 性能优化:深入探索与实践指南 引言 在现代Web开发中,尤其是2025年的技术环境下,React应用的性能优化已成为开发者不可忽视的核心课题。随着用户对应用速度和体验的要求日益提高,React应用的规模和复杂性不断增加ÿ…...
负载均衡群集---Haproxy
目录 一、HAproxy 一、概念 二、核心作用 三、主要功能特性 四、应用场景 五、优势与特点 二、 案例分析 1. 案例概述 2. 案例前置知识点 (1)HTTP 请求 (2)负载均衡常用调度算法 (3)常见的 web …...
2025年5月个人工作生活总结
本文为 2025年5月工作生活总结。 研发编码 一个项目的临时记录 月初和另一项目同事向业主汇报方案,两个项目都不满意,后来领导做了调整,将项目合并,拆分了好几大块。原来我做的一些工作,如数据库、中间件等ÿ…...

【stm32开发板】单片机最小系统原理图设计
一、批量添加网络标签 可以选择浮动工具中的N,单独为引脚添加网络标签。 当芯片引脚非常多的时候,选中芯片,右键选择扇出网络标签/非连接标识 按住ctrl键即可选中多个引脚 点击将引脚名称填入网络名 就完成了引脚标签的批量添加 二、电源引…...

实验设计与分析(第6版,Montgomery)第5章析因设计引导5.7节思考题5.2 R语言解题
本文是实验设计与分析(第6版,Montgomery著,傅珏生译) 第5章析因设计引导5.7节思考题5.2 R语言解题。主要涉及方差分析,正态假设检验,残差分析,交互作用。 dataframe<-data.frame( Surfacec(74,64,60,92…...

2025山东CCPC题解
文章目录 L - StellaD - Distributed SystemI - Square PuzzleE - Greatest Common DivisorG - Assembly Line L - Stella 题目来源:L - Stella 解题思路 签到题,因为给出的字母不是按顺序,可以存起来赋其值,然后在比较。 代码…...
【解决办法】ubuntu重启不起来,输入用户名和密码进不去,又重新返回登录页。
项目场景: ubuntu重启不起来,输入用户名和密码进不去,又重新返回登录页。 问题描述 在华硕天选一代笔记本上面安装了ubuntu22.04.5桌面版,但是重启以后出现,输入了用户名和密码,等待一会还让输入用户名和…...

CentOS Stream 9 中部署 MySQL 8.0 MGR(MySQL Group Replication)一主两从高可用集群
🐇明明跟你说过:个人主页 🏅个人专栏:《MySQL技术精粹》🏅 🔖行路有良友,便是天堂🔖 目录 一、前言 1、MySQL 8.0 中的高可用方案 2、适用场景 二、环境准备 1、系统环境说明…...

pycharm 新UI 固定菜单栏 pycharm2025 中文版
pycharm 新UI 文件 -> 设置 -> 外观与行为 -> 外观 -> UI选项 -> 主菜单:显示在主工具栏上方. 即可固定...
跟单业务和量化交易业务所涉及到的设计模式
🔁 跟单业务中常用的设计模式: 1. 观察者模式(Observer) 场景:一个大V下单,系统需要自动通知所有跟随者进行同步下单。好处:解耦下单者与跟随者,支持灵活扩展、异步通知。面试亮点…...

我的世界Java版1.21.4的Fabric模组开发教程(十一)创建方块
这是适用于Minecraft Java版1.21.4的Fabric模组开发系列教程专栏第十一章——创建方块。想要阅读其他内容,请查看或订阅上面的专栏。 方块(Block) 是构成Minecraft世界的主要组成部分,是组成游戏地图的最基本单元,也是模组开发的核心元素之一…...

VR/AR 视网膜级显示破局:10000PPI 如何终结颗粒感时代?
一、传统液晶 “纱窗效应”:VR 沉浸体验的最大绊脚石 当用户首次戴上 VR 头显时,眼前密密麻麻的像素网格往往打破沉浸感 —— 这正是传统液晶显示在近眼场景下的致命缺陷。受限于 500-600PPI 的像素密度,即使达到 4K 分辨率,等效到…...
C++ 命令模式:设计与实现详解
一、引言 在软件开发中,我们经常需要将“请求”或“操作”封装成对象,以便在不同的上下文环境中传递、存储、延迟执行或撤销。命令模式(Command Pattern)正是为解决这类问题而生的行为设计模式。本文将深入探讨 C++ 中命令模式的设计理念、实现方式及其应用场景。 二、命…...

系统思考:化繁为简的艺术
系统思考,其实是一门化繁为简的艺术。当我们能够把复杂的问题拆解成清晰的核心以及更加简单,从而提升团队的思考品质和行动品质,发挥最大的合力。 每个公司都想在某方面成为最优秀的,但是实际上具有穿透性的洞察力和摆脱虚荣心的清…...
java/mysql/ES下的日期类型分析
mysql的timestamp和datetime mysql的TIMESTAMP类型内部存的是unix时间戳,可认为是一个32位的整型,它记录了1970.1.1以来的秒数。因为存储长度4字节的限制,所以有2038年限制。 DATETIME类型内部存的是long型,记录了1000.1.1以来的…...

Angularjs-Hello
1 关于Angularjs 最近因为项目需要又要做这个,所以简单复习下。其实这个大概7,8年前就用过,当时做了几个简单页面觉得太简单就还是回去做嵌入式了。按照互联网技术的进化速度,本来以为早死在 沙滩上了,没想到现在还在坚…...
Python训练营---Day41
DAY 41 简单CNN 知识回顾 数据增强卷积神经网络定义的写法batch归一化:调整一个批次的分布,常用与图像数据特征图:只有卷积操作输出的才叫特征图调度器:直接修改基础学习率 卷积操作常见流程如下: 1. 输入 → 卷积层 …...

Linux 1.0.4
父子shell linux研究的就是shell 打开两个窗口就是两个shell 终端的软件有很多 bash也是一个软件 我们在terminal里面再打开一个bash,然后再次使用ps命令发现多出来一个bash,之后点击exit只是显示了一个exit,这个只是退出了在terminal中打开…...

Qt -下载Qt6与OpenCV
博客主页:【夜泉_ly】 本文专栏:【暂无】 欢迎点赞👍收藏⭐关注❤️ 前言 呃啊,本来就想在 Qt 里简单几个 OpenVC 的函数,没想到一搞就是一天。 我之前的开发环境是 Qt 5.14.2,使用 MinGW 7.3.0 64-bit 编…...