当前位置: 首页 > news >正文

论文阅读:Forget-Me-Not: Learning to Forget in Text-to-Image Diffusion Models

Forget-Me-Not: Learning to Forget in Text-to-Image Diffusion Models

论文链接
代码链接
这篇文章提出了Forget-Me-Not (FMN),用来消除文生图扩散模型中的特定内容。FMN的流程图如下:
framework
可以看到,FMN的损失函数是最小化要消除的概念对应的attention map的 L 2 L_2 L2范数。这里需要补充一些关于diffusion model的知识。
首先,以Stable Diffusion为代表的模型使用U-Net对图片的低维嵌入进行建模。文本条件在被CLIP的text encoder编码为文本嵌入后,通过U-Net中的cross-attention layers输入到U-Net中。cross-attention层的具体映射过程是一个QKV (Query-Key-
Value)结构,如上图的中间所示。其中,Q代表图片的视觉信息,K和V都是文本嵌入经过线性层后计算得到的( k i = W k c i a n d v i = W v c i k_i = W_kc_i~and~v_i = W_vc_i ki=Wkci and vi=Wvci)。而FMN损失函数中的attention map的计算过程如下:
attention map
然而,attention map还不是cross attention层的输出,其输出通过以下公式计算:
cross-attention output
上面两个公式,也就是图3中间方框中的内容,可以用下面的公式概括,
cross-attention
从FMN的源码中可以看到对应的部分如下:

class AttnController:def __init__(self) -> None:self.attn_probs = []self.logs = []def __call__(self, attn_prob, m_name) -> Any:bs, _ = self.concept_positions.shapehead_num = attn_prob.shape[0] // bstarget_attns = attn_prob.masked_select(self.concept_positions[:,None,:].repeat(head_num, 1, 1)).reshape(-1, self.concept_positions[0].sum())self.attn_probs.append(target_attns)self.logs.append(m_name)def set_concept_positions(self, concept_positions):self.concept_positions = concept_positionsdef loss(self):return torch.cat(self.attn_probs).norm()def zero_attn_probs(self):self.attn_probs = []self.logs = []self.concept_positions = None

相关文章:

论文阅读:Forget-Me-Not: Learning to Forget in Text-to-Image Diffusion Models

Forget-Me-Not: Learning to Forget in Text-to-Image Diffusion Models 论文链接 代码链接 这篇文章提出了Forget-Me-Not (FMN),用来消除文生图扩散模型中的特定内容。FMN的流程图如下: 可以看到,FMN的损失函数是最小化要消除的概念对应的…...

html5cssjs代码 036 CSS默认值

html5&css&js代码 036 CSS默认值 一、代码二、解释 CSS默认值(也称为浏览器默认样式)是指当HTML元素没有应用任何外部CSS样式时,浏览器自动为这些元素赋予的一组基本样式。这些样式是由浏览器的默认样式表(User Agent sty…...

小米路由器4A千兆版刷回官方固件

原文链接:小米路由器4A千兆版刷回官方固件及修改SN绑定APP-小米无线路由器及小米网络设备-恩山无线论坛 (right.com.cn) 进入breed 由于openwrt工作不稳定,决定重新刷回官方固件。 由于当前路由器已经刷过breed,不再重新刷入。 如何刷入b…...

【Leetcode每日一题】 递归 - 两两交换链表中的节点(难度⭐)(38)

1. 题目解析 题目链接:24. 两两交换链表中的节点 这个问题的理解其实相当简单,只需看一下示例,基本就能明白其含义了。 2.算法原理 一、理解递归函数的含义 首先,我们需要明确递归函数的任务:给定一个链表&#xf…...

如何部署GPT模型至自有服务器:从零开始搭建你的智能聊天机器人

引言 GPT模型是自然语言处理领域的重要突破,它能够通过生成式的文本生成方式,实现与用户的智能交互。本文将详细介绍如何将GPT模型部署到自有服务器上,并编写一个基本的API接口来实现与聊天机器人的交互。 目录 引言 一、准备工作 首先&am…...

uniapp 之 一些常用方法的封装(页面跳转,页面传参等)

util.js 提示:permission.js是uniapp插件市场由官方DCloud_heavensoft提供的App权限判断和提示插件。 import permision from "/js_sdk/wa-permission/permission.js"/*** uni.toast 封装* param {String} msg toast 提示内容* param {Number} duration …...

flutter 单列选择器

引入 flutter_pickers: ^2.1.9 import package:flutter_pickers/pickers.dart; import package:flutter_pickers/style/default_style.dart; import package:flutter_pickers/style/picker_style.dart;List<String> _numberList [99,98,97,96,95,94,93,92,91,90,89,88,…...

管理类联考–复试–英文面试–问题–WhatWhyHow--纯英文汇总版

文章目录 Do you have any hobbies? What are you interested in? What do you usually do in your spare time? Could you tell me something about your family&#xff1f; Could you briefly introduce your family? What is your hometown like? Please tell me so…...

亮数据代理IP轻松解决爬虫数据采集痛点

文章目录 一、爬虫数据采集痛点二、为什么使用代理IP可以解决&#xff1f;2.1 爬虫和代理IP的关系2.2 使用代理IP的好处 一、爬虫数据采集痛点 爬虫数据采集可能会面临一些挑战和痛点&#xff0c;其中包括&#xff1a; 爬虫代码维护难&#xff1a;网站的结构可能会经常变化&am…...

html5cssjs代码 035 课程表

html5&css&js代码 035 课程表 一、代码二、解释基本结构示例代码常用属性样式和装饰响应式表格辅助技术 一个具有亮蓝色背景的网页&#xff0c;其中包含一个样式化的表格用于展示一周课程安排。表格设计了交替行颜色、鼠标悬停效果以及亮色表头&#xff0c;并对单元格设…...

Eclipse For ABAP:安装依赖报错

1.安装好Eclipse后需要添加依赖,这里的地址: https://tools.hana.ondemand.com/latest 全部勾选等待安装结束; 重启后报错:ABAP communication layer is not configured properly. This might be caused by missing Microsoft Visual C++ 2013 (x64) Runtime DLLs. Consu…...

C++特性三:多态---纯析构和纯虚析构

多态使用时&#xff0c;如果子类中有属性开辟到堆区&#xff0c;那么父类指针在释放时无法调用到子类的析构代码 解决方式&#xff1a;将父类中的析构函数改为虚析构或者纯虚析构 虚析构和纯虚析构共性&#xff1a; 1.可以解决父类指针释放子类对象 2.都需要有具体的函数实现…...

创建可引导的 macOS 安装器

你可以将外置驱动器或备用宗卷用作安装 Mac 操作系统的启动磁盘。 以下高级步骤主要适用于系统管理员以及其他熟悉在“终端”中输入命令的经验丰富的用户。 升级 macOS 或重新安装 macOS 不需要可引导安装器&#xff0c;但如果你要在多台电脑上安装 macOS&#xff0c;而又不…...

ssm+vue的公廉租房维保系统(有报告)。Javaee项目,ssm vue前后端分离项目。

演示视频&#xff1a; ssmvue的公廉租房维保系统&#xff08;有报告&#xff09;。Javaee项目&#xff0c;ssm vue前后端分离项目。 项目介绍&#xff1a; 采用M&#xff08;model&#xff09;V&#xff08;view&#xff09;C&#xff08;controller&#xff09;三层体系结构&…...

【pycharm】作为Array查看出现数据无法显示问题(已解决)

【pycharm】作为Array查看出现数据无法显示问题&#xff08;已解决&#xff09; 当我们在调试代码的时候&#xff0c;需要对某个变量进行查看&#xff0c;就如同在matlab中&#xff0c;我们可以直接在工作区对某个变量进行双击查看矩阵变量的具体数值 在这里我遇到一个问题&am…...

matlab处理贝塞尔函数

说明:问题来自CSDN-问答板块,题主提问。 需求:在使用解析法求解电机的三维模型,编写程序时需要用到修正的贝塞尔函数,问题是在贝塞尔函数的自变量和阶数变化时函数值变化很大,导致最后求出来的气隙磁密非常大。 一、运行截图 二、解决代码...

【Python】Pycharm 的 python_stubs

Pycharm 的 python_stubs 问题 问题 Pycharm 为了对各种库暴露接口能在编码时提供快速的智能提示&#xff0c;会解析库并在 pycharm 安装目录的 python_stubs 下生成对应的存根&#xff0c;这个操作可以有效的提升 Pycharm 智能提示的效率。但是也有一个问题&#xff0c;称之为…...

AI大模型智能大气科学探索之:ChatGPT在大气科学领域建模、数据分析、可视化与资源评估中的高效应用及论文写作

本文深度探讨人工智能在大气科学中的应用&#xff0c;特别是如何结合最新AI模型与Python技术处理和分析气候数据。介绍包括GPT-4等先进AI工具&#xff0c;旨在帮助大家掌握这些工具的功能及应用范围。本文内容覆盖使用GPT处理数据、生成论文摘要、文献综述、技术方法分析等案例…...

rpc详解rpc框架

文章目录 概述rpc的优点组件工作流程&RPC的底层原理RPC的底层原理 RPC框架rpc框架优点RPC 的实现基础RPC的应用场景RPC使用了哪些关键技术rpc 调用异常一般怎么处理rpc和http的区别为什么RPC要比HTTP更快一些Dubbo和openfeign 区别远程调用RPC框架传输协议传输速度 概述 在…...

【评分标准】【网络系统管理】2019年全国职业技能大赛高职组计算机网络应用赛项H卷 无线网络勘测设计

第一部分&#xff1a;无线网络勘测设计评分标准 序号评分项评分细项评分点说明评分方式分值1点位设计图AP编号AP编号符合“AP型号位置编号”完全匹配5AP型号独立办公室、小型会议室选用WALL AP110完全匹配5员工寝室选用智分&#xff0c;其他用放装完全匹配5其它区域选用放装AP…...

2026年汽车零部件LIMS厂商格局:金现代以技术+实践强势领跑

2026 年&#xff0c;中国汽车产业步入电动化、智能化、全球化深度融合阶段&#xff0c;汽车零部件实验室的数字化管控能力&#xff0c;直接决定供应链质量、交付效率与主机厂适配能力。作为实验室管理的核心基建&#xff0c;LIMS 赛道竞争格局清晰固化&#xff0c;金现代凭借原…...

Wan2.2-I2V-A14B文生视频实战:教育课件动态演示视频批量生成案例

Wan2.2-I2V-A14B文生视频实战&#xff1a;教育课件动态演示视频批量生成案例 1. 教育视频制作的痛点与解决方案 传统教育课件视频制作面临三大难题&#xff1a;一是专业制作成本高&#xff0c;需要聘请视频团队&#xff1b;二是内容更新迭代慢&#xff0c;无法快速响应教学需…...

小龙虾 openclaw + 财务管理系统,自动化的财务管家来了~

一张表格管理自己的财务情况&#xff0c;对于每个超级个体来讲&#xff0c;都建议把上次分享的《人生 CEO 财务管理系统》带回家。在没有正式上线应用市场之前&#xff0c;已经 200 多人使用过了。特别适合想做一人公司或者超级个体的人。你不理财&#xff0c;财不理你。并且站…...

别再死记硬背C#语法了!用5个机器视觉小例子带你快速上手(Visual Studio 2022版)

用5个机器视觉小项目玩转C#语法&#xff08;Visual Studio 2022实战&#xff09; 刚接触C#的开发者常陷入语法记忆的泥潭&#xff0c;而机器视觉领域恰好需要快速验证想法的能力。本文将带你用Visual Studio 2022创建五个渐进式图像处理项目&#xff0c;在解决实际问题的过程中…...

零基础转行大模型选哪个岗位方向最易上手?常见问题全解析

零基础转行大模型选哪个岗位方向最易上手&#xff1f;常见问题全解析 标签&#xff1a;#人工智能、#深度学习、#自然语言处理、#神经网络、#机器学习、#计算机视觉、#ai ### 先打破一个误区&#xff1a;大模型≠只有算法岗&#xff0c;普通人也能进### 大模型岗位&#xff1a;哪…...

从Focal Loss到ASL:深入聊聊多标签分类损失函数的‘进化史’与调参心得

从Focal Loss到ASL&#xff1a;多标签分类损失函数的演进与实战调优指南 在医学影像分析中&#xff0c;我们常常遇到这样的场景&#xff1a;一张X光片可能同时存在多种病灶特征&#xff0c;但阳性样本&#xff08;如肿瘤标记&#xff09;的出现频率往往不足1%。传统二元交叉熵&…...

计算机视觉基础模型深度解析:13类算法、85个变种完全指南

计算机视觉基础模型深度解析&#xff1a;13类算法、85个变种完全指南做计算机视觉的兄弟应该知道&#xff0c;标注数据是真tm贵。为了不花这个钱&#xff0c;各路神仙开始用无标注数据、网上爬的图文数据、甚至多模态数据来训练模型。用对比学习、掩码重建这些方法整一个基础模…...

VM硬件版本20与17核心区别(ESXi 8.0适配+实操指南)

在ESXi虚拟化部署中&#xff0c;VM(虚拟机)硬件版本直接决定虚拟机可支持的功能、兼容性及与ESXi主机的适配性&#xff0c;是虚拟机部署与升级的关键考量因素。很多部署者在选择VM硬件版本时&#xff0c;会纠结于版本20(HW20)和版本17(HW17)的差异&#xff0c;核心结论先明确&a…...

基于RISC-V指令集的五级流水线CPU设计、验证及上板实践:含详细说明、代码注释、Veril...

基于riscv指令集的五级流水线CPU设计及其验证 可以上板&#xff0c;且有详细说明和代码注释 基于vivado平台进行验证 包括verilog源代码、汇编验证代码、详细的说明文档&#xff08;47页&#xff09;以及PPT Modelsim quartus vivado都跑过&#xff0c;确认代码没有问题 已一、…...

告别GUI:在Matlab命令行里优雅地处理GRACE RL06数据(附代码详解)

命令行驱动的GRACE RL06数据处理&#xff1a;Matlab高效工作流构建指南 在卫星重力测量领域&#xff0c;GRACE&#xff08;Gravity Recovery and Climate Experiment&#xff09;数据已成为研究地球质量变化不可或缺的资源。随着RL06数据版本的发布&#xff0c;其精度和可靠性进…...