当前位置：首页 > news >正文

ControlNet

news 2026/2/11 2:57:35

2023.8.10

Adding Conditional Control to Text-to-Image Diffusion Models

对于 T2I 扩散模型添加条件控制

相关联比较大的几篇论文：

0.Abstract

可以为预训练的扩散模型提供额外的输入条件控制。不需要很多计算资源。

即使在小数据集上，也具有鲁棒性。

The ControlNet learns task-specific conditions in an end-to-end way。什么是 end-to-end way ？

解释：ControlNet直接从输入数据中学到所必要的条件和特征，然后直接输出，中间不需要什么操作。

1.Introduction

现有的 prompt-based 的生成模型能否满足特定的条件（比较复杂的场景）？

通过调查发现三点：

①许多特定任务的数据集比较小，需要稳定的神经网络，以防止过拟合；

②需要很大的计算资源；

③许多的模型从输入到输出需要很多人工干预，所以引入 end-to-end学习方式，一端是输入数据、另一端是输出数据，让神经网络自己根据数据调节自己，而不需要人工干预。

提出ControlNet

从扩散模型克隆权重副本，包含两个部分：①locked copy，保留了从数十亿张图片所学得的能力；②trainable copy，用来学习特定场景下的条件。这两个部分通过 zero-conv 连接起来。

锁定副本：它的参数（权重）不会改变，用作参考；

可训练副本：它的参数会随着特定任务发生改变。

zero convolution

在卷积操作中，权重矩阵（卷积核）一开始初始化为0，随着学习不断调整，以达到最优参数。

实验

不同条件、不同大小数据集、在3090Ti上就可以跑。

引言小结

2 Related work

2.1 HyperNetwork and Neural Network Structure

2.2 DPM

2.3 Text-to-Image diffusion

2.4 Personalization, Customization，and Control of Pretrained DM

2.5 Image-to-Image Translation

3 Method

3.1 介绍了基本结构和每个部分的motivation
3.2 在Stable Diffusion中使用 ControlNet 的细节
3.3 学习目标、训练方法
3.4 一些训练技巧
3.5 不同条件下的应用

3.1 ControlNet

结构解析：

为什么要设置 locked copy 和 trainable copy？

避免因数据集过小-->过拟合。

之后用数学证明了只要特征I不为零，在第一次梯度下降迭代中，权重w将被优化为非零矩阵。零卷积就成为一种独特的连接层，以一种学习的方式从零逐步增长到优化参数。

3.2 ControlNet in Image Diffusion Model

在Stable Diffusion 的基础上对 Encoder部分进入条件控制。

因为条件的feature map得是 64 \times 64 的，所以需要一个小网络把条件图像（512 \times 512 \rightarrow 64\times 64）。这个小网络是由 4个conv layer。

3.3 Training

z_0,...,z_t ，当 t 足够大的时候，图像就会近似于纯噪声。

给定一系列条件：

time step t
text prompts c_t
task-specific conditions c_f

图像扩散算法就会学习一个网络 \epsilon_{\theta} 来预测添加到加噪图像z_t 中的噪声

ControlNet

2023.8.10 Adding Conditional Control to Text-to-Image Diffusion Models 对于 T2I 扩散模型添加条件控制相关联比较大的几篇论文： 0.Abstract 可以为预训练的扩散模型提供额外的输入条件控制。不需要很多计算资源。即使在小数据集上，也具有鲁棒…...

编程日记 2023/8/11 8:12:36

竞赛项目深度学习图像风格迁移 - opencv python

文章目录 0 前言1 VGG网络2 风格迁移3 内容损失4 风格损失5 主代码实现6 迁移模型实现7 效果展示8 最后 0 前言 🔥 优质竞赛项目系列，今天要分享的是 🚩 深度学习图像风格迁移 - opencv python 该项目较为新颖，适合作为竞赛课题…...

编程日记 2023/8/11 8:11:35

Windows dos文件夹与文件怎么创建与删除

在Windows操作系统中，你可以使用命令行工具（命令提示符或PowerShell）来创建和删除文件夹和文件。以下是创建和删除文件夹和文件的基本方法： 创建文件夹： 使用mkdir命令来创建文件夹（目录）。 m…...

编程日记 2023/8/11 8:10:32

JVM总结2

1.基本概念 java代码执行代码编译class：javac 源文件通过编译器产生字节码文件，字节码文件通过jvm的解释器编译成机器上的机器码装载class：ClassLoader执行class： 解释执行编译执行 client compilerserver compiler 内存管理…...

编程日记 2023/8/11 8:09:31

servlet三大类HttpSevlet，HttpServletRequest，HttpServletResponse介绍

一、HttpServlet HttpServlet类是一个被继承的方法，可以看做一个专门用来响应http请求的类，这个类的所有方法都是为响应http请求服务的，要对一个某个路径谁知http响应时，需要写一个类来继承HttpServlet类，并重写里面的…...

编程日记 2023/8/11 8:08:30

【雕爷学编程】Arduino动手做（12）---霍尔模块之霍尔磁感应声光报警器（磁控开关，接220V）

37款传感器与模块的提法，在网络上广泛流传，其实Arduino能够兼容的传感器模块肯定是不止37种的。鉴于本人手头积累了一些传感器和执行器模块，依照实践出真知（一定要动手做）的理念，以学习和交流为目的&#x…...

编程日记 2023/8/11 8:07:27

认识 SQL

文章目录 1.简介2.组成3.工作原理4.五种子语言5.注释方式6.字符串表示方式参考文献 1.简介 SQL（Structured Query Language，结构化查询语言）是一种用于管理和操作关系型数据库的标准化查询语言。它是一种领域特定语言（DSL&#x…...

编程日记 2023/8/11 8:06:26

【剑指Offer 58】翻转单词顺序，Java解密。

LeetCode 剑指Offer 75道练习题文章目录剑指Offer：翻转单词顺序示例：限制：解题思路：剑指Offer：翻转单词顺序【题目描述】输入一个英文句子，翻转句子中单词的顺序，但单词内字符的顺序不变。为简单起见，标点符号和普通字母一样处理。例如输入字符串"I am a stu…...

编程日记 2023/8/11 8:05:25

微服务Ribbon-负载均衡原理

目录一、LoadBalancerIntercepor 二、LoadBalancerClient 三、负载均衡策略IRule 四、总结上一篇中，我们添加了LoadBalanced注解，即可实现负载均衡功能，这是什么原理呢？ SpringCloud底层其实是利用了一个名为Ribbon的组件&…...

编程日记 2023/8/11 8:04:24

如何实现Vue的异步组件？如何在Vue中使用本地存储？什么是Vue的指令模块化？

1、如何实现Vue的异步组件？ 在Vue中，可以使用异步组件来加载远程数据，或者在组件的生命周期中执行一些耗时操作。实现异步组件，需要使用Vue的异步组件和Vue的组件系统。下面是一个基本的示例： <template><…...

编程日记 2023/8/11 8:03:23

《HeadFirst设计模式(第二版)》第六章代码——命令模式

代码文件目录： Command package Chapter6_CommandPattern.Command;/*** Author 竹心* Date 2023/8/6**/public interface Command {public void execute();public void undo();//撤销该指令 }CeilingFan package Chapter6_CommandPattern.ElectricAppliance;/*** …...

编程日记 2023/8/11 8:02:22

JS 原型与继承2

//***-、原型、原型链、构造函数 prototype、 proto_、constructor function Foo(){this.a1} var foo new Foo(); Object.getPrototypeOf(foo);//访问对象原型效果等同于，foo. proto ，只是更推荐使用 Es6的 Object.getPrototypeof()方式 // construct…...

编程日记 2023/8/11 8:01:21

账号登录相关的一点随笔

最后更新于2023年8月8日 14:25:32 JWT验证： 简单：一个token验证； 前端发来登录信息，后端验证通过后，将token发回前端； 复杂：Access Token Refresh Token验证： 将Access Token和R…...

编程日记 2023/8/11 8:00:20

常见的一些BUG

常见的一些BUG，但实际上在编写代码时，我们应该尽可能避免这些类型的错误： 变量名与函数名冲突： def main(): print("Hello, World!") main 5 print("The value of main is:", main) 函数参数传递错误&…...

编程日记 2023/8/11 7:59:19

ChatGPT在智能社交网络分析和关系挖掘中的应用如何？

智能社交网络分析和关系挖掘是当今信息时代中的重要研究领域，它们通过运用人工智能、机器学习和数据挖掘技术，从社交网络中提取有价值的信息，洞察用户之间的关系和行为模式。ChatGPT作为一种强大的自然语言处理模型，在智能社交网络…...

编程日记 2023/8/11 7:58:18

你不了解的Dictionary和ConcurrentDictionary

最近在做项目时，多线程中使用Dictionary的全局变量时，发现数据并没有存入到Dictionary中，但是程序也没有报错，经过自己的一番排查，发现Dictionary为非线程安全类型，因此我感觉数据没有写进去的原因是多线程…...

编程日记 2023/8/11 7:57:17

c++类模板，嵌套类模板，模板链表，动态数组

c类模板，嵌套类模板，模板链表，动态数组一.类模板 1.类模板的书写代码如下 template<typename T>//模板 class CTest {//类 public:T m_a;CTest(const T&a):m_a(a){}void fun1() {cout << typeid(m_a).name() << …...

编程日记 2023/8/11 7:56:16

【Flutter】【基础】CustomPaint 绘画功能，绘制各种图形（二）

CustomPaint 使用实例和代码： 1.canvas.drawColor 绘制背景颜色 class MyPainter1 extends CustomPainter {overridevoid paint(Canvas canvas, Size size) {//绘制背景颜色，整个UI 现在就是红色的canvas.drawColor(Colors.red, BlendMode.srcATop);}…...

编程日记 2023/8/11 7:55:15

YOLOv5修改注意力机制CBAM

直接上干货 CBAM注意力机制是由通道注意力机制（channel）和空间注意力机制（spatial）组成。传统基于卷积神经网络的注意力机制更多的是关注对通道域的分析，局限于考虑特征图通道之间的作用关系。CBAM从 channel 和 sp…...

编程日记 2023/8/11 7:54:14

计算机网络网络层概述

...

编程日记 2023/8/11 7:53:13

浅谈 React Hooks

React Hooks 是 React 16.8 引入的一组 API，用于在函数组件中使用 state 和其他 React 特性（例如生命周期方法、context 等）。Hooks 通过简洁的函数接口，解决了状态与 UI 的高度解耦，通过函数式编程范式实现更灵活 Rea…...

编程新知 2025/9/23 15:13:40

通过Wrangler CLI在worker中创建数据库和表

官方使用文档：Getting started Cloudflare D1 docs 创建数据库在命令行中执行完成之后，会在本地和远程创建数据库： npx wranglerlatest d1 create prod-d1-tutorial 在cf中就可以看到数据库： 现在，您的Cloudfla…...

编程新知 2026/1/31 6:18:08

iPhone密码忘记了办？iPhoneUnlocker，iPhone解锁工具Aiseesoft iPhone Unlocker 高级注册版分享

平时用 iPhone 的时候，难免会碰到解锁的麻烦事。比如密码忘了、人脸识别 / 指纹识别突然不灵，或者买了二手 iPhone 却被原来的 iCloud 账号锁住，这时候就需要靠谱的解锁工具来帮忙了。Aiseesoft iPhone Unlocker 就是专门解决这些问题的软件&…...

编程新知 2026/1/29 10:22:28

oracle与MySQL数据库之间数据同步的技术要点

Oracle与MySQL数据库之间的数据同步是一个涉及多个技术要点的复杂任务。由于Oracle和MySQL的架构差异，它们的数据同步要求既要保持数据的准确性和一致性，又要处理好性能问题。以下是一些主要的技术要点： 数据结构差异数据类型差异&#xff…...

编程新知 2026/1/11 0:40:53

c#开发AI模型对话

AI模型前面已经介绍了一般AI模型本地部署，直接调用现成的模型数据。这里主要讲述讲接口集成到我们自己的程序中使用方式。微软提供了ML.NET来开发和使用AI模型，但是目前国内可能使用不多，至少实践例子很少看见。开发训练模型就不介绍了&am…...

编程新知 2026/2/1 8:59:45

使用 SymPy 进行向量和矩阵的高级操作

在科学计算和工程领域，向量和矩阵操作是解决问题的核心技能之一。Python 的 SymPy 库提供了强大的符号计算功能，能够高效地处理向量和矩阵的各种操作。本文将深入探讨如何使用 SymPy 进行向量和矩阵的创建、合并以及维度拓展等操作，并通过具体…...

编程新知 2026/2/8 21:52:30

Fabric V2.5 通用溯源系统——增加图片上传与下载功能

fabric-trace项目在发布一年后，部署量已突破1000次，为支持更多场景，现新增支持图片信息上链，本文对图片上传、下载功能代码进行梳理，包含智能合约、后端、前端部分。一、智能合约修改为了增加图片信息上链溯源，需要对底层数据结构进行修改，在此对智能合约中的农产品数…...

编程新知 2025/9/27 12:03:43

Docker 本地安装 mysql 数据库

Docker: Accelerated Container Application Development 下载对应操作系统版本的 docker ；并安装。基础操作不再赘述。打开 macOS 终端，开始 docker 安装mysql之旅第一步 docker search mysql 》〉docker search mysql NAME DE…...

编程新知 2026/2/9 17:06:25

JavaScript基础-API 和 Web API

在学习JavaScript的过程中，理解API（应用程序接口）和Web API的概念及其应用是非常重要的。这些工具极大地扩展了JavaScript的功能，使得开发者能够创建出功能丰富、交互性强的Web应用程序。本文将深入探讨JavaScript中的API与Web AP…...

编程新知 2025/8/21 23:03:46

【JavaSE】多线程基础学习笔记

多线程基础 -线程相关概念程序（Program） 是为完成特定任务、用某种语言编写的一组指令的集合简单的说:就是我们写的代码进程进程是指运行中的程序，比如我们使用QQ，就启动了一个进程，操作系统就会为该进程分配内存…...

编程新知 2025/9/12 0:57:34

相关文章：