利用ControlNet重新定义你的AI姿势
利用ControlNet重新定义你的AI姿势
前段时间给大家分享了如何利用colab实现AI绘画自由,现在Stable Diffusion WebUI Colab TW又更新了不少新功能。最重要的是可以通过谷歌硬盘的快捷方式导入模型,极大的节省了谷歌硬盘容量。
众所周知,谷歌硬盘免费的只有15G,而每个大模型基本都在2,3G。所以每次要么手动删除一些模型,要么不挂载谷歌硬盘。前者麻烦,后者下载图片更麻烦。。。
现在这些问题都解决了,作者介绍了一种使用谷歌硬盘捷径节省空间的小技巧。只需要在以下模型站点里的模型以快捷方式保存到自己硬盘的对应位置即可。这里以模型站点一为例:选中模型-右键将快捷方式添加到云端硬盘-按步骤选中自己硬盘的文件夹-添加快捷方式。具体如下图:

这个时候,你硬盘的模型文件应该是这样的,其他对应文件夹也类似。

⚠️:如果站点里没有且是自己想要的模型,就别删除了哈~
💡:将大模型删除后记得在回收站也清除,这样就能腾出大量的空间了~
🧩:当然缺点也有,目前作者提供的站点包含的模型不多,且都是大模型,理论上lora模型也是可以的。所以如果大家有新的站点资源也可以分享哈~一起做大做强。
需要注意的是,ControlNet和T2IAdapter都放在
ControlNet文件夹下,如果没有则需要新建改文件夹。模型站点一(Anything, Counterfeit, VAEs)
模型站点二(AbyssOrangeMix, PastelMix)
模型站点三(ChilloutMix)
模型站点四(CamelliaMix2.5D, ControlNet, T2IAdapter)
现在我们在重新回到colab上,在2.1下载SD模型中的model_package选其他,不用填url了。然后将3.1 下载Extensions里的所有插件全部勾选。完成这两步后(其余全部默认),点击全部运行即可。
首次安装完插件后,就不用再勾选这些了,直接用默认的就行。下次只用将
2.1下载SD模型中的model_package选其他就可以直接运行了,启动效率直线上升

现在打开webUI你就发现那些快捷方式的模型都可以选择了~

而且也多了不少插件,具体的插件介绍可以看原作的Extensions整理。介绍的已经很详细了,我就不赘述了。
ControlNet应用
回到正题,上次应该算是AI绘画入门吧,之后我也学了一些新知识,顺带分享一下,虽然不及各大佬千分之一,但胜在直白(因为高深的我也不懂,毕竟也新手。哈哈~)
使用起来也很简单,在原先的基础上,点开文生图下面的ControlNet,设置参数后启用即可。
ControlNet参数解释

在刚开始的时候,并不需要全部尝试,大部分的参数选择默认即可。个人建议:点击添加图片->勾选启用和猜测模式->选择预处理器和模型->点击预览结果->文生图即可
有时候点击预览结果没有展示,等等即可,个人使用感觉这个webUI有点反应迟钝,还很容易错误导致需要重启。
简单示例
-
单人
在网上随机下载个姿势复杂的单人照片(最好不要有复杂背景)。然后按照上述步骤操作,选择canny相关预处理器和模型。预览结果如下,发现边缘检测的还是很不错的。

然后设置文生图基本参数和提示词,点击Generate即可,产出的结果还是很不错的。
虽然猜测模式不需要提示词,但是容易出现质量不好的图,所以可以适当加一些提高质量的提示词即可。下面可参考的参数设置,发现大部分默认的效果也很不错。


-
多人
canny在单人模式表现的非常优异,不知道多人姿势怎么样。同样的,在网上随机下载一个多人姿势的图片。然后和上面步骤一样,预览发现边缘检测的效果也很好。

但是点开后就会发现人物脸部并不精致。而且由于脸部较小,在不做特别参数处理时,出的人物图容易崩坏。这个时候就需要进行HiRes.fix,尤其是真人模型。以下是一个参数的参考~
⚠️:3次元的放大算法建议R-ESRGAN 4x+;2次元和2.5次元建议R-ESRGAN 4x+ Anime6B

下面是3次元至2次元的结果(模型分别为chilloutmix_NiPrunedFp32Fix、camelliamix25D_v10、Counterfeit-V2.5_pruned):



有没有发现3次元的人脸基本一致,这是因为我在提示词加上了lora,如果不加的话,人物比较真实但不精致。因此如果想在多人的模式下加上lora的话,就需要用到别的方式了,例如Latent Couple+OpenPose。
总结
本文介绍了如何利用快捷方式节省谷歌硬盘,并开始通过ControlNet控制人物的姿势。这里只介绍了其中的一种算法canny–快速模仿别人的姿势。其他的算法大伙可以自行尝试,或者参考ControlNet使用教程,里面详尽了各个算法的差异与主要用途。例如适合建筑的mlsd,适合CG建模的normal_map,提取骨骼姿势的openpose等。
ControlNet除了自身插件外,还可以和别的插件合用,例如Latent Couple(+Composable Lora)、poseX、OpenPose Editor、Depth Library。极大的丰富了ControlNet的可玩性。这个有时间单独再说一期~
值得一提的是,有时候当你发现怎么调参数图都崩坏了,可以换一些随机种子,大量出图找一些比较好的图后再修改其他参数试试。
最后,只要你的手机或者pad能kx上网,可以将这个colab保存到收藏夹。在手机和pad上就可以AI绘画了,能限制你的,只有colab的免费时间了~
相关文章:
利用ControlNet重新定义你的AI姿势
利用ControlNet重新定义你的AI姿势 前段时间给大家分享了如何利用colab实现AI绘画自由,现在Stable Diffusion WebUI Colab TW又更新了不少新功能。最重要的是可以通过谷歌硬盘的快捷方式导入模型,极大的节省了谷歌硬盘容量。 众所周知,谷歌…...
中医药NER命名实体识别基于SPANNER方式
一个不知名大学生,江湖人称菜狗 original author: Jacky Li Email : 3435673055qq.com Time of completion:2023.3.5 Last edited: 2023.3.5 导读 本文使用SPANNER方式实现对中医药进行实体识别,采用focal loss 进行优化。 本文章作用防止安静…...
Vue必掌握
目录 一、组件通信方式 二、v-if和v-for 三、生命周期 1、描述 2、setup和created谁先执行 3、setup中为什么没有beforeCreate和created 四、双向绑定 v-model 1、定义 2、本质,原理 3、好处 五、如何扩展一个组件 1、mixins 缺点 2、slot插槽 3、e…...
SSM部分
声明式事务 从之前的事务控制的代码中可以看出,是有规律可循,代码的结构基本是确定的,所以框架就可以将固定模式的代码抽取出来,进行相关的封装。 封装起来后,我们只需要在配置文件中进行简单的配置即可完成操作。 …...
【Springboot系列】Springboot接管所有Controller,magic-api源码阅读
系列文章地址:Spring Boot学习大纲,可以留言自己想了解的技术点 最近在项目中使用了一个第三方的包 magic-api,节省了很多的时间,整体来说就是只用写sql就好了,不用写service,controller那些,全部统一处理了。 具体的使用大家可以搜索下,网上到处都是,建议去官网看。…...
二、LED子系统数据结构详解
个人主页:董哥聊技术我是董哥,嵌入式领域新星创作者创作理念:专注分享高质量嵌入式文章,让大家读有所得!文章目录1、核心数据结构1.1 gpio_led_platform_data1.2 gpio_leds_priv1.3 gpio_led1.4 gpio_led_data1.5 led_…...
Kubernetes(11):数据存储详解
在前面已经提到,容器的生命周期可能很短,会被频繁地创建和销毁。那么容器在销毁时,保存在容器中的数据也会被清除。这种结果对用户来说,在某些情况下是不乐意看到的。为了持久化保存容器的数据,kubernetes引入了Volume的概念。 Volume是Pod中能够被多个容器访问的共享目录…...
随想录Day43--动态规划: 1049. 最后一块石头的重量 II , 494. 目标和 , 474.一和零
最后一块石头重量转化为将一个集合分隔成两个集合,两个集合之间的差值最小,就是最后剩下最小的石头重量。这里可以求集合的一个平均值,如果正好等于平均值,说明可以抵消,这时候重量为0,如果不行,…...
Qt中对TCP粘包的处理
当时用TCP协议传输数据时,经常出现粘包的现象 当服务器向客户端发送数据之后,客户端还没有接收数据的时候,这段时间数据在什么地方? 1、服务器?服务器已经发出数据了 2、网线?数据应该在内存,怎…...
贪心-单调递增的数字
当且仅当每个相邻位数上的数字 x 和 y 满足 x < y 时,我们称这个整数是单调递增的。 给定一个整数 n ,返回 小于或等于 n 的最大数字,且数字呈 单调递增 。 示例 1: 输入: n 10 输出: 9示例 2: 输入: n 1234 输出: 1234示例 3: 输入…...
你真的会用搜索引擎吗?
作为一名在校大学生,对于搜索资料这一件事深有体会,特别是在期末考试突击的时候,如何利用搜索引擎,快速找到自己想要的知识,快速理解这个知识点,想必是每位大学生的必备技能了。 我们在学习一个知识点的过…...
KDCJ-20kV冲击耐压测试仪
一、产品简介 KDCJ-20kV冲击耐压测试仪是电力设备高压试验的基本项目之一,电力设备在设计、制造及修缮之后都要求进行冲击试验以验证或检验。因此,冲击电压试验设备有着广泛的应用,在工厂、研究机构及大专院校的高压试验室中都可以看到不同规…...
【Mybatis源码分析】TypeAliasRegistry源码分析
TypeAliasRegistry源码分析一、引入类型别名二、typeAlias 的三种配置方式三、TypeAliasRegistry源码分析三种配置方式源码解析校验过程Mybatis默认的别名配置四、总结一、引入类型别名 当配置 XML 文件,需要指明Java类型时,类型别名可替代Java类型的全…...
节点高负载
如何判断节点高负载? 可以通过 top 或 uptime 来确定 load 大小,如果 load 小于 CPU 数量,属于低负载,如果大于 CPU 数量 2~3 倍,就比较高了,当然也看业务敏感程度,不太敏感的大于 4 倍算高负载。 排查思路 观察监控:通常不是因为内核 bug 导致的高负载,在卡死之前…...
动态规划(一) part1
T1:一个数组 中的最长 升序 子序列 的长度 给你一个整数数组 nums ,找到其中最长严格递增子序列的长度。 子序列 是由数组派生而来的序列,删除(或不删除)数组中的元素而不改变其余元素的顺序。例如,[3,6,2,7] 是数组…...
Ubuntu显卡报错:Failed to initialize NVML Driver/library version mismatch
问题描述 输入指令nvidia-smi的时候,出现如下: Failed to initialize NVML: Driver/library version mismatch看起来好像是版本不匹配,在网上查了很多都没有解决问题,重启也不行,结果证明最好的办法是重新安装cuda。…...
JAVA企业电子采购系统源码:采购过程更规范,更透明
满足采购业务全程数字化, 实现供应商管理、采购需求、全网寻源、全网比价、电子招 投标、合同订单执行的全过程管理。 电子招标采购,是指在网上寻源和采购产品和服务的过程。对于企业和企业主来说,这是个既省钱又能提高供应链效率的有效方法…...
5.5G产业再提速!高通5GAdvanced-ready芯片商用终端下半年面世
MWC2023大会召开在即,5GAdvanced产业再添重磅消息!2月15日,高通宣布推出全球首个5GAdvanced-ready基带芯片——骁龙X755G调制解调器及射频系统,支持毫米波和Sub-6GHz频段,带来网络覆盖、时延、能效和移动性等全方位的提…...
基于B站王阿华的视频——为什么当下自媒体都在制造焦虑以及如何摆脱
观后笔记2.0——一些深入的思考 1.情绪大约在两千万年前,哺乳脑统治期间诞生。 2.情绪分为积极情绪和负面情绪。决定某种情绪的出现取决于安全感等级。 自媒体制造负面情绪,想尽办法挑起情绪,吸引流量 安全感充足时,由积极情绪…...
一、Docker介绍:
Docker官方网站:https://www.docker.com/ Docker容器技术是虚拟化技术的一个分支,虚拟化技术一般分为两种: 硬件级虚拟化(hardware-level-virtualization) :是运行在硬件之上的虚拟化技术,它的核…...
Java 语言特性(面试系列2)
一、SQL 基础 1. 复杂查询 (1)连接查询(JOIN) 内连接(INNER JOIN):返回两表匹配的记录。 SELECT e.name, d.dept_name FROM employees e INNER JOIN departments d ON e.dept_id d.dept_id; 左…...
DAY 47
三、通道注意力 3.1 通道注意力的定义 # 新增:通道注意力模块(SE模块) class ChannelAttention(nn.Module):"""通道注意力模块(Squeeze-and-Excitation)"""def __init__(self, in_channels, reduction_rat…...
解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错
出现的问题 安装 flash-attn 会一直卡在 build 那一步或者运行报错 解决办法 是因为你安装的 flash-attn 版本没有对应上,所以报错,到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本,cu、torch、cp 的版本一定要对…...
AI编程--插件对比分析:CodeRider、GitHub Copilot及其他
AI编程插件对比分析:CodeRider、GitHub Copilot及其他 随着人工智能技术的快速发展,AI编程插件已成为提升开发者生产力的重要工具。CodeRider和GitHub Copilot作为市场上的领先者,分别以其独特的特性和生态系统吸引了大量开发者。本文将从功…...
MySQL JOIN 表过多的优化思路
当 MySQL 查询涉及大量表 JOIN 时,性能会显著下降。以下是优化思路和简易实现方法: 一、核心优化思路 减少 JOIN 数量 数据冗余:添加必要的冗余字段(如订单表直接存储用户名)合并表:将频繁关联的小表合并成…...
libfmt: 现代C++的格式化工具库介绍与酷炫功能
libfmt: 现代C的格式化工具库介绍与酷炫功能 libfmt 是一个开源的C格式化库,提供了高效、安全的文本格式化功能,是C20中引入的std::format的基础实现。它比传统的printf和iostream更安全、更灵活、性能更好。 基本介绍 主要特点 类型安全:…...
【SpringBoot自动化部署】
SpringBoot自动化部署方法 使用Jenkins进行持续集成与部署 Jenkins是最常用的自动化部署工具之一,能够实现代码拉取、构建、测试和部署的全流程自动化。 配置Jenkins任务时,需要添加Git仓库地址和凭证,设置构建触发器(如GitHub…...
9-Oracle 23 ai Vector Search 特性 知识准备
很多小伙伴是不是参加了 免费认证课程(限时至2025/5/15) Oracle AI Vector Search 1Z0-184-25考试,都顺利拿到certified了没。 各行各业的AI 大模型的到来,传统的数据库中的SQL还能不能打,结构化和非结构的话数据如何和…...
Unity中的transform.up
2025年6月8日,周日下午 在Unity中,transform.up是Transform组件的一个属性,表示游戏对象在世界空间中的“上”方向(Y轴正方向),且会随对象旋转动态变化。以下是关键点解析: 基本定义 transfor…...
Axure 下拉框联动
实现选省、选完省之后选对应省份下的市区...
