当前位置: 首页 > news >正文

利用ControlNet重新定义你的AI姿势

利用ControlNet重新定义你的AI姿势

前段时间给大家分享了如何利用colab实现AI绘画自由,现在Stable Diffusion WebUI Colab TW又更新了不少新功能。最重要的是可以通过谷歌硬盘的快捷方式导入模型,极大的节省了谷歌硬盘容量。

众所周知,谷歌硬盘免费的只有15G,而每个大模型基本都在2,3G。所以每次要么手动删除一些模型,要么不挂载谷歌硬盘。前者麻烦,后者下载图片更麻烦。。。

现在这些问题都解决了,作者介绍了一种使用谷歌硬盘捷径节省空间的小技巧。只需要在以下模型站点里的模型以快捷方式保存到自己硬盘的对应位置即可。这里以模型站点一为例:选中模型-右键将快捷方式添加到云端硬盘-按步骤选中自己硬盘的文件夹-添加快捷方式。具体如下图:

1

这个时候,你硬盘的模型文件应该是这样的,其他对应文件夹也类似。

image-20230329111336774

⚠️:如果站点里没有且是自己想要的模型,就别删除了哈~

💡:将大模型删除后记得在回收站也清除,这样就能腾出大量的空间了~

🧩:当然缺点也有,目前作者提供的站点包含的模型不多,且都是大模型,理论上lora模型也是可以的。所以如果大家有新的站点资源也可以分享哈~一起做大做强。

需要注意的是,ControlNet和T2IAdapter都放在ControlNet文件夹下,如果没有则需要新建改文件夹。

模型站点一(Anything, Counterfeit, VAEs)

模型站点二(AbyssOrangeMix, PastelMix)

模型站点三(ChilloutMix)

模型站点四(CamelliaMix2.5D, ControlNet, T2IAdapter)

现在我们在重新回到colab上,在2.1下载SD模型中的model_package选其他,不用填url了。然后将3.1 下载Extensions里的所有插件全部勾选。完成这两步后(其余全部默认),点击全部运行即可。

首次安装完插件后,就不用再勾选这些了,直接用默认的就行。下次只用将2.1下载SD模型中的model_package选其他就可以直接运行了,启动效率直线上升

colab

现在打开webUI你就发现那些快捷方式的模型都可以选择了~

image-20230329112222081

而且也多了不少插件,具体的插件介绍可以看原作的Extensions整理。介绍的已经很详细了,我就不赘述了。

ControlNet应用

回到正题,上次应该算是AI绘画入门吧,之后我也学了一些新知识,顺带分享一下,虽然不及各大佬千分之一,但胜在直白(因为高深的我也不懂,毕竟也新手。哈哈~)

使用起来也很简单,在原先的基础上,点开文生图下面的ControlNet,设置参数后启用即可。

ControlNet参数解释

参数

在刚开始的时候,并不需要全部尝试,大部分的参数选择默认即可。个人建议:点击添加图片->勾选启用和猜测模式->选择预处理器和模型->点击预览结果->文生图即可

有时候点击预览结果没有展示,等等即可,个人使用感觉这个webUI有点反应迟钝,还很容易错误导致需要重启。

简单示例

  1. 单人

    在网上随机下载个姿势复杂的单人照片(最好不要有复杂背景)。然后按照上述步骤操作,选择canny相关预处理器和模型。预览结果如下,发现边缘检测的还是很不错的。

    image-20230329131318743

    然后设置文生图基本参数和提示词,点击Generate即可,产出的结果还是很不错的。

    虽然猜测模式不需要提示词,但是容易出现质量不好的图,所以可以适当加一些提高质量的提示词即可。下面可参考的参数设置,发现大部分默认的效果也很不错。

    image-20230329132523005

    canny单人

  2. 多人

    canny在单人模式表现的非常优异,不知道多人姿势怎么样。同样的,在网上随机下载一个多人姿势的图片。然后和上面步骤一样,预览发现边缘检测的效果也很好。

    image-20230329133433803

    但是点开后就会发现人物脸部并不精致。而且由于脸部较小,在不做特别参数处理时,出的人物图容易崩坏。这个时候就需要进行HiRes.fix,尤其是真人模型。以下是一个参数的参考~

    ⚠️:3次元的放大算法建议R-ESRGAN 4x+;2次元和2.5次元建议R-ESRGAN 4x+ Anime6B

    20230327223710

下面是3次元至2次元的结果(模型分别为chilloutmix_NiPrunedFp32Fix、camelliamix25D_v10、Counterfeit-V2.5_pruned):

00010-2377483458

00011-2377483458

00012-2377483458

有没有发现3次元的人脸基本一致,这是因为我在提示词加上了lora,如果不加的话,人物比较真实但不精致。因此如果想在多人的模式下加上lora的话,就需要用到别的方式了,例如Latent Couple+OpenPose。

总结

本文介绍了如何利用快捷方式节省谷歌硬盘,并开始通过ControlNet控制人物的姿势。这里只介绍了其中的一种算法canny–快速模仿别人的姿势。其他的算法大伙可以自行尝试,或者参考ControlNet使用教程,里面详尽了各个算法的差异与主要用途。例如适合建筑的mlsd,适合CG建模的normal_map,提取骨骼姿势的openpose等。

ControlNet除了自身插件外,还可以和别的插件合用,例如Latent Couple(+Composable Lora)、poseX、OpenPose Editor、Depth Library。极大的丰富了ControlNet的可玩性。这个有时间单独再说一期~

值得一提的是,有时候当你发现怎么调参数图都崩坏了,可以换一些随机种子,大量出图找一些比较好的图后再修改其他参数试试。

最后,只要你的手机或者pad能kx上网,可以将这个colab保存到收藏夹。在手机和pad上就可以AI绘画了,能限制你的,只有colab的免费时间了~

相关文章:

利用ControlNet重新定义你的AI姿势

利用ControlNet重新定义你的AI姿势 前段时间给大家分享了如何利用colab实现AI绘画自由,现在Stable Diffusion WebUI Colab TW又更新了不少新功能。最重要的是可以通过谷歌硬盘的快捷方式导入模型,极大的节省了谷歌硬盘容量。 众所周知,谷歌…...

中医药NER命名实体识别基于SPANNER方式

一个不知名大学生,江湖人称菜狗 original author: Jacky Li Email : 3435673055qq.com Time of completion:2023.3.5 Last edited: 2023.3.5 导读 本文使用SPANNER方式实现对中医药进行实体识别,采用focal loss 进行优化。 本文章作用防止安静…...

Vue必掌握

目录 一、组件通信方式 二、v-if和v-for 三、生命周期 1、描述 2、setup和created谁先执行 3、setup中为什么没有beforeCreate和created 四、双向绑定 v-model 1、定义 2、本质,原理 3、好处 五、如何扩展一个组件 1、mixins 缺点 2、slot插槽 3、e…...

SSM部分

声明式事务 从之前的事务控制的代码中可以看出,是有规律可循,代码的结构基本是确定的,所以框架就可以将固定模式的代码抽取出来,进行相关的封装。 封装起来后,我们只需要在配置文件中进行简单的配置即可完成操作。 …...

【Springboot系列】Springboot接管所有Controller,magic-api源码阅读

系列文章地址:Spring Boot学习大纲,可以留言自己想了解的技术点 最近在项目中使用了一个第三方的包 magic-api,节省了很多的时间,整体来说就是只用写sql就好了,不用写service,controller那些,全部统一处理了。 具体的使用大家可以搜索下,网上到处都是,建议去官网看。…...

二、LED子系统数据结构详解

个人主页:董哥聊技术我是董哥,嵌入式领域新星创作者创作理念:专注分享高质量嵌入式文章,让大家读有所得!文章目录1、核心数据结构1.1 gpio_led_platform_data1.2 gpio_leds_priv1.3 gpio_led1.4 gpio_led_data1.5 led_…...

Kubernetes(11):数据存储详解

在前面已经提到,容器的生命周期可能很短,会被频繁地创建和销毁。那么容器在销毁时,保存在容器中的数据也会被清除。这种结果对用户来说,在某些情况下是不乐意看到的。为了持久化保存容器的数据,kubernetes引入了Volume的概念。 Volume是Pod中能够被多个容器访问的共享目录…...

随想录Day43--动态规划: 1049. 最后一块石头的重量 II , 494. 目标和 , 474.一和零

最后一块石头重量转化为将一个集合分隔成两个集合,两个集合之间的差值最小,就是最后剩下最小的石头重量。这里可以求集合的一个平均值,如果正好等于平均值,说明可以抵消,这时候重量为0,如果不行&#xff0c…...

Qt中对TCP粘包的处理

当时用TCP协议传输数据时,经常出现粘包的现象 当服务器向客户端发送数据之后,客户端还没有接收数据的时候,这段时间数据在什么地方? 1、服务器?服务器已经发出数据了 2、网线?数据应该在内存,怎…...

贪心-单调递增的数字

当且仅当每个相邻位数上的数字 x 和 y 满足 x < y 时&#xff0c;我们称这个整数是单调递增的。 给定一个整数 n &#xff0c;返回 小于或等于 n 的最大数字&#xff0c;且数字呈 单调递增 。 示例 1: 输入: n 10 输出: 9示例 2: 输入: n 1234 输出: 1234示例 3: 输入…...

你真的会用搜索引擎吗?

作为一名在校大学生&#xff0c;对于搜索资料这一件事深有体会&#xff0c;特别是在期末考试突击的时候&#xff0c;如何利用搜索引擎&#xff0c;快速找到自己想要的知识&#xff0c;快速理解这个知识点&#xff0c;想必是每位大学生的必备技能了。 我们在学习一个知识点的过…...

KDCJ-20kV冲击耐压测试仪

一、产品简介 KDCJ-20kV冲击耐压测试仪是电力设备高压试验的基本项目之一&#xff0c;电力设备在设计、制造及修缮之后都要求进行冲击试验以验证或检验。因此&#xff0c;冲击电压试验设备有着广泛的应用&#xff0c;在工厂、研究机构及大专院校的高压试验室中都可以看到不同规…...

【Mybatis源码分析】TypeAliasRegistry源码分析

TypeAliasRegistry源码分析一、引入类型别名二、typeAlias 的三种配置方式三、TypeAliasRegistry源码分析三种配置方式源码解析校验过程Mybatis默认的别名配置四、总结一、引入类型别名 当配置 XML 文件&#xff0c;需要指明Java类型时&#xff0c;类型别名可替代Java类型的全…...

节点高负载

如何判断节点高负载? 可以通过 top 或 uptime 来确定 load 大小,如果 load 小于 CPU 数量,属于低负载,如果大于 CPU 数量 2~3 倍,就比较高了,当然也看业务敏感程度,不太敏感的大于 4 倍算高负载。 排查思路 观察监控:通常不是因为内核 bug 导致的高负载,在卡死之前…...

动态规划(一) part1

T1:一个数组 中的最长 升序 子序列 的长度 给你一个整数数组 nums &#xff0c;找到其中最长严格递增子序列的长度。 子序列 是由数组派生而来的序列&#xff0c;删除&#xff08;或不删除&#xff09;数组中的元素而不改变其余元素的顺序。例如&#xff0c;[3,6,2,7] 是数组…...

Ubuntu显卡报错:Failed to initialize NVML Driver/library version mismatch

问题描述 输入指令nvidia-smi的时候&#xff0c;出现如下&#xff1a; Failed to initialize NVML: Driver/library version mismatch看起来好像是版本不匹配&#xff0c;在网上查了很多都没有解决问题&#xff0c;重启也不行&#xff0c;结果证明最好的办法是重新安装cuda。…...

JAVA企业电子采购系统源码:采购过程更规范,更透明

满足采购业务全程数字化&#xff0c; 实现供应商管理、采购需求、全网寻源、全网比价、电子招 投标、合同订单执行的全过程管理。 电子招标采购&#xff0c;是指在网上寻源和采购产品和服务的过程。对于企业和企业主来说&#xff0c;这是个既省钱又能提高供应链效率的有效方法…...

5.5G产业再提速!高通5GAdvanced-ready芯片商用终端下半年面世

MWC2023大会召开在即&#xff0c;5GAdvanced产业再添重磅消息&#xff01;2月15日&#xff0c;高通宣布推出全球首个5GAdvanced-ready基带芯片——骁龙X755G调制解调器及射频系统&#xff0c;支持毫米波和Sub-6GHz频段&#xff0c;带来网络覆盖、时延、能效和移动性等全方位的提…...

基于B站王阿华的视频——为什么当下自媒体都在制造焦虑以及如何摆脱

观后笔记2.0——一些深入的思考 1.情绪大约在两千万年前&#xff0c;哺乳脑统治期间诞生。 2.情绪分为积极情绪和负面情绪。决定某种情绪的出现取决于安全感等级。 自媒体制造负面情绪&#xff0c;想尽办法挑起情绪&#xff0c;吸引流量 安全感充足时&#xff0c;由积极情绪…...

一、Docker介绍:

Docker官方网站&#xff1a;https://www.docker.com/ Docker容器技术是虚拟化技术的一个分支&#xff0c;虚拟化技术一般分为两种&#xff1a; 硬件级虚拟化&#xff08;hardware-level-virtualization&#xff09; &#xff1a;是运行在硬件之上的虚拟化技术&#xff0c;它的核…...

浏览器串口调试革命:无需安装驱动,3分钟上手专业级串口助手

浏览器串口调试革命&#xff1a;无需安装驱动&#xff0c;3分钟上手专业级串口助手 【免费下载链接】SerialAssistant A serial port assistant that can be used directly in the browser. 项目地址: https://gitcode.com/gh_mirrors/se/SerialAssistant 还在为串口调试…...

终极指南:如何用ROFL-Player永久解决英雄联盟回放版本兼容性问题

终极指南&#xff1a;如何用ROFL-Player永久解决英雄联盟回放版本兼容性问题 【免费下载链接】ROFL-Player (No longer supported) One stop shop utility for viewing League of Legends replays! 项目地址: https://gitcode.com/gh_mirrors/ro/ROFL-Player 还在为英雄…...

开源阅读鸿蒙版技术架构解析:构建去中心化数字阅读生态的实践方案

开源阅读鸿蒙版技术架构解析&#xff1a;构建去中心化数字阅读生态的实践方案 【免费下载链接】legado-Harmony 开源阅读鸿蒙版仓库 项目地址: https://gitcode.com/gh_mirrors/le/legado-Harmony 开源阅读鸿蒙版&#xff08;Legado-Harmony&#xff09;是一款专为鸿蒙操…...

终极CoreCycler教程:5分钟掌握CPU超频稳定性测试

终极CoreCycler教程&#xff1a;5分钟掌握CPU超频稳定性测试 【免费下载链接】corecycler Script to test single core stability, e.g. for PBO & Curve Optimizer on AMD Ryzen or overclocking/undervolting on Intel processors 项目地址: https://gitcode.com/gh_mi…...

保利商旅诺雅品牌首作,长沙保利橘洲诺雅酒店开业

美通社消息&#xff1a;5月15日&#xff0c;由保利发展湖南公司投资兴建、保利商旅产业发展有限公司运营管理的豪华城市度假品牌——诺雅(ORYARD)首店&#xff1a;长沙保利橘洲诺雅酒店&#xff0c;于湘江之畔正式盛大开业。该项目自2026年2月试营业以来&#xff0c;历经数月的…...

基于Arduino Yun的DIY无线安防摄像头:运动检测、云端同步与实时流媒体

1. 项目概述与核心价值 手头有个闲置的Arduino Yun和USB摄像头&#xff0c;一直琢磨着怎么把它们利用起来&#xff0c;做个有点意思的东西。市面上那些无线监控摄像头功能是挺全&#xff0c;但总觉得少了点“掌控感”&#xff0c;数据存在哪里、怎么访问&#xff0c;都得听厂家…...

求职时间管理神器:3秒智能标记招聘岗位时效性实战指南

求职时间管理神器&#xff1a;3秒智能标记招聘岗位时效性实战指南 【免费下载链接】NewJob 一眼看出该职位最后修改时间&#xff0c;绿色为2周之内&#xff0c;暗橙色为1.5个月之内&#xff0c;红色为1.5个月以上 项目地址: https://gitcode.com/GitHub_Trending/ne/NewJob …...

Linux环境变量与env命令:从核心原理到高级实战应用

1. 项目概述&#xff1a;为什么环境变量是Linux的“隐形指挥棒”在Linux世界里&#xff0c;我们每天都在和各种命令、程序打交道。你有没有想过&#xff0c;为什么ls命令在任何目录下都能直接运行&#xff1f;为什么python命令启动的是Python 3而不是Python 2&#xff1f;又或者…...

钉钉机器人消息解析器:基于JSON Path与模板的自动化数据提取方案

1. 项目概述&#xff1a;一个钉钉消息解析器的诞生最近在做一个内部自动化工具时&#xff0c;遇到了一个挺有意思的需求&#xff1a;需要把钉钉机器人推送过来的消息&#xff0c;从原始的、结构复杂的JSON格式里&#xff0c;精准地“抠”出我们关心的业务数据。比如&#xff0c…...

ComfyUI MixLab Nodes:3分钟掌握AI多模态创作平台,彻底改变你的创意工作流

ComfyUI MixLab Nodes&#xff1a;3分钟掌握AI多模态创作平台&#xff0c;彻底改变你的创意工作流 【免费下载链接】comfyui-mixlab-nodes Workflow-to-APP、ScreenShare&FloatingVideo、GPT & 3D、SpeechRecognition&TTS 项目地址: https://gitcode.com/gh_mirr…...