当前位置: 首页 > news >正文

利用ControlNet重新定义你的AI姿势

利用ControlNet重新定义你的AI姿势

前段时间给大家分享了如何利用colab实现AI绘画自由,现在Stable Diffusion WebUI Colab TW又更新了不少新功能。最重要的是可以通过谷歌硬盘的快捷方式导入模型,极大的节省了谷歌硬盘容量。

众所周知,谷歌硬盘免费的只有15G,而每个大模型基本都在2,3G。所以每次要么手动删除一些模型,要么不挂载谷歌硬盘。前者麻烦,后者下载图片更麻烦。。。

现在这些问题都解决了,作者介绍了一种使用谷歌硬盘捷径节省空间的小技巧。只需要在以下模型站点里的模型以快捷方式保存到自己硬盘的对应位置即可。这里以模型站点一为例:选中模型-右键将快捷方式添加到云端硬盘-按步骤选中自己硬盘的文件夹-添加快捷方式。具体如下图:

1

这个时候,你硬盘的模型文件应该是这样的,其他对应文件夹也类似。

image-20230329111336774

⚠️:如果站点里没有且是自己想要的模型,就别删除了哈~

💡:将大模型删除后记得在回收站也清除,这样就能腾出大量的空间了~

🧩:当然缺点也有,目前作者提供的站点包含的模型不多,且都是大模型,理论上lora模型也是可以的。所以如果大家有新的站点资源也可以分享哈~一起做大做强。

需要注意的是,ControlNet和T2IAdapter都放在ControlNet文件夹下,如果没有则需要新建改文件夹。

模型站点一(Anything, Counterfeit, VAEs)

模型站点二(AbyssOrangeMix, PastelMix)

模型站点三(ChilloutMix)

模型站点四(CamelliaMix2.5D, ControlNet, T2IAdapter)

现在我们在重新回到colab上,在2.1下载SD模型中的model_package选其他,不用填url了。然后将3.1 下载Extensions里的所有插件全部勾选。完成这两步后(其余全部默认),点击全部运行即可。

首次安装完插件后,就不用再勾选这些了,直接用默认的就行。下次只用将2.1下载SD模型中的model_package选其他就可以直接运行了,启动效率直线上升

colab

现在打开webUI你就发现那些快捷方式的模型都可以选择了~

image-20230329112222081

而且也多了不少插件,具体的插件介绍可以看原作的Extensions整理。介绍的已经很详细了,我就不赘述了。

ControlNet应用

回到正题,上次应该算是AI绘画入门吧,之后我也学了一些新知识,顺带分享一下,虽然不及各大佬千分之一,但胜在直白(因为高深的我也不懂,毕竟也新手。哈哈~)

使用起来也很简单,在原先的基础上,点开文生图下面的ControlNet,设置参数后启用即可。

ControlNet参数解释

参数

在刚开始的时候,并不需要全部尝试,大部分的参数选择默认即可。个人建议:点击添加图片->勾选启用和猜测模式->选择预处理器和模型->点击预览结果->文生图即可

有时候点击预览结果没有展示,等等即可,个人使用感觉这个webUI有点反应迟钝,还很容易错误导致需要重启。

简单示例

  1. 单人

    在网上随机下载个姿势复杂的单人照片(最好不要有复杂背景)。然后按照上述步骤操作,选择canny相关预处理器和模型。预览结果如下,发现边缘检测的还是很不错的。

    image-20230329131318743

    然后设置文生图基本参数和提示词,点击Generate即可,产出的结果还是很不错的。

    虽然猜测模式不需要提示词,但是容易出现质量不好的图,所以可以适当加一些提高质量的提示词即可。下面可参考的参数设置,发现大部分默认的效果也很不错。

    image-20230329132523005

    canny单人

  2. 多人

    canny在单人模式表现的非常优异,不知道多人姿势怎么样。同样的,在网上随机下载一个多人姿势的图片。然后和上面步骤一样,预览发现边缘检测的效果也很好。

    image-20230329133433803

    但是点开后就会发现人物脸部并不精致。而且由于脸部较小,在不做特别参数处理时,出的人物图容易崩坏。这个时候就需要进行HiRes.fix,尤其是真人模型。以下是一个参数的参考~

    ⚠️:3次元的放大算法建议R-ESRGAN 4x+;2次元和2.5次元建议R-ESRGAN 4x+ Anime6B

    20230327223710

下面是3次元至2次元的结果(模型分别为chilloutmix_NiPrunedFp32Fix、camelliamix25D_v10、Counterfeit-V2.5_pruned):

00010-2377483458

00011-2377483458

00012-2377483458

有没有发现3次元的人脸基本一致,这是因为我在提示词加上了lora,如果不加的话,人物比较真实但不精致。因此如果想在多人的模式下加上lora的话,就需要用到别的方式了,例如Latent Couple+OpenPose。

总结

本文介绍了如何利用快捷方式节省谷歌硬盘,并开始通过ControlNet控制人物的姿势。这里只介绍了其中的一种算法canny–快速模仿别人的姿势。其他的算法大伙可以自行尝试,或者参考ControlNet使用教程,里面详尽了各个算法的差异与主要用途。例如适合建筑的mlsd,适合CG建模的normal_map,提取骨骼姿势的openpose等。

ControlNet除了自身插件外,还可以和别的插件合用,例如Latent Couple(+Composable Lora)、poseX、OpenPose Editor、Depth Library。极大的丰富了ControlNet的可玩性。这个有时间单独再说一期~

值得一提的是,有时候当你发现怎么调参数图都崩坏了,可以换一些随机种子,大量出图找一些比较好的图后再修改其他参数试试。

最后,只要你的手机或者pad能kx上网,可以将这个colab保存到收藏夹。在手机和pad上就可以AI绘画了,能限制你的,只有colab的免费时间了~

相关文章:

利用ControlNet重新定义你的AI姿势

利用ControlNet重新定义你的AI姿势 前段时间给大家分享了如何利用colab实现AI绘画自由,现在Stable Diffusion WebUI Colab TW又更新了不少新功能。最重要的是可以通过谷歌硬盘的快捷方式导入模型,极大的节省了谷歌硬盘容量。 众所周知,谷歌…...

中医药NER命名实体识别基于SPANNER方式

一个不知名大学生,江湖人称菜狗 original author: Jacky Li Email : 3435673055qq.com Time of completion:2023.3.5 Last edited: 2023.3.5 导读 本文使用SPANNER方式实现对中医药进行实体识别,采用focal loss 进行优化。 本文章作用防止安静…...

Vue必掌握

目录 一、组件通信方式 二、v-if和v-for 三、生命周期 1、描述 2、setup和created谁先执行 3、setup中为什么没有beforeCreate和created 四、双向绑定 v-model 1、定义 2、本质,原理 3、好处 五、如何扩展一个组件 1、mixins 缺点 2、slot插槽 3、e…...

SSM部分

声明式事务 从之前的事务控制的代码中可以看出,是有规律可循,代码的结构基本是确定的,所以框架就可以将固定模式的代码抽取出来,进行相关的封装。 封装起来后,我们只需要在配置文件中进行简单的配置即可完成操作。 …...

【Springboot系列】Springboot接管所有Controller,magic-api源码阅读

系列文章地址:Spring Boot学习大纲,可以留言自己想了解的技术点 最近在项目中使用了一个第三方的包 magic-api,节省了很多的时间,整体来说就是只用写sql就好了,不用写service,controller那些,全部统一处理了。 具体的使用大家可以搜索下,网上到处都是,建议去官网看。…...

二、LED子系统数据结构详解

个人主页:董哥聊技术我是董哥,嵌入式领域新星创作者创作理念:专注分享高质量嵌入式文章,让大家读有所得!文章目录1、核心数据结构1.1 gpio_led_platform_data1.2 gpio_leds_priv1.3 gpio_led1.4 gpio_led_data1.5 led_…...

Kubernetes(11):数据存储详解

在前面已经提到,容器的生命周期可能很短,会被频繁地创建和销毁。那么容器在销毁时,保存在容器中的数据也会被清除。这种结果对用户来说,在某些情况下是不乐意看到的。为了持久化保存容器的数据,kubernetes引入了Volume的概念。 Volume是Pod中能够被多个容器访问的共享目录…...

随想录Day43--动态规划: 1049. 最后一块石头的重量 II , 494. 目标和 , 474.一和零

最后一块石头重量转化为将一个集合分隔成两个集合,两个集合之间的差值最小,就是最后剩下最小的石头重量。这里可以求集合的一个平均值,如果正好等于平均值,说明可以抵消,这时候重量为0,如果不行&#xff0c…...

Qt中对TCP粘包的处理

当时用TCP协议传输数据时,经常出现粘包的现象 当服务器向客户端发送数据之后,客户端还没有接收数据的时候,这段时间数据在什么地方? 1、服务器?服务器已经发出数据了 2、网线?数据应该在内存,怎…...

贪心-单调递增的数字

当且仅当每个相邻位数上的数字 x 和 y 满足 x < y 时&#xff0c;我们称这个整数是单调递增的。 给定一个整数 n &#xff0c;返回 小于或等于 n 的最大数字&#xff0c;且数字呈 单调递增 。 示例 1: 输入: n 10 输出: 9示例 2: 输入: n 1234 输出: 1234示例 3: 输入…...

你真的会用搜索引擎吗?

作为一名在校大学生&#xff0c;对于搜索资料这一件事深有体会&#xff0c;特别是在期末考试突击的时候&#xff0c;如何利用搜索引擎&#xff0c;快速找到自己想要的知识&#xff0c;快速理解这个知识点&#xff0c;想必是每位大学生的必备技能了。 我们在学习一个知识点的过…...

KDCJ-20kV冲击耐压测试仪

一、产品简介 KDCJ-20kV冲击耐压测试仪是电力设备高压试验的基本项目之一&#xff0c;电力设备在设计、制造及修缮之后都要求进行冲击试验以验证或检验。因此&#xff0c;冲击电压试验设备有着广泛的应用&#xff0c;在工厂、研究机构及大专院校的高压试验室中都可以看到不同规…...

【Mybatis源码分析】TypeAliasRegistry源码分析

TypeAliasRegistry源码分析一、引入类型别名二、typeAlias 的三种配置方式三、TypeAliasRegistry源码分析三种配置方式源码解析校验过程Mybatis默认的别名配置四、总结一、引入类型别名 当配置 XML 文件&#xff0c;需要指明Java类型时&#xff0c;类型别名可替代Java类型的全…...

节点高负载

如何判断节点高负载? 可以通过 top 或 uptime 来确定 load 大小,如果 load 小于 CPU 数量,属于低负载,如果大于 CPU 数量 2~3 倍,就比较高了,当然也看业务敏感程度,不太敏感的大于 4 倍算高负载。 排查思路 观察监控:通常不是因为内核 bug 导致的高负载,在卡死之前…...

动态规划(一) part1

T1:一个数组 中的最长 升序 子序列 的长度 给你一个整数数组 nums &#xff0c;找到其中最长严格递增子序列的长度。 子序列 是由数组派生而来的序列&#xff0c;删除&#xff08;或不删除&#xff09;数组中的元素而不改变其余元素的顺序。例如&#xff0c;[3,6,2,7] 是数组…...

Ubuntu显卡报错:Failed to initialize NVML Driver/library version mismatch

问题描述 输入指令nvidia-smi的时候&#xff0c;出现如下&#xff1a; Failed to initialize NVML: Driver/library version mismatch看起来好像是版本不匹配&#xff0c;在网上查了很多都没有解决问题&#xff0c;重启也不行&#xff0c;结果证明最好的办法是重新安装cuda。…...

JAVA企业电子采购系统源码:采购过程更规范,更透明

满足采购业务全程数字化&#xff0c; 实现供应商管理、采购需求、全网寻源、全网比价、电子招 投标、合同订单执行的全过程管理。 电子招标采购&#xff0c;是指在网上寻源和采购产品和服务的过程。对于企业和企业主来说&#xff0c;这是个既省钱又能提高供应链效率的有效方法…...

5.5G产业再提速!高通5GAdvanced-ready芯片商用终端下半年面世

MWC2023大会召开在即&#xff0c;5GAdvanced产业再添重磅消息&#xff01;2月15日&#xff0c;高通宣布推出全球首个5GAdvanced-ready基带芯片——骁龙X755G调制解调器及射频系统&#xff0c;支持毫米波和Sub-6GHz频段&#xff0c;带来网络覆盖、时延、能效和移动性等全方位的提…...

基于B站王阿华的视频——为什么当下自媒体都在制造焦虑以及如何摆脱

观后笔记2.0——一些深入的思考 1.情绪大约在两千万年前&#xff0c;哺乳脑统治期间诞生。 2.情绪分为积极情绪和负面情绪。决定某种情绪的出现取决于安全感等级。 自媒体制造负面情绪&#xff0c;想尽办法挑起情绪&#xff0c;吸引流量 安全感充足时&#xff0c;由积极情绪…...

一、Docker介绍:

Docker官方网站&#xff1a;https://www.docker.com/ Docker容器技术是虚拟化技术的一个分支&#xff0c;虚拟化技术一般分为两种&#xff1a; 硬件级虚拟化&#xff08;hardware-level-virtualization&#xff09; &#xff1a;是运行在硬件之上的虚拟化技术&#xff0c;它的核…...

浏览器访问 AWS ECS 上部署的 Docker 容器(监听 80 端口)

✅ 一、ECS 服务配置 Dockerfile 确保监听 80 端口 EXPOSE 80 CMD ["nginx", "-g", "daemon off;"]或 EXPOSE 80 CMD ["python3", "-m", "http.server", "80"]任务定义&#xff08;Task Definition&…...

Vim 调用外部命令学习笔记

Vim 外部命令集成完全指南 文章目录 Vim 外部命令集成完全指南核心概念理解命令语法解析语法对比 常用外部命令详解文本排序与去重文本筛选与搜索高级 grep 搜索技巧文本替换与编辑字符处理高级文本处理编程语言处理其他实用命令 范围操作示例指定行范围处理复合命令示例 实用技…...

装饰模式(Decorator Pattern)重构java邮件发奖系统实战

前言 现在我们有个如下的需求&#xff0c;设计一个邮件发奖的小系统&#xff0c; 需求 1.数据验证 → 2. 敏感信息加密 → 3. 日志记录 → 4. 实际发送邮件 装饰器模式&#xff08;Decorator Pattern&#xff09;允许向一个现有的对象添加新的功能&#xff0c;同时又不改变其…...

TDengine 快速体验(Docker 镜像方式)

简介 TDengine 可以通过安装包、Docker 镜像 及云服务快速体验 TDengine 的功能&#xff0c;本节首先介绍如何通过 Docker 快速体验 TDengine&#xff0c;然后介绍如何在 Docker 环境下体验 TDengine 的写入和查询功能。如果你不熟悉 Docker&#xff0c;请使用 安装包的方式快…...

简易版抽奖活动的设计技术方案

1.前言 本技术方案旨在设计一套完整且可靠的抽奖活动逻辑,确保抽奖活动能够公平、公正、公开地进行,同时满足高并发访问、数据安全存储与高效处理等需求,为用户提供流畅的抽奖体验,助力业务顺利开展。本方案将涵盖抽奖活动的整体架构设计、核心流程逻辑、关键功能实现以及…...

React第五十七节 Router中RouterProvider使用详解及注意事项

前言 在 React Router v6.4 中&#xff0c;RouterProvider 是一个核心组件&#xff0c;用于提供基于数据路由&#xff08;data routers&#xff09;的新型路由方案。 它替代了传统的 <BrowserRouter>&#xff0c;支持更强大的数据加载和操作功能&#xff08;如 loader 和…...

Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例

使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件&#xff0c;常用于在两个集合之间进行数据转移&#xff0c;如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。 核心特性与用法 基本属性 v-model&#xff1a;绑定右侧列表的值&…...

使用分级同态加密防御梯度泄漏

抽象 联邦学习 &#xff08;FL&#xff09; 支持跨分布式客户端进行协作模型训练&#xff0c;而无需共享原始数据&#xff0c;这使其成为在互联和自动驾驶汽车 &#xff08;CAV&#xff09; 等领域保护隐私的机器学习的一种很有前途的方法。然而&#xff0c;最近的研究表明&…...

智能在线客服平台:数字化时代企业连接用户的 AI 中枢

随着互联网技术的飞速发展&#xff0c;消费者期望能够随时随地与企业进行交流。在线客服平台作为连接企业与客户的重要桥梁&#xff0c;不仅优化了客户体验&#xff0c;还提升了企业的服务效率和市场竞争力。本文将探讨在线客服平台的重要性、技术进展、实际应用&#xff0c;并…...

相机从app启动流程

一、流程框架图 二、具体流程分析 1、得到cameralist和对应的静态信息 目录如下: 重点代码分析: 启动相机前,先要通过getCameraIdList获取camera的个数以及id,然后可以通过getCameraCharacteristics获取对应id camera的capabilities(静态信息)进行一些openCamera前的…...