当前位置: 首页 > news >正文

AI 绘画神器 Fooocus 图生图:图像放大或变化、图像提示、图像重绘或扩充、反推提示词、生成参数提取、所需模型下载

在这里插入图片描述

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。

大家好,我是水滴~~
本文讲述 Fooocus 的图生图功能,主要内容包括:图像放大或变化、图像提示、图像重绘或扩充、反推提示词、生成参数提取,并分享了所需模型的下载地址。
文章内容包含大量的图例,希望能够帮助新手同学快速入门。

前言

一口气让 Fooocus 生成了 12 张“一个女孩骑着一条龙”的图片:
3_1.jpg
从里边选一张最有气质的照片,就它了:
2024-05-15_10-12-57_7051.png
今天我们就拿这张图片来演示 Fooocus 图生图的功能。

一、图像放大或变化(Upscale or Variatioin)

图像放大或变化(Upscale or Variatioin)可以微调图片或放大图片。

我们将图片拖放至左侧区域(或者上传),然后选择右边的选项,点击【生成】即可。然后,我们对比一下各选项生成的效果:
image.png
不启用:表示不启用图生图功能,会生成新的图片。
变化(细微 0.50):重绘幅度为 0.50,产生细微的变化(女孩表情变了、背景树木更茂密了)。
2024-05-15_10-48-34_4540.png
变化(强烈 0.85):重绘幅度为 0.85,产生强烈的变化(女孩面部和衣服变了,龙变胖了,轮子变成腿了,地面也变成泥地了)。
2024-05-15_10-53-44_2271.png
放大(1.5倍):图片放大了 1.5 倍,增加了细节,使画面更加细腻,女孩脸部也修复了。
2024-05-15_10-58-08_2550.png

放大(2倍):图片放大了 2 倍,增加了细节,使画面更加细腻,女孩脸部也修复了。
2024-05-15_11-01-14_8372.png

快速放大(2倍):图片放大了 2 倍,没有修改图片细节。
2024-05-15_11-02-43_3801.png

二、图像提示(Image Prompt)

图像提示(Image Prompt)相当于 WebUI 中的 ControlNet 功能。勾选【高级设置】后,可以看出它有四种 ControlNet 供我们选择:图像提示(默认)、边缘检测、深度检测、换脸。

image.png
Image Prompt 还有两个重要的参数(Fooocus 已为每一种 ControlNet 设置了不同的默认值,通常无需调整):

  • 停止于(Stop At):停止设置控制在生成过程中应用所选 ControlNet 的影响的步骤数。取值范围为 0~1,通常值为 0.5,值越高,ControlNet 与参考图的粘合度就越高。
  • 权重(Weight):权重设置决定了所选 ControlNet 对最终图像的影响强度。较高的权重值会增加 ControlNet 的影响,而较低的权重值会降低其效果。取值范围为 0~2

2.1 图像提示(ImagePrompt)

图像提示(ImagePrompt)可以根据提示词和参考图中的风格来生成新的图片。

一个女孩骑着一头鳄鱼(a girl rides a crocodile):
2024-05-15_14-35-41_6846.png
一个女孩参差一条蛇(a girl rides a snake):
2024-05-15_14-34-44_1727.png
一个女孩骑着一只狗(a girl rides a dog):
2024-05-15_14-41-43_5941.png

2.2 边缘检测(PyraCanny)

边缘检测(PyraCanny)用于识别并提取图像中的边缘特征。当您想要在生成的图片中保留参考图的特定细节或姿势时,PyraCanny 设置特别有用。它创建一个线条艺术图片,从图像中捕获复杂的细节,并将它们应用到文本提示和其他控制网络。这可以产生与输入图像非常相似的合成,同时结合所需的风格变化。

在【高级设置】中打开【开发者高度模式】,在【ControlNet】中勾选【高度预处理】可以生成预处理的控制图:
image.png
一个女孩骑着一只狗(a girl rides a dog):
2024-05-15_15-01-37_7842.png

2.3 深度检测(CPDS)

深度检测(CPDS,Contrast Preserving Decolorization Structure)即保持对比的退色结构,是由 Fooocus 团队开发的定制控制网络。它结合了深度控制和脱色方法,将图像转换为黑白图像。然后,黑白图像的结构充当控制网来影响最终图像。 CPDS 和 PyraCanny 具有相似的目的,但它们采用不同的方法。虽然您可以组合多个控制网络,但建议使用 Pyan 或 CPDS,但不要同时使用两者。

深度检测在使用【调试预处理】时会生成黑白照片:
image.png
一个女孩骑着一头恐龙(a girl rides a dinosaur):
2024-05-15_15-32-03_7639.png

2.4 换脸(FaceSwap)

换脸(FaceSwap)会检测参考图中的脸部和头发并将其替换为生成图片中的脸部和头发。可以结合提示词使用,AI 将从参考图中识别出面部和头发,并将其应用到最终生成的图像中。

参考图:
src=http___b-ssl.duitang.com_uploads_item_201707_02_20170702210428_PQJT3.png&refer=http___b-ssl.duitang.webp
一个女孩骑着一头龙(a girl rides a dragon):
2024-05-15_15-56-43_2732.png

三、图像重绘或扩充(Inpaint or Outpaint)

3.1 图像重绘或扩充

图像重绘或扩充(Inpaint or Outpaint)可以重绘蒙版内容,还可以扩充图片。

将参考图要重绘的部分使用蒙版遮住:
image.png
生成的图片,会重绘蒙版中的内容:
2024-05-15_16-21-50_2390.png

如果想要扩图,可以在【向外扩充绘制的方向】中勾选扩充的方向。

向上:
2024-05-15_16-32-34_1119.png
向下:
2024-05-15_16-36-16_7326.png
向左:
2024-05-15_16-37-18_4069.png

向右:
2024-05-15_16-38-20_5067.png
向四个方向:
2024-05-15_16-33-20_3267.png

3.2 内部重绘-改善细节(脸、手、眼等)

内部重绘-改善细节(Improve Detail (face, hand, eyes, etc.))可以修复脸、手和眼等。

例如,这个女孩的脸想修复一下,用蒙版遮住:
image.png
重绘后的效果:
2024-05-15_16-42-43_7184.png

3.3 内部重绘-修改内容(添加物体、改变背景等)

内部重绘-修改内容(Modify Content (add objects, change background, etc.))可以添加物体、改变背景等

例如,在地面添加一条狗,就可以在地面上添加蒙版,然后在【内部重绘的附加提示词】中添加 dog
image.png
这样就会在蒙版位置添加一条狗:
2024-05-15_16-45-40_3245.png
例如,将远处的山改为火山:
image.png
修改后的效果:
2024-05-15_16-53-06_8680.png

四、反推提示词(Describe)

反推提示词(Describe)可以提取图片中的关键信息,将结果输出到“提示词”文本框中。

主要包括两种——照片(Photograph)、画作/动漫(Art/Anime):

照片(Photograph)反推出的是一些句子,描述图片中的内容。

反推结果:a woman riding on the back of a motorcycle next to a dragon(一个女人坐在摩托车后座上,旁边是一条龙)
image.png

画作/动漫(Art/Anime)反推出的是一些单词,描述图片中的关键词。

反推结果:1girl, solo, long hair, brown hair, outdoors, wings, shorts, tank top, denim, ground vehicle, nature, motor vehicle, mountain, realistic, dragon, road, riding, dragon wings(女孩,独唱,长发,棕色头发,户外,翅膀,短裤,背心,牛仔布,地面车辆,自然,机动车,山,现实,龙,道路,骑,龙翅膀)
image.png

五、生成参数提取(Metadata)

生成参数提取(Metadata)可以提取用 Stable Diffusion 生成图片的生成信息,包括:正向提示词、负向提示词、采样器、采样步数等等。

image.png

六、模型下载

在使用 Fooocus 图生图功能时,会下载一些模型。我将这些模型放到网盘中了,这里分享给大家。

网盘地址:https://pan.quark.cn/s/5b972ab4e26f
image.png
inpaint 内容放到 Fooocus\models\inpaint目录中:
image.png
controlnet 内容放到 Fooocus\models\controlnet 目录中:
image.png
clip_vision 内容放到 Fooocus\models\clip_vision目录中:
image.png

相关文章:

AI 绘画神器 Fooocus 图生图:图像放大或变化、图像提示、图像重绘或扩充、反推提示词、生成参数提取、所需模型下载

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。 大家好,我是水滴~~ 本文讲述 Fooocus 的图生图功能,主要内容包括:图像放大或变化、图像提示、图像重绘或扩充、反推…...

yolov8 模型架构轻量化 | 极致降参数量

模型轻量化加速是深度学习领域的重要研究方向,旨在减小模型的体积和计算复杂度,从而提高在资源受限设备上的运行效率,模型参数量在轻量化加速中扮演着至关重要的角色。 首先,模型参数量直接决定了模型的复杂度和存储空间需求。随…...

uniapp 小程序低功耗蓝牙配网 ble配网 物联网

1.获取蓝牙列表 bleList.vue <template><view><button touchstart"startSearch">获取蓝牙列表</button><scroll-view :scroll-top"scrollTop" scroll-y class"content-pop"><viewclass"bluetoothItem&q…...

服务器防火墙有什么用防护策略

随着互联网的飞速发展&#xff0c;服务器的安全问题日益凸显。为了保护服务器免受网络攻击和恶意入侵的威胁&#xff0c;人们引入了防火墙的概念。服务器防火墙作为保护服务器的第一道防线&#xff0c;具有重要的作用。那么服务器防火墙有什么用&#xff1f; 首先&#xff0c;服…...

27.哀家要长脑子了!

目录 1.316. 去除重复字母 - 力扣&#xff08;LeetCode&#xff09; 2. 1209. 删除字符串中的所有相邻重复项 II - 力扣&#xff08;LeetCode 哎哟 烦死了 刚刚不小心退出又没保存 又要写一遍 烦死了 最近刷题不得劲啊 感觉这脑子没长一点 1.316. 去除重复字母 - 力扣&am…...

Redis实战—验证码登录注册

目录 基于Session Controller层 Service层 ServiceImpl层 ​编辑校验登录状态 ThreadLocal 登录拦截器 添加拦截器到Config Controller层实现 基于Redis ServiceImpl 新增刷新拦截器 添加拦截器到Config 基于Session Controller层 /*** 发送手机验证码*/PostMappi…...

对话机器人技术解说

一、RAG介绍 如何不通过微调模型来提高LLM性能&#xff0c;检索增强生成&#xff08;RAG&#xff09;是未来的发展方向。 Embedding&#xff1a;将文档的句子或单词块转换为数字向量。就向量之间的距离而言&#xff0c;彼此相似的句子应该很近&#xff0c;而不同的句子应该离…...

红黑树底层封装map、set C++

目录 一、框架思考 三个问题 问题1的解决 问题2的解决&#xff1a; 问题3的解决&#xff1a; 二、泛型编程 1、仿函数的泛型编程 2、迭代器的泛型编程 3、typename&#xff1a; 4、/--重载 三、原码 红黑树 map set 一、框架思考 map和set都是使用红黑树底层&…...

压力给到 Google,OpenAI 发布 GPT-4o 来了

北京时间5月14日凌晨1点&#xff0c;OpenAI 开启了今年的第一次直播&#xff0c;根据官方消息&#xff0c;这次旨在演示 ChatGPT 和 GPT-4 的升级内容。在早些时候 Sam Altman 在 X 上已经明确&#xff0c;「我们一直在努力开发一些我们认为人们会喜欢的新东西&#xff0c;对我…...

【SpringSecurity源码】过滤器链加载流程

theme: smartblue highlight: a11y-dark 一、前言及准备 1.1 SpringSecurity过滤器链简单介绍 在Spring Security中&#xff0c;过滤器链&#xff08;Filter Chain&#xff09;是由多个过滤器&#xff08;Filter&#xff09;组成的&#xff0c;这些过滤器按照一定的顺序对进…...

第9章.Keil5-MDK软件简介

目录 0. 《STM32单片机自学教程》专栏 9.1 主界面 9.2 文本格式编辑 9.3 代码提示&语法检测&代码模版 9.4 其他小技巧 9.4.1 TAB 键的妙用 9.4.2 快速定位函数/变量被定义的地方 9.4.3 快速注释与快速消注释 9.4.4 快速打开头文件 9.4.5 查找替换…...

mysql中utf8字符集中文字节长度统计如何统计到2个字节一个汉字

在 MySQL 的 utf8 字符集中&#xff08;也被称为 utf8mb3&#xff09;&#xff0c;中文字符实际上并不是用2个字节来表示的&#xff0c;而是使用3个字节。这是 UTF-8 编码的一个特性&#xff0c;它使用1到4个字节来表示一个字符&#xff0c;具体取决于字符的 Unicode 码点。 对…...

如何实现Linux双网卡同时连接内网和外网的配置?

博主猫头虎的技术世界 &#x1f31f; 欢迎来到猫头虎的博客 — 探索技术的无限可能&#xff01; 专栏链接&#xff1a; &#x1f517; 精选专栏&#xff1a; 《面试题大全》 — 面试准备的宝典&#xff01;《IDEA开发秘籍》 — 提升你的IDEA技能&#xff01;《100天精通鸿蒙》 …...

ASCLL码表以及字符的相加减

ASCLL码表完整版及解释_acssll码-CSDN博客 #include <getopt.h> #include <stdio.h> #include <stdlib.h>#define MAX_PATH 256 char filename[MAX_PATH 5];int isdigit(int c) {if (c > 0 && c < 9)return 1;return 0; }int main(int argc…...

一键修复所有dll缺失,教大家解决丢失的dll文件

修复所有DLL&#xff08;动态链接库&#xff09;文件缺失的问题通常不可能通过单一的"一键修复"按钮来实现&#xff0c;因为DLL文件缺失可能由各种不同的原因导致&#xff0c;比如应用程序安装不正确、病毒感染、或系统文件损坏等。 使用内置的系统文件检查器&#x…...

wsl2安装rancher并导入和创建k8s集群

环境准备 安装wsl2点击此文]ubuntu20.04安装docker 点击此文,安装完成后docker镜像仓库改成阿里云镜像加速地址.如果不熟请点击此文 docker 安装rancher 启动wsl,根据官方文档以root身份执行 sudo docker run -d --restartunless-stopped -p 80:80 -p 443:443 --privileged …...

内网环境ubuntu设置静态ip、DNS、路由,不影响网络访问

内网环境通常是有线的&#xff0c;通过服务器的ip、mac、dns地址访问网络才生效的&#xff0c;如果ip地址变了&#xff0c;就不能访问网络了。 如果你的ip地址变了&#xff0c;或者要防止ip变更影响网络访问&#xff0c;就要设置 1、依次点击右上角的电源-设置&#xff0c;在打…...

学习前端第三十七天(静态属性静态方法、类检查、错误处理)

一、静态属性和静态方法 1、静态属性静态方法 在属性和方法前加上static&#xff0c;创建属于类自己的属性和方法 class Person {// 加static&#xff0c;属于类自己的static name "xc"; // 类的name属性static height 183; // 类的height属性static age 20;…...

全网最全的基于电机控制的38类simulink仿真全家桶----新手大礼包

整理了基于电机的38种simulink仿真全家桶&#xff0c;包含多种资料&#xff0c;类型齐全十分适合新手学习使用。包括但是不局限于以下&#xff1a; 1、基于多电平逆变器的无刷直流电机驱动simulink仿真 2、基于负载转矩的感应电机速度控制simulink仿真 3、基于滑膜观测器的永…...

Python使用asyncio包实现异步编程

1. 异步编程 异步编程是一种编程范式&#xff0c;用于处理程序中需要等待异步操作完成后才能继续执行的情况。异步编程允许程序在执行耗时的操作时不被阻塞&#xff0c;而是在等待操作完成时继续执行其他任务。这对于处理诸如文件 I/O、网络请求、定时器等需要等待的操作非常有…...

获取文件夹下的vue文件形成组件,require.context

前言&#xff1a;项目中现有一个文件里面包含所有需要用到的组件&#xff0c;如果一个个的去import&#xff0c;则会非常麻烦&#xff0c;现有require.context去实现&#xff0c; 1、require.context var request require.context(‘./module’, true, /.js$/) require.cont…...

2024软件测试必问的常见面试题1000问!

01、您所熟悉的测试用例设计方法都有哪些&#xff1f;请分别以具体的例子来说明这些方法在测试用例设计工作中的应用。 答&#xff1a;有黑盒和白盒两种测试种类&#xff0c;黑盒有等价类划分法&#xff0c;边界分析法&#xff0c;因果图法和错误猜测法。白盒有逻辑覆盖法&…...

C++列表实现

文章目录 一、listView相关内容主要思想实例全部代码 二、QTreeView 一、listView 相关内容 QAbstractItemModel&#xff1a;一个抽象的类&#xff0c;为数据项模型提供抽象的接口&#xff0c;常见的的数据模型列如&#xff1a;QStringListModel,QStandardItemMode,QDirModel…...

论文合集整理推荐2024.5.15

‍2012年论文合集&#xff1a;论文入口 ‍2019年论文合集&#xff1a;论文入口 2022年论文合集&#xff1a;论文入口 2023年论文合集&#xff1a;论文入口 2024年论文合集&#xff1a;论文入口...

JavaScript的跳转传参方式

在JavaScript中&#xff0c;页面跳转并传递参数通常可以通过几种不同的方式来实现。下面是一些常见的方法&#xff1a; 1.URL参数&#xff08;Query String&#xff09; 这是最常见的方式&#xff0c;通过在URL的末尾添加参数来实现。例如&#xff1a; javascriptwindow.loc…...

非阻塞模式下的读写操作

实现文件IO的非阻塞模式的读写操作 fcntl函数 功能&#xff1a; #include <unistd.h> #include <fcntl.h> int fcntl(int fd, int cmd, ... /* arg */ ); // arg表示可变参数&#xff0c;由cmd决定 fcntl()对打开的文件描述符fd执行下面描述的操作之一。操作由cmd决…...

Google Ads谷歌广告账户被封停怎么办?

跨境出海业务少不了需要做Google Ads推广业务&#xff1b;其中让投手们闻风丧胆的消息就是帐户被暂停。当 Google 检测到任何违反其政策且可能损害用户在线体验的行为时&#xff0c;就会发生这种情况。那么如何在做广告推广的同时&#xff0c;保证账号不被封禁呢&#xff1f;看…...

AI大模型探索之路-训练篇23:ChatGLM3微调实战-基于P-Tuning V2技术的实践指南

系列篇章&#x1f4a5; AI大模型探索之路-训练篇1&#xff1a;大语言模型微调基础认知 AI大模型探索之路-训练篇2&#xff1a;大语言模型预训练基础认知 AI大模型探索之路-训练篇3&#xff1a;大语言模型全景解读 AI大模型探索之路-训练篇4&#xff1a;大语言模型训练数据集概…...

掌握核心概念:Java高级面试难题精解(一)

Java 高级面试问题及答案 问题1: 在Java中&#xff0c;什么是泛型擦除&#xff1f;为什么需要它&#xff1f; 答案&#xff1a; 泛型擦除是Java编译器的一个特性&#xff0c;它在运行时移除泛型类型信息&#xff0c;以确保类型安全。Java的泛型是在J2SE 1.5中引入的&#xff…...

Nagle算法

Nagle算法简介 Nagle算法主要是避免发送小的数据包&#xff0c;要求TCP连接上最多只能有一个未被确认的小分组&#xff0c;在该分组的确认到达之前不能发送其他的小分组。 在默认的情况下,Nagle算法是默认开启的&#xff0c;Nagle算法比较适用于发送方发送大批量的小数据&…...