AI 绘画神器 Fooocus 图生图:图像放大或变化、图像提示、图像重绘或扩充、反推提示词、生成参数提取、所需模型下载

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。
大家好,我是水滴~~
本文讲述 Fooocus 的图生图功能,主要内容包括:图像放大或变化、图像提示、图像重绘或扩充、反推提示词、生成参数提取,并分享了所需模型的下载地址。
文章内容包含大量的图例,希望能够帮助新手同学快速入门。
前言
一口气让 Fooocus 生成了 12 张“一个女孩骑着一条龙”的图片:

从里边选一张最有气质的照片,就它了:

今天我们就拿这张图片来演示 Fooocus 图生图的功能。
一、图像放大或变化(Upscale or Variatioin)
图像放大或变化(Upscale or Variatioin)可以微调图片或放大图片。
我们将图片拖放至左侧区域(或者上传),然后选择右边的选项,点击【生成】即可。然后,我们对比一下各选项生成的效果:

不启用:表示不启用图生图功能,会生成新的图片。
变化(细微 0.50):重绘幅度为 0.50,产生细微的变化(女孩表情变了、背景树木更茂密了)。

变化(强烈 0.85):重绘幅度为 0.85,产生强烈的变化(女孩面部和衣服变了,龙变胖了,轮子变成腿了,地面也变成泥地了)。

放大(1.5倍):图片放大了 1.5 倍,增加了细节,使画面更加细腻,女孩脸部也修复了。

放大(2倍):图片放大了 2 倍,增加了细节,使画面更加细腻,女孩脸部也修复了。

快速放大(2倍):图片放大了 2 倍,没有修改图片细节。

二、图像提示(Image Prompt)
图像提示(Image Prompt)相当于 WebUI 中的 ControlNet 功能。勾选【高级设置】后,可以看出它有四种 ControlNet 供我们选择:图像提示(默认)、边缘检测、深度检测、换脸。

Image Prompt 还有两个重要的参数(Fooocus 已为每一种 ControlNet 设置了不同的默认值,通常无需调整):
- 停止于(Stop At):停止设置控制在生成过程中应用所选 ControlNet 的影响的步骤数。取值范围为
0~1,通常值为0.5,值越高,ControlNet 与参考图的粘合度就越高。 - 权重(Weight):权重设置决定了所选 ControlNet 对最终图像的影响强度。较高的权重值会增加 ControlNet 的影响,而较低的权重值会降低其效果。取值范围为
0~2。
2.1 图像提示(ImagePrompt)
图像提示(ImagePrompt)可以根据提示词和参考图中的风格来生成新的图片。
一个女孩骑着一头鳄鱼(a girl rides a crocodile):

一个女孩参差一条蛇(a girl rides a snake):

一个女孩骑着一只狗(a girl rides a dog):

2.2 边缘检测(PyraCanny)
边缘检测(PyraCanny)用于识别并提取图像中的边缘特征。当您想要在生成的图片中保留参考图的特定细节或姿势时,PyraCanny 设置特别有用。它创建一个线条艺术图片,从图像中捕获复杂的细节,并将它们应用到文本提示和其他控制网络。这可以产生与输入图像非常相似的合成,同时结合所需的风格变化。
在【高级设置】中打开【开发者高度模式】,在【ControlNet】中勾选【高度预处理】可以生成预处理的控制图:

一个女孩骑着一只狗(a girl rides a dog):

2.3 深度检测(CPDS)
深度检测(CPDS,Contrast Preserving Decolorization Structure)即保持对比的退色结构,是由 Fooocus 团队开发的定制控制网络。它结合了深度控制和脱色方法,将图像转换为黑白图像。然后,黑白图像的结构充当控制网来影响最终图像。 CPDS 和 PyraCanny 具有相似的目的,但它们采用不同的方法。虽然您可以组合多个控制网络,但建议使用 Pyan 或 CPDS,但不要同时使用两者。
深度检测在使用【调试预处理】时会生成黑白照片:

一个女孩骑着一头恐龙(a girl rides a dinosaur):

2.4 换脸(FaceSwap)
换脸(FaceSwap)会检测参考图中的脸部和头发并将其替换为生成图片中的脸部和头发。可以结合提示词使用,AI 将从参考图中识别出面部和头发,并将其应用到最终生成的图像中。
参考图:

一个女孩骑着一头龙(a girl rides a dragon):

三、图像重绘或扩充(Inpaint or Outpaint)
3.1 图像重绘或扩充
图像重绘或扩充(Inpaint or Outpaint)可以重绘蒙版内容,还可以扩充图片。
将参考图要重绘的部分使用蒙版遮住:

生成的图片,会重绘蒙版中的内容:

如果想要扩图,可以在【向外扩充绘制的方向】中勾选扩充的方向。
向上:

向下:

向左:

向右:

向四个方向:

3.2 内部重绘-改善细节(脸、手、眼等)
内部重绘-改善细节(Improve Detail (face, hand, eyes, etc.))可以修复脸、手和眼等。
例如,这个女孩的脸想修复一下,用蒙版遮住:

重绘后的效果:

3.3 内部重绘-修改内容(添加物体、改变背景等)
内部重绘-修改内容(Modify Content (add objects, change background, etc.))可以添加物体、改变背景等
例如,在地面添加一条狗,就可以在地面上添加蒙版,然后在【内部重绘的附加提示词】中添加 dog:

这样就会在蒙版位置添加一条狗:

例如,将远处的山改为火山:

修改后的效果:

四、反推提示词(Describe)
反推提示词(Describe)可以提取图片中的关键信息,将结果输出到“提示词”文本框中。
主要包括两种——照片(Photograph)、画作/动漫(Art/Anime):
照片(Photograph)反推出的是一些句子,描述图片中的内容。
反推结果:a woman riding on the back of a motorcycle next to a dragon(一个女人坐在摩托车后座上,旁边是一条龙)

画作/动漫(Art/Anime)反推出的是一些单词,描述图片中的关键词。
反推结果:1girl, solo, long hair, brown hair, outdoors, wings, shorts, tank top, denim, ground vehicle, nature, motor vehicle, mountain, realistic, dragon, road, riding, dragon wings(女孩,独唱,长发,棕色头发,户外,翅膀,短裤,背心,牛仔布,地面车辆,自然,机动车,山,现实,龙,道路,骑,龙翅膀)

五、生成参数提取(Metadata)
生成参数提取(Metadata)可以提取用 Stable Diffusion 生成图片的生成信息,包括:正向提示词、负向提示词、采样器、采样步数等等。

六、模型下载
在使用 Fooocus 图生图功能时,会下载一些模型。我将这些模型放到网盘中了,这里分享给大家。
网盘地址:https://pan.quark.cn/s/5b972ab4e26f

inpaint 内容放到 Fooocus\models\inpaint目录中:

controlnet 内容放到 Fooocus\models\controlnet 目录中:

clip_vision 内容放到 Fooocus\models\clip_vision目录中:

相关文章:
AI 绘画神器 Fooocus 图生图:图像放大或变化、图像提示、图像重绘或扩充、反推提示词、生成参数提取、所需模型下载
本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。 大家好,我是水滴~~ 本文讲述 Fooocus 的图生图功能,主要内容包括:图像放大或变化、图像提示、图像重绘或扩充、反推…...
yolov8 模型架构轻量化 | 极致降参数量
模型轻量化加速是深度学习领域的重要研究方向,旨在减小模型的体积和计算复杂度,从而提高在资源受限设备上的运行效率,模型参数量在轻量化加速中扮演着至关重要的角色。 首先,模型参数量直接决定了模型的复杂度和存储空间需求。随…...
uniapp 小程序低功耗蓝牙配网 ble配网 物联网
1.获取蓝牙列表 bleList.vue <template><view><button touchstart"startSearch">获取蓝牙列表</button><scroll-view :scroll-top"scrollTop" scroll-y class"content-pop"><viewclass"bluetoothItem&q…...
服务器防火墙有什么用防护策略
随着互联网的飞速发展,服务器的安全问题日益凸显。为了保护服务器免受网络攻击和恶意入侵的威胁,人们引入了防火墙的概念。服务器防火墙作为保护服务器的第一道防线,具有重要的作用。那么服务器防火墙有什么用? 首先,服…...
27.哀家要长脑子了!
目录 1.316. 去除重复字母 - 力扣(LeetCode) 2. 1209. 删除字符串中的所有相邻重复项 II - 力扣(LeetCode 哎哟 烦死了 刚刚不小心退出又没保存 又要写一遍 烦死了 最近刷题不得劲啊 感觉这脑子没长一点 1.316. 去除重复字母 - 力扣&am…...
Redis实战—验证码登录注册
目录 基于Session Controller层 Service层 ServiceImpl层 编辑校验登录状态 ThreadLocal 登录拦截器 添加拦截器到Config Controller层实现 基于Redis ServiceImpl 新增刷新拦截器 添加拦截器到Config 基于Session Controller层 /*** 发送手机验证码*/PostMappi…...
对话机器人技术解说
一、RAG介绍 如何不通过微调模型来提高LLM性能,检索增强生成(RAG)是未来的发展方向。 Embedding:将文档的句子或单词块转换为数字向量。就向量之间的距离而言,彼此相似的句子应该很近,而不同的句子应该离…...
红黑树底层封装map、set C++
目录 一、框架思考 三个问题 问题1的解决 问题2的解决: 问题3的解决: 二、泛型编程 1、仿函数的泛型编程 2、迭代器的泛型编程 3、typename: 4、/--重载 三、原码 红黑树 map set 一、框架思考 map和set都是使用红黑树底层&…...
压力给到 Google,OpenAI 发布 GPT-4o 来了
北京时间5月14日凌晨1点,OpenAI 开启了今年的第一次直播,根据官方消息,这次旨在演示 ChatGPT 和 GPT-4 的升级内容。在早些时候 Sam Altman 在 X 上已经明确,「我们一直在努力开发一些我们认为人们会喜欢的新东西,对我…...
【SpringSecurity源码】过滤器链加载流程
theme: smartblue highlight: a11y-dark 一、前言及准备 1.1 SpringSecurity过滤器链简单介绍 在Spring Security中,过滤器链(Filter Chain)是由多个过滤器(Filter)组成的,这些过滤器按照一定的顺序对进…...
第9章.Keil5-MDK软件简介
目录 0. 《STM32单片机自学教程》专栏 9.1 主界面 9.2 文本格式编辑 9.3 代码提示&语法检测&代码模版 9.4 其他小技巧 9.4.1 TAB 键的妙用 9.4.2 快速定位函数/变量被定义的地方 9.4.3 快速注释与快速消注释 9.4.4 快速打开头文件 9.4.5 查找替换…...
mysql中utf8字符集中文字节长度统计如何统计到2个字节一个汉字
在 MySQL 的 utf8 字符集中(也被称为 utf8mb3),中文字符实际上并不是用2个字节来表示的,而是使用3个字节。这是 UTF-8 编码的一个特性,它使用1到4个字节来表示一个字符,具体取决于字符的 Unicode 码点。 对…...
如何实现Linux双网卡同时连接内网和外网的配置?
博主猫头虎的技术世界 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能! 专栏链接: 🔗 精选专栏: 《面试题大全》 — 面试准备的宝典!《IDEA开发秘籍》 — 提升你的IDEA技能!《100天精通鸿蒙》 …...
ASCLL码表以及字符的相加减
ASCLL码表完整版及解释_acssll码-CSDN博客 #include <getopt.h> #include <stdio.h> #include <stdlib.h>#define MAX_PATH 256 char filename[MAX_PATH 5];int isdigit(int c) {if (c > 0 && c < 9)return 1;return 0; }int main(int argc…...
一键修复所有dll缺失,教大家解决丢失的dll文件
修复所有DLL(动态链接库)文件缺失的问题通常不可能通过单一的"一键修复"按钮来实现,因为DLL文件缺失可能由各种不同的原因导致,比如应用程序安装不正确、病毒感染、或系统文件损坏等。 使用内置的系统文件检查器&#x…...
wsl2安装rancher并导入和创建k8s集群
环境准备 安装wsl2点击此文]ubuntu20.04安装docker 点击此文,安装完成后docker镜像仓库改成阿里云镜像加速地址.如果不熟请点击此文 docker 安装rancher 启动wsl,根据官方文档以root身份执行 sudo docker run -d --restartunless-stopped -p 80:80 -p 443:443 --privileged …...
内网环境ubuntu设置静态ip、DNS、路由,不影响网络访问
内网环境通常是有线的,通过服务器的ip、mac、dns地址访问网络才生效的,如果ip地址变了,就不能访问网络了。 如果你的ip地址变了,或者要防止ip变更影响网络访问,就要设置 1、依次点击右上角的电源-设置,在打…...
学习前端第三十七天(静态属性静态方法、类检查、错误处理)
一、静态属性和静态方法 1、静态属性静态方法 在属性和方法前加上static,创建属于类自己的属性和方法 class Person {// 加static,属于类自己的static name "xc"; // 类的name属性static height 183; // 类的height属性static age 20;…...
全网最全的基于电机控制的38类simulink仿真全家桶----新手大礼包
整理了基于电机的38种simulink仿真全家桶,包含多种资料,类型齐全十分适合新手学习使用。包括但是不局限于以下: 1、基于多电平逆变器的无刷直流电机驱动simulink仿真 2、基于负载转矩的感应电机速度控制simulink仿真 3、基于滑膜观测器的永…...
Python使用asyncio包实现异步编程
1. 异步编程 异步编程是一种编程范式,用于处理程序中需要等待异步操作完成后才能继续执行的情况。异步编程允许程序在执行耗时的操作时不被阻塞,而是在等待操作完成时继续执行其他任务。这对于处理诸如文件 I/O、网络请求、定时器等需要等待的操作非常有…...
FPGA验证核心:Vivado中功能与代码覆盖率的实战指南
1. 项目概述:为什么验证是FPGA开发的重中之重? 如果你刚接触FPGA开发,可能会觉得写代码(HDL)是最核心、最花时间的部分。但等你真正上手几个项目,尤其是那些需要流片或者部署到关键系统的项目后,…...
Linux音频驱动开发实战:为TLV320ADC5120编写ALSA Codec驱动
1. 项目概述:从一块“哑巴”音频芯片到Linux系统的“耳朵”最近在折腾一块基于TI TLV320ADC5120的音频采集板,想把它接到我的RK3568开发板上用。芯片手册、硬件原理图都齐了,但一上电,系统里arecord -l根本找不到设备,…...
python系列【仅供参考】:mongo4.0.0 加用户认证 motor和pymongo的auth连接
mongo4.0.0 加用户认证 && motor和pymongo的auth连接 mongo4.0.0 加用户认证 摘要 一. 数据库版本 二. 为mongo 添加用户认证 1. 创建超级用户 3. 开启auth 4.重启mongo 5. 添加库用户 三.验证 四.pymongo,motor连接 摘要 正文 mongo4.0.0 加用户认证 摘要 本文介绍…...
你的耳机真的在发挥全部潜力吗?Equalizer APO带来的音频革命
你的耳机真的在发挥全部潜力吗?Equalizer APO带来的音频革命 【免费下载链接】equalizerapo Equalizer APO mirror 项目地址: https://gitcode.com/gh_mirrors/eq/equalizerapo 你有没有过这样的体验?花了几千块钱买来的高端耳机,播放…...
通俗易懂的C++前缀和与差分算法图文示例详解
1、前缀和 前缀和是指某序列的前n项和,可以把它理解为数学上的数列的前n项和,而差分可以看成前缀和的逆运算。合理的使用前缀和与差分,可以将某些复杂的问题简单化。 2、前缀和算法有什么好处? 先来了解这样一个问题:…...
番茄小说下载器:3分钟构建个人离线图书馆的终极指南
番茄小说下载器:3分钟构建个人离线图书馆的终极指南 【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版 项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 还在为小说网站广告太多而烦恼吗?想要随时随地离线…...
如何免费下载抖音无水印视频:开源工具完整使用指南
如何免费下载抖音无水印视频:开源工具完整使用指南 【免费下载链接】douyin_downloader 抖音短视频无水印下载 win编译版本下载:https://www.lanzous.com/i9za5od 项目地址: https://gitcode.com/gh_mirrors/dou/douyin_downloader 还在为抖音视频…...
ceshi1
进入2026年,企业数字化转型已从“流程数字化”全面转向“认知自动化”。 据最新行业数据显示,企业内部超过85%的数据以PDF、图片、音视频、扫描件等非结构化形式存在。 这些数据曾被视为“沉默的资产”,因为传统OCR或规则引擎难以处理其复杂的…...
视频怎么转文字?文案如何高效提取?2026最实用的方法和工具全测评
为什么要把视频转成文字在内容创作、会议记录、课程整理等场景中,视频转文字的需求越来越普遍。相比直接看视频,文字版本可以快速检索关键信息、便于引用、降低信息获取的时间成本。2026年,AI转录技术已经足够成熟,一条视频从上传…...
SteamVR Unity插件实战:解决VR开发中的三大核心挑战
SteamVR Unity插件实战:解决VR开发中的三大核心挑战 【免费下载链接】steamvr_unity_plugin SteamVR Unity Plugin - Documentation at: https://valvesoftware.github.io/steamvr_unity_plugin/ 项目地址: https://gitcode.com/gh_mirrors/st/steamvr_unity_plug…...
