当前位置：首页 > news >正文

[TI] [Textual Inversion] An image is worth an word

news 2026/5/19 15:37:22

自己的理解：

根据几个图像，找出来一个关键字可以代表它们，然后我们可以再用这个关键字去生成新的东西。

提出关键字

1 Introduction

word->token->embedding

Textual Inversion过程

需要：

① a fixed, pre-trained text-to-image model （一个固定的预训练模型）

② a small image set depicting the concept（一个描述概念的小图像集）

目标：

find a single word embedding, such that "A photo of S*" will lead to the reconstructions of images from our small set

3 Method

LDM

包含两个核心组件：

1.AutoEncoder

Encoder，把

Decoder

2.Diffusion Model

LDM Loss

Text embedding

典型的文本编码器（例如 BERT）都从文本处理步骤开始

① word (in a input string) convert to a token ( an index in some pre-defined dictionary某个预定义词典中的索引)

构建一个词汇表，包含数据集中出现的所有唯一token，通常是一个字典，将每个token映射到唯一的整数ID。

②each token then linked to a embedding vector (可以通过基于索引的查找来检索。)

对于每个token，使用词汇表的ID可以查找其对应的 embedding vector。

③learned as part of the text encoder c_{\theta}

in our work

定义一个 placeholder string S_*，表示我们想要学习的 new concept

干涉 embedding process，用 embedding v_* 取代与标记符相关的向量（本质上是把这个词注入到我们的词典中）

小结：

一串字符串文本，它的每个词可以通过分词器变为若干个 token，每个token可以映射到一个词向量，我们通过干预它映射词向量的过程，学得一个可以代表新特征的伪词。

Text Inversion

用 3-5张图片 depict 目标概念。

通过直接优化的方式，最小化 LDM loss，就可以找到 v_*

优化目标：

保持 \epsilon_{\theta} ,c_{\theta} 不变，重新训练LDM，来找到 V_*

小结：

通过几张图片输入到网络中，依据LDM loss，固定某些参数不变，来找到最合适的 V_*

参考资料：

Textual Inversion · AUTOMATIC1111/stable-diffusion-webui Wiki · GitHub

[TI] [Textual Inversion] An image is worth an word

自己的理解： 根据几个图像，找出来一个关键字可以代表它们，然后我们可以再用这个关键字去生成新的东西。提出关键字 1 Introduction word->token->embedding Textual Inversion过程需要： ① a fixed, pre-trained text…...

编程日记 2023/9/26 5:02:55

remote: The project you were looking for could not be found

git拉取公司项目时报错： remote: The project you were looking for could not be found 发生这个问题的原因，在于git账号可能并未真正登录。我们可以通过打开电脑的凭据管理器，查看git当前的登录是否正常。参考链接：参考...

编程日记 2023/9/26 5:01:54

https跳过SSL认证时是不是就是不加密的,相当于http?

https跳过SSL认证时是不是就是不加密的,相当于http?，其实不是，HTTPS跳过SSL认证并不相当于HTTP，也不意味着没有加密。请注意以下几点： HTTPS（Hypertext Transfer Protocol Secure）本质上是在HTTP的基础上…...

编程日记 2023/9/26 4:59:51

linux下链接

linux下链接用法 ln链接格式与介绍 linux下链接用法一、链接的使用格式二、链接的介绍一、链接的使用格式链接： 格式： ln 源文件链接文件硬链接 ln -s 源文件链接文件软连接硬链接文件占磁盘空间但是删除源文件不会影响硬链接文件软链接文件不…...

编程日记 2023/9/26 4:58:51

OpenCV项目开发实战--主成分分析（PCA）的特征脸应用(附C++/Python实现源码)

什么是主成分分析？这是理解这篇文章的先决条件。图 1：使用蓝线和绿线显示 2D 数据的主要组成部分（红点）。快速回顾一下，我们了解到第一个主成分是数据中最大方差的方向。第二主成分是空间中与第一主成分垂直（正交）的最大方差方向，依此类推。第一和第二主成分红点（2…...

编程日记 2023/9/26 4:57:50

多层感知机——MLP

源代码在此处：https://github.com/wepe/MachineLearning/tree/master/DeepLearning Tutorials/mlp 一、多层感知机（MLP）原理简介多层感知机（MLP，Multilayer Perceptron）也叫人工神经网络（ANN&…...

编程日记 2023/9/26 4:54:46

HttpClientr入门

HttpClientr入门介绍 HttpClient是Apache Jakarta Common下的子项目，可以用来提供高效的，最新的、功能丰富的支持HTTP协议的客户端编程工具包，并且它支持HTTP协议的版本和建议。依赖导入 <dependency><groupId>org.apache.…...

编程日记 2023/9/26 4:52:44

网关-开放API接口签名验证方案

接口安全问题请求身份是否合法？请求参数是否被篡改？请求是否唯一？ AppId&AppSecret 请求身份为开发者分配AppId（开发者标识，确保唯一）和AppSecret（用于接口加密，确保不易被…...

编程日记 2023/9/26 4:49:41

Linux知识点 -- 网络基础 -- 传输层

Linux知识点 – 网络基础 – 传输层文章目录 Linux知识点 -- 网络基础 -- 传输层一、传输层协议1.端口号2.网络相关bash命令二、UDP协议1.UDP报文的解包与交付2.理解UDP报文3.UDP协议的特点4.UDP应用层IO类接口5.UDP的缓冲区6.UDP使用注意事项7.基于UDP的应用层协议三、TCP协…...

编程日记 2023/9/26 4:47:39

计算机视觉与深度学习-经典网络解析-AlexNet-[北邮鲁鹏]

这里写目录标题 AlexNet参考文章AlexNet模型结构AlexNet共8层：AlexNet运作流程简单代码实现重要说明重要技巧主要贡献 AlexNet AlexNet 是一种卷积神经网络（Convolutional Neural Network，CNN）的架构。它是由Alex Krizhevsky、Il…...

编程日记 2023/9/26 4:46:38

Django学习笔记-实现联机对战（下）

笔记内容转载自 AcWing 的 Django 框架课讲义，课程链接：AcWing Django 框架课。 CONTENTS 1. 编写移动同步函数move_to2. 编写攻击同步函数shoot_fireball 1. 编写移动同步函数move_to 与上一章中的 create_player 同步函数相似，移动函数的同…...

编程日记 2023/9/26 4:43:35

一文了解什么SEO

搜索引擎优化 (SEO) 是一门让页面在 Google 等搜索引擎中排名更高的艺术和科学。一、搜索引擎优化的好处搜索引擎优化是在线营销的关键部分，因为搜索是用户浏览网络的主要方式之一。搜索结果以有序列表的形式呈现，网站在该列表中的排名越高&#x…...

编程日记 2023/9/26 4:42:34

SpringBoot+Jpa+Thymeleaf实现增删改查

SpringBootJpaThymeleaf实现增删改查这篇文章介绍如何使用 Jpa 和 Thymeleaf 做一个增删改查的示例。 1、pom依赖 pom 包里面添加Jpa 和 Thymeleaf 的相关包引用 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.…...

编程日记 2023/9/26 4:40:32

最快的包管理器--pnpm创建vue项目完整步骤

1.用npm全局安装pnpm npm install -g pnpm 2.在要创建vue项目的包下进入cmd，输入： pnpm create vue 3.输入项目名字，选择Router,Pinia,ESLint,Prettier之后点确定 4.cd到创建好的项目 ，安装依赖 cd .\刚创建好的项目名称\ p…...

编程日记 2023/9/26 4:39:31

算法通过村第九关-二分(中序遍历)黄金笔记|二叉搜索树

文章目录前言1. 有序数组转二叉搜索树2. 寻找连个正序数组的中位数总结前言提示：有时候，我感觉自己一辈子活在两个闹钟之间，早上的第一次闹钟，以及5分钟之后的第二次闹钟。 --奥利弗萨克斯《意识的河流》每个专题都有简单题&a…...

编程日记 2023/9/26 4:36:29

Mock.js之Element-ui搭建首页导航与左侧菜单

🎬 艳艳耶✌️：个人主页 🔥 个人专栏 ：《Spring与Mybatis集成整合》《springMvc使用》 ⛺️ 生活的理想，为了不断更新自己 ! 1、Mock.js的使用 1.1.什么是Mock.js Mock.js是一个模拟数据的生成器，用来帮助前…...

编程日记 2023/9/26 4:35:27

1. Groovy Template file [robot_results.groovy] was not found in $JENKINS_HOME/email_template 1.需要在managed files 添加robot_results.groovy。这个名字需要和配置在构建项目里default content一致（Extended E-mail Notification默认设置里Default Content…...

编程日记 2023/9/26 4:34:26

关于ElementUI之首页导航与左侧菜单实现

目录一.Mock 1.1.什么是Mock.js 1.2.特点 1.3.安装与配置 1.3.1. 安装mock.js 1.3.2.引入mock.js 1.4.mockjs使用 1.4.1.定义测试数据文件 1.4.2.mock拦截Ajax请求 1.4.3.界面代码优化二.总线 2.1.是什么 2.2.前期准备 2.3.配置组件与路由关系 2.3.1. 配置组件 …...

编程日记 2023/9/26 4:33:25

基于springboot小区疫情防控系统

博主主页：猫头鹰源码博主简介：Java领域优质创作者、CSDN博客专家、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战主要内容：毕业设计(Javaweb项目|小程序等)、简历模板、学习资料、面试题库、技术咨询文末联系获取项目介绍…...

编程日记 2023/9/26 4:31:23

【k8s】YAML语言基础

文章目录 YAML介绍语法支持的数据类型注意事项json与yaml互转 YAML介绍 YAML是一个类似于XML、JSON的标记语言。强调以数据为中心，并不是以标记语言为中心 <heima><age>15</age><address>Beijing</address> </heima>heima:age:…...

编程日记 2023/9/26 4:28:20

如何设计 Agent Harness 的默认行为与异常处理

Agent Harness 架构设计实战：默认行为规范与全链路异常处理体系从0到1落地摘要/引言你是否遇到过Agent Demo跑得好好的，一上线就频繁崩溃？大模型返回格式错乱导致整个业务链路报错？工具调用超时直接给用户返回500错误？多Agent协同的时候状态莫名丢失，只能让用户重新发…...

编程新知 2026/5/19 14:44:32

中国的未来学图书怎么没有外国强

中国的未来学图书在知识传统、市场机制、作者结构、表达方式和出版风险上，确实还没有形成像英美那样成熟的生态。国外未来学图书强，往往不是因为作者真的“预测得更准”，而是因为他们更擅长把技术趋势、商业叙事、社会想象和个人行动方案…...

编程新知 2026/5/19 14:01:25

告别复杂设置！Sunshine v0.21.0 + Moonlight安卓版：5分钟搞定家庭局域网游戏串流

5分钟极简指南：用Sunshine和Moonlight打造家庭游戏串流系统客厅的沙发上，手机屏幕突然变成了你的高性能游戏PC——这不是科幻电影，而是每个家庭都能实现的游戏串流体验。过去需要复杂网络知识才能搭建的串流系统，如今借助Sunshin…...

编程新知 2026/5/19 13:39:24

Perplexity接入知网文献搜索的5大避坑指南：实测发现92%研究者正在浪费87%检索时间

更多请点击： https://intelliparadigm.com 第一章：Perplexity接入知网文献搜索的底层逻辑与认知重构 Perplexity 作为基于大语言模型的实时问答引擎，其核心能力并非仅依赖于内部参数化知识，而是通过动态检索增强生成（…...

编程新知 2026/5/19 13:00:29

从OBD到功能安全：聊聊Autosar Dem模块里故障数据的‘生老病死’与内存管理策略

从OBD到功能安全：Autosar Dem模块中故障数据的生命周期与内存博弈当一辆现代汽车在道路上飞驰时，它的电子控制单元(ECU)内部正上演着无数微观的"生存游戏"。在Autosar Dem模块的内存空间中，每一个故障数据都如同有生命的个体&…...

编程新知 2026/5/19 12:12:46

AI视频时间一致性失效的7种隐藏诱因（GPU显存碎片化、隐空间梯度漂移、跨模态时钟不同步…业内首次系统归因）

更多请点击： https://intelliparadigm.com 第一章：AI视频时间一致性失效的系统性归因框架 AI视频生成中，时间一致性失效并非孤立现象，而是多层级模型组件、训练范式与推理机制耦合失配的结果。其根源横跨数据建模、特征传播、时序…...

编程新知 2026/5/19 12:12:14

Windows远程桌面终极解锁指南：RDP Wrapper Library完整使用教程

Windows远程桌面终极解锁指南：RDP Wrapper Library完整使用教程【免费下载链接】rdpwrap RDP Wrapper Library 项目地址: https://gitcode.com/gh_mirrors/rd/rdpwrap 还在为Windows家庭版无法使用远程桌面功能而烦恼吗？RDP Wrapper Library是您…...

编程新知 2026/5/19 10:16:12

JetBrains IDE试用期重置终极指南：三步实现无限开发体验

JetBrains IDE试用期重置终极指南：三步实现无限开发体验【免费下载链接】ide-eval-resetter 项目地址: https://gitcode.com/gh_mirrors/id/ide-eval-resetter 还在为JetBrains IDE试用期到期而烦恼吗？ide-eval-resetter是你的理想解决方案&…...

编程新知 2026/5/19 10:00:48

dropin-minimal-css框架质量评估标准：如何选择最适合的CSS框架

dropin-minimal-css框架质量评估标准：如何选择最适合的CSS框架【免费下载链接】dropin-minimal-css Drop-in switcher for previewing minimal CSS frameworks 项目地址: https://gitcode.com/gh_mirrors/dr/dropin-minimal-css 在当今前端开发的世界中&…...

编程新知 2026/5/19 9:37:54

Raspberry Pi Pico手动进入Bootloader模式：解决Arduino IDE上传失败

1. 项目概述：为什么我们需要手动进入Bootloader模式？如果你玩过Raspberry Pi Pico，并且尝试用Arduino IDE给它上传程序，大概率会遇到这么个情况：你满怀期待地点击了“上传”按钮，IDE底部的状态栏开始滚动编…...

编程新知 2026/5/19 9:35:54

[TI] [Textual Inversion] An image is worth an word

1 Introduction

3 Method

LDM

Text embedding

Text Inversion

相关文章：

[TI] [Textual Inversion] An image is worth an word

remote: The project you were looking for could not be found

https跳过SSL认证时是不是就是不加密的,相当于http?

linux下链接

OpenCV项目开发实战--主成分分析（PCA）的特征脸应用(附C++/Python实现源码)

多层感知机——MLP

HttpClientr入门

网关-开放API接口签名验证方案

Linux知识点 -- 网络基础 -- 传输层

计算机视觉与深度学习-经典网络解析-AlexNet-[北邮鲁鹏]

Django学习笔记-实现联机对战（下）

一文了解什么SEO

SpringBoot+Jpa+Thymeleaf实现增删改查

最快的包管理器--pnpm创建vue项目完整步骤

算法通过村第九关-二分(中序遍历)黄金笔记|二叉搜索树

Mock.js之Element-ui搭建首页导航与左侧菜单

robotframework在Jenkins执行踩坑

关于ElementUI之首页导航与左侧菜单实现

基于springboot小区疫情防控系统

【k8s】YAML语言基础

如何设计 Agent Harness 的默认行为与异常处理

中国的未来学图书怎么没有外国强

告别复杂设置！Sunshine v0.21.0 + Moonlight安卓版：5分钟搞定家庭局域网游戏串流

Perplexity接入知网文献搜索的5大避坑指南：实测发现92%研究者正在浪费87%检索时间

从OBD到功能安全：聊聊Autosar Dem模块里故障数据的‘生老病死’与内存管理策略

AI视频时间一致性失效的7种隐藏诱因（GPU显存碎片化、隐空间梯度漂移、跨模态时钟不同步…业内首次系统归因）

Windows远程桌面终极解锁指南：RDP Wrapper Library完整使用教程

JetBrains IDE试用期重置终极指南：三步实现无限开发体验

dropin-minimal-css框架质量评估标准：如何选择最适合的CSS框架

Raspberry Pi Pico手动进入Bootloader模式：解决Arduino IDE上传失败