当前位置：首页 > news >正文

Transfer Learning（迁移学习）

news 2026/5/16 0:01:48

1. 什么是迁移学习

迁移学习(Transfer Learning)是一种机器学习方法，就是把为任务 A 开发的模型作为初始点，重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务，虽然大多数机器学习算法都是为了解决单个任务而设计的，但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。迁移学习对人类来说很常见，例如，我们可能会发现学习识别苹果可能有助于识别梨，或者学习弹奏电子琴可能有助于学习钢琴。

找到目标问题的相似性，迁移学习任务就是从相似性出发，将旧领域(domain)学习过的模型应用在新领域上。

2. 为什么需要迁移学习？

大数据与少标注的矛盾：虽然有大量的数据，但往往都是没有标注的，无法训练机器学习模型。人工进行数据标定太耗时。
大数据与弱计算的矛盾：普通人无法拥有庞大的数据量与计算资源。因此需要借助于模型的迁移。
普适化模型与个性化需求的矛盾：即使是在同一个任务上，一个模型也往往难以满足每个人的个性化需求，比如特定的隐私设置。这就需要在不同人之间做模型的适配。
特定应用（如冷启动）的需求。

3. 迁移学习的基本问题有哪些？

基本问题主要有3个：

How to transfer：如何进行迁移学习？（设计迁移方法）
What to transfer：给定一个目标领域，如何找到相对应的源领域，然后进行迁移？（源领域选择）
When to transfer：什么时候可以进行迁移，什么时候不可以？（避免负迁移）

4. 迁移学习有哪些常用概念？

基本定义
- 域(Domain)：数据特征和特征分布组成，是学习的主体
  - 源域 (Source domain)：已有知识的域
  - 目标域 (Target domain)：要进行学习的域
- 任务 (Task)：由目标函数和学习结果组成，是学习的结果
按特征空间分类
- 同构迁移学习（Homogeneous TL）：源域和目标域的特征空间相同，
- 异构迁移学习（Heterogeneous TL）：源域和目标域的特征空间不同，
按迁移情景分类
- 归纳式迁移学习（Inductive TL）：源域和目标域的学习任务不同
- 直推式迁移学习（Transductive TL)：源域和目标域不同，学习任务相同
- 无监督迁移学习（Unsupervised TL)：源域和目标域均没有标签
按迁移方法分类
- 基于样本的迁移 (Instance based TL)：通过权重重用源域和目标域的样例进行迁移
  
  基于样本的迁移学习方法 (Instance based Transfer Learning) 根据一定的权重生成规则，对数据样本进行重用，来进行迁移学习。下图形象地表示了基于样本迁移方法的思想源域中存在不同种类的动物，如狗、鸟、猫等，目标域只有狗这一种类别。在迁移时，为了最大限度地和目标域相似，我们可以人为地提高源域中属于狗这个类别的样本权重。
- 基于特征的迁移 (Feature based TL)：将源域和目标域的特征变换到相同空间
  
  基于特征的迁移方法 (Feature based Transfer Learning) 是指将通过特征变换的方式互相迁移,来减少源域和目标域之间的差距；或者将源域和目标域的数据特征变换到统一特征空间中,然后利用传统的机器学习方法进行分类识别。根据特征的同构和异构性,又可以分为同构和异构迁移学习。下图很形象地表示了两种基于特征的迁移学习方法。
- 基于模型的迁移 (Parameter based TL)：利用源域和目标域的参数共享模型
  
  基于模型的迁移方法 (Parameter/Model based Transfer Learning) 是指从源域和目标域中找到他们之间共享的参数信息,以实现迁移的方法。这种迁移方式要求的假设条件是：源域中的数据与目标域中的数据可以共享一些模型的参数。下图形象地表示了基于模型的迁移学习方法的基本思想。
- 基于关系的迁移 (Relation based TL)：利用源域中的逻辑网络关系进行迁移
  
  基于关系的迁移学习方法 (Relation Based Transfer Learning) 与上述三种方法具有截然不同的思路。这种方法比较关注源域和目标域的样本之间的关系。下图形象地表示了不同领域之间相似的关系。

5. 迁移学习与传统机器学习有什么区别？

	迁移学习	传统机器学习
数据分布	训练和测试数据不需要同分布	训练和测试数据同分布
数据标签	不需要足够的数据标注	足够的数据标注
建模	可以重用之前的模型	每个任务分别建模

6. 迁移学习的核心及度量准则？

迁移学习的总体思路可以概括为：开发算法来最大限度地利用有标注的领域的知识，来辅助目标领域的知识获取和学习。

迁移学习的核心是：找到源领域和目标领域之间的相似性，并加以合理利用。这种相似性非常普遍。比如，不同人的身体构造是相似的；自行车和摩托车的骑行方式是相似的；国际象棋和中国象棋是相似的；羽毛球和网球的打球方式是相似的。这种相似性也可以理解为不变量。以不变应万变，才能立于不败之地。

**有了这种相似性后，下一步工作就是，如何度量和利用这种相似性。**度量工作的目标有两点：一是很好地度量两个领域的相似性，不仅定性地告诉我们它们是否相似，更定量地给出相似程度。二是以度量为准则，通过我们所要采用的学习手段，增大两个领域之间的相似性，从而完成迁移学习。

一句话总结：相似性是核心，度量准则是重要手段。

7. 迁移学习与其他概念的区别？

迁移学习与多任务学习关系：
- 多任务学习：多个相关任务一起协同学习；
- 迁移学习：强调信息复用，从一个领域(domain)迁移到另一个领域。
迁移学习与领域自适应：领域自适应：使两个特征分布不一致的domain一致。
迁移学习与协方差漂移：协方差漂移：数据的条件概率分布发生变化。

8. 什么情况下可以使用迁移学习？

迁移学习最有用的场合是，如果你尝试优化任务B的性能，通常这个任务数据相对较少。例如，在放射科中你知道很难收集很多射线扫描图来搭建一个性能良好的放射科诊断系统，所以在这种情况下，你可能会找一个相关但不同的任务，如图像识别，其中你可能用 1 百万张图片训练过了，并从中学到很多低层次特征，所以那也许能帮助网络在任务在放射科任务上做得更好，尽管任务没有这么多数据。

假如两个领域之间的区别特别的大，不可以直接采用迁移学习，因为在这种情况下效果不是很好。在这种情况下，推荐以上的方法，在两个相似度很低的domain之间一步步迁移过去（踩着石头过河）。

9. 什么是finetune？

度网络的finetune也许是最简单的深度网络迁移方法。Finetune,也叫微调、fine-tuning, 是深度学习中的一个重要概念。简而言之，finetune就是利用别人己经训练好的网络，针对自己的任务再进行调整。从这个意思上看，我们不难理解finetune是迁移学习的一部分。

为什么需要已经训练好的网络？

在实际的应用中,我们通常不会针对一个新任务,就去从头开始训练一个神经网络。这样的操作显然是非常耗时的。尤其是，我们的训练数据不可能像ImageNet那么大，可以训练出泛化能力足够强的深度神经网络。即使有如此之多的训练数据,我们从头开始训练,其代价也是不可承受的。

为什么需要 finetune？

因为别人训练好的模型,可能并不是完全适用于我们自己的任务。可能别人的训练数据和我们的数据之间不服从同一个分布；可能别人的网络能做比我们的任务更多的事情；可能别人的网络比较复杂,我们的任务比较简单。

10. 什么是深度网络自适应？

深度网络的 finetune 可以帮助我们节省训练时间，提高学习精度。但是 finetune 有它的先天不足:它无法处理训练数据和测试数据分布不同的情况。而这一现象在实际应用中比比皆是。因为 finetune 的基本假设也是训练数据和测试数据服从相同的数据分布。这在迁移学习中也是不成立的。因此，我们需要更进一步，针对深度网络开发出更好的方法使之更好地完成迁移学习任务。

以我们之前介绍过的数据分布自适应方法为参考，许多深度学习方法都开发出了自适应层(AdaptationLayer)来完成源域和目标域数据的自适应。自适应能够使得源域和目标域的数据分布更加接近，从而使得网络的效果更好。

11. GAN在迁移学习中的应用

生成对抗网络 GAN(Generative Adversarial Nets) 受到自博弈论中的二人零和博弈 (two-player game) 思想的启发而提出。它一共包括两个部分：

一部分为生成网络(Generative Network)，此部分负责生成尽可能地以假乱真的样本，这部分被成为生成器(Generator)；
另一部分为判别网络(Discriminative Network), 此部分负责判断样本是真实的，还是由生成器生成的，这部分被成为判别器(Discriminator) 生成器和判别器的互相博弈，就完成了对抗训练。

GAN 的目标很明确：生成训练样本。这似乎与迁移学习的大目标有些许出入。然而，由于在迁移学习中，天然地存在一个源领域，一个目标领域，因此，我们可以免去生成样本的过程，而直接将其中一个领域的数据 (通常是目标域) 当作是生成的样本。此时，生成器的职能发生变化，不再生成新样本，而是扮演了特征提取的功能：不断学习领域数据的特征使得判别器无法对两个领域进行分辨。这样，原来的生成器也可以称为特征提取器 (Feature Extractor)。

Transfer Learning（迁移学习）

1. 什么是迁移学习迁移学习(Transfer Learning)是一种机器学习方法，就是把为任务 A 开发的模型作为初始点，重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务，虽然大多数机器学习算法都…...

编程日记 2023/12/26 2:56:55

NPM 的使用技巧：简化 JavaScript 开发和依赖管理

前言 NPM（Node Package Manager）是 JavaScript 生态系统中最流行的包管理工具之一。本文将介绍一些有用的 NPM 使用技巧，帮助开发者更好地利用 NPM 管理项目依赖、执行脚本、发布自己的包以及解决常见问题。 1. 初始化项目使用 NPM 初始化…...

编程日记 2023/12/26 2:53:52

统计和绘图软件GraphPad Prism mac功能特点

GraphPad Prism mac是一款专业的统计和绘图软件，主要用于生物医学研究、实验设计和数据分析。 GraphPad Prism mac功能和特点数据导入和整理：GraphPad Prism 可以导入各种数据格式，并提供直观的界面用于整理、编辑和管理数据。用户可以轻松…...

编程日记 2023/12/26 2:52:51

WWW 指南-万维网联盟(World Wide Web)

WWW - 万维网联盟 WWW通常称为网络。 web是一个世界各地的计算机网络。电脑在Web上使用标准语言沟通。万维网联盟（W3C）制定了Web标准什么是WWW？ WWW 代表 World Wide Web(万维网)万维网常常被称为网络网络是世界各地的计算机网络网络中…...

编程日记 2023/12/26 2:50:49

Linux网络编程之TCP/IP实现高并发网络服务器设计指南

目录引言： 多进程服务器例程分享： 多线程服务器例程分享： I/O多路复用服务器 select 例程分享： poll 例程分享： epoll 例程分享： 总结建议引言： 随着互联网的迅猛发展&#xff…...

编程日记 2023/12/26 2:48:47

【SpringBoot实战】基于阿里云实现文件上传

【SpringBoot实战】基于阿里云实现文件上传在实际项目开发中，不可避免地会使用到阿里云OSS进行文件存储。尽管阿里云有详细的开发文档，但本篇博客的目的是让我们能够用简明的代码快速实现这个功能。引入依赖 <dependencies><!-- 阿里云oss…...

编程日记 2023/12/26 2:45:44

大数据技术学习笔记（十一）—— Flume

目录 1 Flume 概述1.1 Flume 定义1.2 Flume 基础架构 2 Flume 安装3 Flume 入门案例3.1 监控端口数据3.2 实时监控单个追加文件3.3 实时监控目录下多个新文件3.4 实时监控目录下的多个追加文件 4 Flume 进阶4.1 Flume 事务4.2 Flume Agent 内部原理4.3 Flume 拓扑结构4.3.1 简单…...

编程日记 2023/12/26 2:43:42

电路设计时，继电器线圈、风扇电机绕组等感性负载必须有续流二极管。

续流二极管（也常被称为“自由轮流二极管”或“反向并联二极管”）在感性负载电路中的应用非常重要，尤其是在继电器线圈、风扇电机绕组等设备中。感性负载是指那些在其线圈中会产生感应电动势的负载，例如电动机、变压器和继电器等。当这些设备的电源被切断时，它们的线圈会因…...

编程日记 2023/12/26 2:41:41

Mongodb基础介绍与应用场景

NoSql 解决方案第二种 Mongodb MongoDB 是一款开源高性能无模式的文档型数据库当然它是NoSql数据库中的一种是最像关系型数据库的非关系型数据库首先最需要注意的是无模式的文档型数据库这个需要后面我们看到它的数据才能明白其次是最像关系型数据库的非关系型数据…...

编程日记 2023/12/26 2:37:34

mysql参数配置binlog

官网地址： MySQL :: MySQL Replication :: 2.6.4 Binary Logging Options and Variables 欢迎关注留言，我是收集整理小能手，工具翻译，仅供参考，笔芯笔芯. MySQL 复制 / ... / 二进制日志记录选项和变量 2.6.4 二进…...

编程日记 2023/12/26 2:35:32

pytorch常用的几个函数详解

文章目录 view基本用法自动计算维度保持原始数据不变 t函数功能语法返回值示例注意事项 permute() 函数基本概念permute() 函数的使用 unsqueeze() 函数基本概念unsqueeze() 函数的使用 squeeze() 函数基本概念squeeze() 函数的使用 transpose() 函数基本概念transpose() 函数的…...

编程日记 2023/12/26 2:34:31

Linux下安装Flume

1 下载Flume Welcome to Apache Flume — Apache Flume 下载1.9.0版本 2 上传服务器并解压安装 3 删除lib目录下的guava-11.0.2.jar （如同服务器安装了hadoop，则删除，如没有安装hadoop则保留这个文件，否则无法启动flume&#…...

编程日记 2023/12/26 2:33:30

20231225使用BLE-AnalyzerPro WCH升级版BLE-PRO蓝牙分析仪抓取BLE广播数据

20231225使用BLE-AnalyzerPro WCH升级版BLE-PRO蓝牙分析仪抓取BLE广播数据 2023/12/25 20:05 结论：硬件蓝牙分析仪不一定比手机端的APK的效果好！ 亿佰特E104-2G4U04A需要3片【单通道】，电脑端的UI为全英文的。 BLE-AnalyzerPro WCH升级版B…...

编程日记 2023/12/26 2:28:25

.net6使用Sejil可视化日志

（关注博主后，在“粉丝专栏”，可免费阅读此文） 之前介绍了这篇.net 5使用LogDashboard_.net 5logdashboard rootpath-CSDN博客这篇文章将会更加的简单，最终的效果都是可视化日志。在程序非常庞大的时候&…...

编程日记 2023/12/26 2:26:23

mysql(51) : 大数据导出为insert

代码 import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.math.BigDecimal; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.Objects;public class 大数据导出为insert {public …...

编程日记 2023/12/26 2:25:21