news 2026/2/18 2:12:19

迁移学习还没整理好

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
迁移学习还没整理好

参考文献:

1. (60 封私信 / 30 条消息) 对比学习(Contrastive Learning)概述 - 知乎

2.(60 封私信 / 30 条消息) 自监督学习和无监督 - 知乎

3.(60 封私信 / 30 条消息) 多模态视觉理解代理任务总结 - 知乎

4. 一文读懂迁移学习:从理论到实践-CSDN博客

5.(60 封私信 / 30 条消息) Transfer learning 【迁移学习综述_汇总】 - 知乎

协变量偏移(Covariate Shift)、标签偏移(Label Shift)和概念偏移(Concept Drift)等会造成数据分布差异,数据分布偏移会导致模型性能衰竭,造成模型泛化能力不足。因此我们可以引入领域自适应与迁移学习以提升模型的泛化能力。

迁移学习:通过复用预训练模型的知识,加速新任务的学习过程。其有效性源于两个基本假设:低层特征的可迁移性和任务相关性的存在。

领域自适应:通过调整模型参数或特征表示,使源域(Source Domain)训练的模型能够适应目标域(Target Domain)的数据分布。其核心思想在于构建领域不变性特征(Domain-Invariant Features),使模型在特征空间中忽略领域特异性信息。(是迁移学习中的一个重要分支)

一、迁移学习

(1)迁移理论三大基础学说:

(2)根据源领域和目标领域的不同,迁移学习可以分为以下几种类型:

(3)参考 A Survey on Deep Transfer Learning 迁移学习可以分为四类,分别是基于实例 、基于映射 、基于网络 、基于对抗四种。

这也是 A Survey on Deep Transfer Learning 提出的图

二、领域自适应(还没整理好.jpg

自监督学习为迁移学习提供高质量的基础模型。

三、自监督学习

解释:

(1) 定义:通过最大化相关样本之间的相似性并最小化不相关样本之间的相似性来学习数据表示。如图中使正向增强与原始图像相似性最大化,原始图像与不相干图像相似性最小化。

(2)对比学习常用框架:

参考(60 封私信 / 30 条消息) 对比学习(Contrastive Learning)概述 - 知乎

  • 如果是生成式对比学习,则使用MSE(出自BYOL)来作为损失函数:
  • 如果是判别式对比学习,则使用InfoNCE(出自CPC)来作为损失函数:
  • 损失函数:
  • encoder常用框架:SimSiam(集成了SimCLR、MoCo、BYOL、SwAV)
  • 常见实例:自监督学习任务包括图像旋转预测、图像拼图、对比学习、掩码语言模型(如 BERT)等。
  • 对比学习:(经典)
  • 代理任务(Proxy Tasks):利用无标注数据,通过构造合理的任务驱动模型学习,提升其在下游任务的表现。
  • 隐式监督信号:从数据本身的结构、属性或变换中自动推导出的监督信号,而不是由人工标注提供的显式标签。
  • 自监督学习定义:利用未标记数据来训练模型,是无监督学习的一种,被广泛运用于模型的预训练。
  • 自监督学习VS无监督学习:(important)我最开始一直认为这俩是等价的,但是后面发现两者还是有区别的。自监督学习属于无监督学习,但通过构造代理任务,使其更接近监督学习的范式(有明确的输入-伪标签对),通过隐式监督信号提升模型的特征提取能力。弥补了传统无监督学习(如聚类)在表示学习上的不足。
  • 领域自适应方法:
  • 基于对抗:在生成对抗性网络(GAN)的启发下,引入对抗性技术,寻找既适用于源域又适用于目标域的可迁移表达。它基于这样的假设:“为了有效的迁移,良好的表征应该是对主要学习任务的区别性,以及对源域和目标域的不加区分。”
  • 基于网络:将原领域中预先训练好的部分网络,包括其网络结构和连接参数,重新利用,将其转化为用于目标领域的深度神经网络的一部分。
  • 基于映射:Target Domain 和 Source Domain 具有不同的分布,基于映射的迁移学习是将实例从源域和目标域映射到新的数据空间。
  • 基于实例:在source domain中的数据挑挑拣拣,选择符合Target domain约束空间的数据,让这些挑出来的数据和target domain中数据一块训练。
  • 同构迁移学习:源领域和目标领域的数据具有相同的特征空间和数据分布,但任务不同。例如,从识别手写数字 0 - 9 的任务迁移到识别字母 A - Z 的任务。
  • 异构迁移学习:源领域和目标领域的数据具有不同的特征空间或数据分布。比如,将从图像领域学习到的知识迁移到文本领域。
  • 跨任务迁移学习:源领域和目标领域的任务类型不同,如从图像分类任务迁移到图像分割任务。
  • 形式训练说——模型训练 e.g:预训练模型
  • 相同要素说——数据基础 e.g:基于参数共享、基于特征共享
  • 概括化理论说——概念学习
  • 迁移学习定义:从一个任务(源领域)学到的知识(模型参数、特征表示等),应用到另一个不同但相关的任务(目标领域)上。
  • 迁移学习分类:
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/16 10:07:00

FPGA应用开发和仿真【3.6】

7.8 PID控制器 PID控制器广泛用于控制系统,控制系统中的数字控制部分也是数字信号处理系统的一种。典型的数字PID控制器如图7-63所示,它由前向欧拉法转换连续时间PID控制器而来,其P、I、D三个参数,分别为比例、积分、微分系数,而N用于配置微分单元中滤波器的极点,将有助…

作者头像 李华
网站建设 2026/2/15 23:57:43

四川西昌电器门店:30年本地老店,5大优势让你买电器不踩坑!

【四川西昌京东家电】哪家好:专业深度测评开篇:定下基调随着西昌市民对家电品质与服务需求的提升,选择一家靠谱的家电门店成为关键。本次测评聚焦四川西昌家电市场,旨在通过客观数据与真实体验,为消费者提供权威选购参…

作者头像 李华
网站建设 2026/2/16 5:49:49

python 学习笔记(文件和目录操作)

创建目录 os.makedirs可以递归的创建目录结构。 import os os.makedirs(tmp/python/test,exist_okTrue) #exit_ok True指定了,如果某个要创建的目录已经存在,也不报错删除文件或目录 os.remove 可以删除一个文件 os.remove(test.py)**shutil.rmtree()**…

作者头像 李华
网站建设 2026/2/16 20:11:17

实验一 安全威胁与攻击实验

一、实验目的安全威胁与攻击实验与理论教学第一章信息安全概论相对应。本实验在学生完成MAC地址欺骗攻击与防御实验、OSPF路由项欺骗攻击和防御实验的基础上,使学生能够理解威胁、攻击、资产的关系,并理解基本安全设计原则的重要性。具体如下&#xff1a…

作者头像 李华
网站建设 2026/2/17 4:30:25

二十一、pinctrl子系统

前言 前面我们写的GPIO驱动程序都是自己在驱动里面定义好gpio引脚需要用到的寄存器,然后在驱动程序里面直接去配置这些寄存器。Linux是一个成熟的,跨平台的通用操作系统,对于配置引脚这样的最基本的功能,是已经有一套现成的框架可…

作者头像 李华
网站建设 2026/2/17 11:53:55

Java Web 社区医院信息平台系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】

摘要 随着信息技术的快速发展,传统社区医院的管理模式已难以满足现代医疗服务的需求。社区医院在日常运营中涉及患者信息管理、医生排班、药品库存、预约挂号等多方面业务,传统的手工记录或单机系统存在效率低下、数据易丢失、信息共享困难等问题。为了提…

作者头像 李华