下个月要入职阿里推荐算法岗,实习的任务是推荐系统+深度学习+迁移学习,但是之前对迁移学习没有了解,师兄推荐了《迁移学习简明手册》这本书,提前预习一下并做一下笔记。
迁移学习概念
迁移学习的核心问题是,找到新问题和原问题之间的相似性,才可以顺利地实现知识的 迁移。
迁移学习,是指利用数据、任务、或模型之间的相似性,将在旧领域学习过的模型,应用于 新领域的一种学习过程。
为什么要迁移学习
- 传统方法的不足
- 大数据与少标注之间的矛盾
- 大数据与弱计算之间的矛盾
- 普适化模型与个性化需求之间的矛盾
- 特定应用的需求
比如推荐系统的冷启动问题。一个新的推荐系统,没有足够 的用户数据,如何进行精准的推荐? 传统的机器学习方法疲于应对。迁移学习则可以很好地解决。
- 迁移学习的好处
- 大数据与少标注:迁移数据标注
寻找一些与目标数据相近的有标注的数据,从而利用这
些数据来构建模型,增加我们目标数据的标注 - 大数据与弱计算:模型迁移
将那些大公司在大数据上训练好的模型,迁移到我们的任务中,针对于我们的任务进行微调 - 普适化模型与个性化需求:自适应学习
对普适化模型进行灵活的调整,以便完成我们的任务 - 特定应用的需求:相似领域知识迁移
从数据和模型方法上 进行迁移学习
与机器学习的区别
什么是负迁移
- 负迁移定义
负迁移指的是,在源域上学习到的知识,对于目标域上的学习产生负面作用
迁移学习的核心问题是,找到两个领域的相似性,从而很好地完成迁移学习任务。如果这个相似性找的不合理,就会大大损害迁移学习的效果。 - 一般什么原因导致
• 数据问题:源域和目标域压根不相似,谈何迁移?
• 方法问题:源域和目标域是相似的,但是,迁移学习方法不够好,没找到可迁移的成分。
迁移学习的研究领域
迁移学习的分类可以按照四个准则进行:按目标域有无标签分、按学习方法分、按特征分、按离线与在线形式分
按目标域标签分
- 监督迁移学习
- 半监督迁移学习
- 无监督迁移学习
按学习方法分类
- 基于样本的迁移学习方法
- 基于特征的迁移学习方法
- 基于模型的迁移学习方法
- 基于关系的迁移学习方法
按特征分类
- 同构迁移学习
- 异构迁移学习
不同图片的迁移,就可以认为是同构;而图 片到文本的迁移,则是异构的
按离线与在线形式分
- 离线迁移学习
- 在线迁移学习