声明:仅用于自学。部分内容来自于网络,如有问题,请联系删除。

英文原文的官方网站,仅供参考:https://www.deeplearningbook.org/

第一章:引言

绪论3

   表示学习算法的典型示例是自编码器(autoencoder)。 自编码器是编码器(encoder)函数和解码器(decoder)函数的组合。编码器将输入的数据转换为一种不同的表示形式,解码器则可将新的表示转换回原先的形式。自编码器经过训练可以在编解码的过程中,保留尽可能多的信息。同时它们也会在训练后得新的表示产生好的特性。 为了实现不同的特性,我们可以设计多个自编码器。
  在设计特征或用于学习特征的算法时,我们的目标通常是分离出变差因素(factors of variation),用于解释观察数据。在此背景下,“因素”一词来指代具备影响力的不同来源;因素通常不满足乘法结合律。这些因素通常不是直接就能观察到的量。相反,它们可能是物理世界中未观察到的物体或不可预测的力,但它们会影响可观察到的量。为了对观察到的数据提供有用的简化解释或推断其原因,它们也可能以概念的构造形式存在在人类的思维中,可以将它们视为可以帮助我们理解数据丰富变化性的概念或抽象。分析语音记录时,变差因素包括说话者的年龄,性别,口音和说的语言。分析汽车图像时,变差因素包括汽车的位置,颜色,以及太阳的角度和亮度。
  在许多现实世界的人工智能应用中,困难的主要来源是:多个变差因素同时影响着我们观察到的每个数据。 比如:红色汽车在傍晚时分,其图像的各个像素可能非常接近黑色。 还有,汽车轮廓的形状取决于视角。大多数应用程序都要求我们厘清(disentangle)变差因素,并忽略不重要的因素。
  显然,从原始数据中提取这种高层次、抽象的特征可能非常困难。很多诸如说话口音这些变差因素,只能通过对数据进行复杂的,近乎人类的理解来识别。 当获取表示与解决原问题几乎一样困难时,乍一看,表示学习似乎对我们就没有帮助了。
  深度学习(Deep learning)通过用其他更简单的表示形式表达复杂表示,解决了表示学习中的核心问题。深度学习使计算机能够从更简单的概念中构建复杂的概念。 图1.2显示了深度学习系统如何通过组合更简单的概念(例如拐角和轮廓,这些又由边线来定义)来表示图像中人的概念。
《深度学习》学习笔记 【第一章:引言】 绪论-3

相关文章: