《深度学习》学习笔记【第一章：引言】绪论-3

声明：仅用于自学。部分内容来自于网络，如有问题，请联系删除。

英文原文的官方网站，仅供参考：https://www.deeplearningbook.org/

第一章：引言

绪论3

表示学习算法的典型示例是自编码器(autoencoder)。自编码器是编码器(encoder)函数和解码器(decoder)函数的组合。编码器将输入的数据转换为一种不同的表示形式，解码器则可将新的表示转换回原先的形式。自编码器经过训练可以在编解码的过程中，保留尽可能多的信息。同时它们也会在训练后得新的表示产生好的特性。为了实现不同的特性，我们可以设计多个自编码器。
在设计特征或用于学习特征的算法时，我们的目标通常是分离出变差因素(factors of variation)，用于解释观察数据。在此背景下，“因素”一词来指代具备影响力的不同来源；因素通常不满足乘法结合律。这些因素通常不是直接就能观察到的量。相反，它们可能是物理世界中未观察到的物体或不可预测的力，但它们会影响可观察到的量。为了对观察到的数据提供有用的简化解释或推断其原因，它们也可能以概念的构造形式存在在人类的思维中，可以将它们视为可以帮助我们理解数据丰富变化性的概念或抽象。分析语音记录时，变差因素包括说话者的年龄，性别，口音和说的语言。分析汽车图像时，变差因素包括汽车的位置，颜色，以及太阳的角度和亮度。
在许多现实世界的人工智能应用中，困难的主要来源是：多个变差因素同时影响着我们观察到的每个数据。比如：红色汽车在傍晚时分，其图像的各个像素可能非常接近黑色。还有，汽车轮廓的形状取决于视角。大多数应用程序都要求我们厘清(disentangle)变差因素，并忽略不重要的因素。
显然，从原始数据中提取这种高层次、抽象的特征可能非常困难。很多诸如说话口音这些变差因素，只能通过对数据进行复杂的，近乎人类的理解来识别。当获取表示与解决原问题几乎一样困难时，乍一看，表示学习似乎对我们就没有帮助了。
深度学习(Deep learning)通过用其他更简单的表示形式表达复杂表示，解决了表示学习中的核心问题。深度学习使计算机能够从更简单的概念中构建复杂的概念。图1.2显示了深度学习系统如何通过组合更简单的概念（例如拐角和轮廓，这些又由边线来定义）来表示图像中人的概念。
《深度学习》学习笔记【第一章：引言】绪论-3