声明:仅用于自学。部分内容来自于网络,如有问题,请联系删除。
英文原文的官方网站,仅供参考:https://www.deeplearningbook.org/
第一章:引言
绪论2
这些简单的机器学习算法的性能在很大程度上取决于给出的数据的表示(representation)。 例如,当使用逻辑回归建议剖宫产时,AI系统不会直接检查患者。 医生会告诉系统几条相关信息,例如是否存在子宫疤痕。 患者表征中包含的每条信息称为特征(feature)。逻辑回归可学习到患者的这些特征如何与各种结果建立联系。 但是,无论如何都不能影响该特征的定义。 如果仅仅给出患者MRI(核磁共振)扫描图像而不是医生的正式的文字报告,逻辑回归将无法做出有用的预测。MRI(核磁共振)扫描中的单个像素与分娩过程中可能发生的任何并发症之间的相关性可忽略不计。
在计算机科学乃至日常生活中,对表示的依赖是都普遍存在的现象。 在计算机科学中,如果对数据集进行精巧的结构化处理或者加索引,那么对数据集操作的查找速度就可以呈指数级增长。 人们可以轻松地对阿拉伯数字进行算术运算,然而对罗马数字进行算术运算会比较耗时。 表示的选择会对机器学习算法的性能产生巨大影响也就不足为奇了。图1.1展示了一个简单的可视化示例。