机器学习面试题库：131-140题（14day）

机器学习面试题库：131-140题（14day）
如果我们没有足够的数据来训练我们的算法，我们应该通过重复随机采样增加训练集合的大小。

决策树还可以用在数据中的聚类分析，但是聚类常常生成自然集群，并且不依赖于任何目标函数。
机器学习面试题库：131-140题（14day）
神经网络可以逼近方式拟合任意函数, 所以以上图都可能由神经网络通过监督学习训练得到决策边界。

Fisher线性判别函数是将多维空间中的特征矢量投影到一条直线上，也就是把维数压缩到一维。寻找这条最优直线的准则是Fisher准则：两类样本在一维空间的投影满足类内尽可能密集，类间尽可能分开，也就是投影后两类样本均值之差尽可能大，类内部方差尽可能小。一般而言，对于数据分布近似高斯分布的情况，Fisher线性判别准则能够得到很好的分类效果。
机器学习面试题库：131-140题（14day）
避免过拟合的方法：正则化方法，强制减少参数，增大训练数据集。
对于B，过拟合是太多的参数引起的。神经网络减少隐藏层节点，就是在减少参数，只会将训练误差变高，不会导致过拟合。
对于D，svm高斯核函数比线性核函数模型更复杂，容易过拟合。
机器学习面试题库：131-140题（14day）

CRF 的优点：特征灵活，可以容纳较多的上下文信息，能够做到全局最优。
CRF 的缺点：速度慢。
CRF没有HMM那样严格的独立性假设条件，因而可以容纳任意的上下文信息。特征设计灵活（与ME一样） ————与HMM比较
同时，由于CRF计算全局最优输出节点的条件概率，它还克服了最大熵马尔可夫模型标记偏置（Label-bias）的缺点。 ————与MEMM比较
CRF是在给定需要标记的观察序列的条件下，使用维特比算法，计算整个标记序列的联合概率分布，而不是在给定当前状态条件下，定义下一个状态的状态分布。————与ME比较
机器学习面试题库：131-140题（14day）
K-L变换与PCA变换是不同的概念，PCA的变换矩阵是协方差矩阵，K-L变换的变换矩阵可以有很多种（二阶矩阵、协方差矩阵、总类内离散度矩阵等等）。当K-L变换矩阵为协方差矩阵时，等同于PCA。
机器学习面试题库：131-140题（14day）
Kmeans是聚类方法，典型的无监督学习方法。分类是监督学习方法，BCD都是常见的分类方法。