1.数据抽取有用特征值

  • 在鸾尾花的数据中,共有四个特征值,150条数据
  • 将X^T * X 形成4*4的对称矩阵
  • 求4个特征值,以及对应的四个正交特征向量
  • 取两个特征值最大的特征对应的特征向量,作为标准方向
  • 将剩余的两列特征值投影
    原理:其实特征值最大的就是离散程度最高的,用这两个做标注方向,特征值不至于损失太多

2.车辆数据描述

用0, 1, 2, 3表示特征值在参数前方加入参数还是挺麻烦的,于是用1 数据处理独热编码

相关文章: