顾名思义就是根据选好的特征进行转换,使特征充分发挥他的特点
5-06特征变换
**下面介绍比较常用的特征变换的方法(对指化)**1、(数值太小)取指数—归一化,在机器学习中,有一个直接的函数叫softmax numpy.exp
5-06特征变换
2、取对数(数值太大)numpy.log
5-06特征变换
下面介绍另一种方法离散化
为什么离散化(第一数据有噪声,第二朴素贝叶斯只能用离散化数据,第三数据有明显拐角点,离散更有意义,见下图)
5-06特征变换
5-06特征变换
方法(前两种叫做分箱)
5-06特征变换
数据在分箱前,一定要进行排序,分好后找一个好的数来代替这个箱子里的内容,下面是等深分箱(个数),还有一种等宽分箱没画(根据数的大小)
5-06特征变换下面介绍另外一种方法归一化(标准化的一种)
5-06特征变换狭义的标准化就是将数据缩放成均值为0,标准差为1(体现这个数据与其他数据的相对关系)
5-06特征变换
第一个1没有第二个1明显(相当于把你放在安静和吵闹的环境中两种差别)5-06特征变换

相关文章:

  • 2021-11-25
  • 2021-07-23
  • 2021-11-27
  • 2021-12-30
  • 2021-06-07
  • 2021-08-09
  • 2021-12-05
  • 2021-11-14
猜你喜欢
  • 2022-12-23
  • 2021-05-26
  • 2021-12-17
  • 2021-05-14
  • 2021-11-10
  • 2021-06-19
  • 2022-12-23
相关资源
相似解决方案