如果我们能更好地理解我们的数据,这样会对我们开发高效的机器学习算法有作用,将数据可视化(将数据画出来能更好地理解数据)出来将会对我们理解我们的数据起到很大的帮助。

高维数据如何进行显示

dimensionality reduction动机---visualization(将数据可视化帮助我们更好地理解数据)    

GDP: gross domestic product

假设我们可能有50个features,那么我们怎么查看我们的数据呢(如怎么查看代表一个国家如canada的数据,二维可以通过一个点来表示)?因为要画出50维的数据是很难的,这里会用到dimensionality reduction

将50维的数据约简为2维数据

dimensionality reduction动机---visualization(将数据可视化帮助我们更好地理解数据)       dimensionality reduction动机---visualization(将数据可视化帮助我们更好地理解数据)

 

 

我们将上图中50维的数据约简为2维(z1,z2),通常z1,z2新features并不代表具体的物理含义,它取决于我们计算出的特征含义.

如果将这些特征画出来会发现,每个点代表一个国家,这样就可以分析代表每个国家的features,可能会发现z1可能表示整个国家的大小(整体GDP),z2表示人均GDP(人的幸福指数,医疗状况等),右上角的那个点代表USA,像有些国家比较小,GDP可能不高,但是人均GDP很高,如新加坡等。

 

相关文章:

  • 2021-04-05
  • 2021-09-30
  • 2021-04-13
  • 2021-05-27
  • 2021-05-11
  • 2021-08-25
  • 2021-06-27
  • 2021-12-05
猜你喜欢
  • 2021-04-05
  • 2021-06-13
  • 2021-12-09
  • 2022-12-23
  • 2021-06-05
  • 2021-12-24
相关资源
相似解决方案