【问题标题】:Best format to pack data for correlation determination? [closed]为相关性确定打包数据的最佳格式? [关闭]
【发布时间】:2014-02-12 21:50:30
【问题描述】:

我正在使用 Java 程序提取一些数据点,并计划使用scipy 来确定相关系数。我计划将数据提取到 csv 样式的文件中。我应该如何格式化每个对应的数据集,以便我可以轻松地将其读入scipy

【问题讨论】:

    标签: python csv scipy correlation


    【解决方案1】:

    每个数据集都是一列,所有数据集组合成一个 CSV。它被numpy.genfromtxt() 读取为二维array,然后调用numpy.corrcoef() 以获取相关系数。

    注意:您还应该考虑相同的数据布局,但使用pandas。通过pandas.read_csv()将CSV读入dataframe,通过.corr()得到相关系数

    【讨论】:

    • 谢谢。我想进一步挑战你。如果我有多组数据,我该如何分解?我可以将“Subject1”、“Subject2”等插入到我的 csv 文件中。
    猜你喜欢
    • 2012-04-22
    • 1970-01-01
    • 1970-01-01
    • 2011-03-17
    • 2010-11-26
    • 2016-07-03
    • 1970-01-01
    • 2013-11-08
    相关资源
    最近更新 更多