【问题标题】:Find correlation of rows in dataframe with python pandas使用 python pandas 查找数据框中的行的相关性
【发布时间】:2020-04-23 07:39:04
【问题描述】:

我有一个具有这种结构的 panda 数据框,我想得到一个表作为输出,其中只包含 Pearson 相关性高于 0.8 的 valueus。

输入表:

Date         Word   Position
01/01/2020   dog    2.2
01/01/2020   cat    3.4
01/01/2020   pig    4
01/01/2020   cow    3
01/02/2020   dog    3.2
01/02/2020   cat    4.4
01/02/2020   pig    4
01/02/2020   cow    3
01/03/2020   dog    3
01/03/2020   cat    4
01/03/2020   pig    4.5
..........

期望的输出:

Word1    Word2  Correlation
cat      dog    0.8
pig      cat    0.9

【问题讨论】:

  • 你能解释一下逻辑吗?

标签: python pandas correlation


【解决方案1】:

您可能希望旋转数据框以将“猪”、“狗”和“猫”分成不同的列。

您可以使用groupby 或使用过滤器来提取df.Word.unique() 中每个动物的(日期、位置)对。

这是为了按动物分割数据。 第二步是对动物中的 (col1, col2) 的每个组合使用numpy.correrrelate(df[col1].values, df[col2].values)

【讨论】:

    猜你喜欢
    • 2016-10-24
    • 1970-01-01
    • 2019-03-16
    • 1970-01-01
    • 1970-01-01
    • 2013-07-24
    • 2018-12-20
    • 2021-02-22
    • 2021-07-20
    相关资源
    最近更新 更多