【发布时间】:2022-07-27 00:11:28
【问题描述】:
假设我有以下df:
Company Apples Mangoes Oranges
Amazon 0.75 0.6 0.98
BellTM 0.23 0.75 0.14
Cadbury 0.4 0.44 0.86
然后是另一个名为vendor的数据框:
Company Apples Mangoes Oranges
Deere 0.11 0.3 0.79
我想在vendor 数据框中找到每家公司与公司Deere 的逐行相关性。我希望将输出的相关系数作为名为 Correlationcoef 的列添加到原始数据框 df:
Company Apples Mangoes Oranges Corrcoef
Amazon 0.75 0.6 0.98 0.77955981
BellTM 0.23 0.75 0.14 -0.37694478
Cadbury 0.4 0.44 0.86 0.98092707
当我尝试以下操作时:
df.iloc[:,1:].corrwith(vendor.iloc[:,1:], axis=1)
我得到一个包含 NaN 值的列表。
我通过将每一行保存为数组并使用 np.corrcoef(x1,y)
【问题讨论】: