【发布时间】:2021-02-25 16:14:19
【问题描述】:
我有一个 pandas 数据框,其中每一行对应一个样本,每一列代表一个特征。现在我的一个列是一个字符串列,其中包含“这是一个红苹果”之类的文本。如何将其转换为可以为此数据帧计算 pearson 相关矩阵的形式? 同样,我还有另一列包含标识符列表。
下面是一个例子:
id text list_of_ids score1 score2
1. "This is An apple" [1, 2, 3, 4] 4.6. 1.0
2. "This is An orange" [1, 5, 6] 5.2 1.4
【问题讨论】:
标签: pandas correlation pearson