【发布时间】:2021-12-18 21:51:34
【问题描述】:
我正在尝试对共现矩阵进行归一化(我想它被称为?) 我有以下来自 csv 文件的数据样本:
import pandas as pd
df = pd.DataFrame({'A':[1,1,1,0,1,1,1,1],
'B':[1,0,1,0,1,1,1,1],
'C':[0,1,0,1,1,0,1,1],
'D':[1,1,1,1,0,1,1,1],
'E':[0,1,1,1,1,1,1,0]})
... 我使用以下方法创建此矩阵: (Constructing a co-occurrence matrix in python pandas)
df_asint = df.astype(int)
coocc = df_asint.T.dot(df_asint)
print(coocc)
输出:
[4975 rows x 5 columns]
A B C D E
A 7 6 4 6 5
B 6 6 3 5 4
C 4 3 5 4 4
D 6 5 4 7 5
E 5 4 4 5 6
现在的问题。我正在尝试将这些规范化为对角线。 如屏幕截图所示,我已经使用 Excel 解决了它。
关于如何在 pandas 中执行此操作有什么想法吗?
【问题讨论】:
标签: python pandas dataframe matrix