【发布时间】:2020-04-17 21:30:44
【问题描述】:
我正在使用 jupyter 库做一个关于 EDA 的教程,发现这段代码令人困惑:-
plt.figure(figsize=(10,5))
c = df.corr()
sns.heatmap(c,cmap="BrBG", annot=True)
这里,dataframe 定义为 df。但是,我不明白 df.corr() 的目的以及它与热图的关系。我尝试搜索 df.corr() ,发现它是用来执行成对操作的。
这里是 jupyter 画廊的链接:https://colab.research.google.com/github/Tanu-N-Prabhu/Python/blob/master/Exploratory_data_Analysis.ipynb#scrollTo=dAnd4DSyeHDb
希望能澄清我的问题。
【问题讨论】:
-
默认方法是
'pearson',因此对于所有成对的列组合,它计算np.corrcoeff。您可以在 pandas.core.nanops 中准确查看它用于不同方法的函数 -
您阅读文档了吗?