【发布时间】:2020-10-19 00:07:25
【问题描述】:
我有一个相当大的 pandas 数据框((4000, 103),对于较小的数据框,我喜欢使用 pairplot 直观地查看数据中的模式。但对于我的较大数据集,相同的命令运行了一个小时以上,没有输出。
是否有其他工具可以获得相同的结果或加快命令速度?我尝试在 pandas 上使用 sample 选项来减少数据集,但仍然需要一个多小时而没有结果。
dfSample = myData.sample(100) # make dataset smaller
sns.pairplot(dfSample, diag_kind="hist")
【问题讨论】:
-
有 103 列,pairplot 需要显示 103^2 个单独的面板!两个大...您可以考虑只看几列吗?
-
@FChm 听起来很可怕,但是,与单独选择列相比,有没有一种懒惰的方法来做到这一点?我正在创建我的数据集群,并且过去使用这种方法来确保我的集群有某种模式。
标签: python pandas seaborn visualization