【发布时间】:2019-11-04 13:29:48
【问题描述】:
我正在处理泰坦尼克号数据集。为了可视化数据的分布,我使用了 seaborn 绘图方法。但我无法理解distplot 的论点及其最终输出。
我想知道以下几行中使用的参数(参数)的使用,尤其是bins和axes[0]和kde = False的使用。
ax = sns.distplot(women[women['Survived']==1].Age.dropna(), bins=18,
label = survived, ax = axes[0], kde =False)
ax = sns.distplot(women[women['Survived']==0].Age.dropna(), bins=40,
label = not_survived, ax = axes[0], kde =False)
我已经在文档中搜索了distplot并上网,但没有写清楚。
【问题讨论】:
-
bins是您想要查看的柱数。ax是您要绘制到的轴(axes显然包含两个轴,axes[0]选择其中的第一个)。 -
如何知道最佳的 bin 数量以及这对细节有何影响?
-
垃圾箱越多,细节越多。 “最佳”没有明确定义。当然,你有年龄,而且它们是整数,不应该使用 113 个 bin,因为那样会过度采样数据。
标签: python-3.x plot visualization seaborn