【问题标题】:What does bar plot compute in Y-axis in seaborn?条形图在seaborn的Y轴上计算什么?
【发布时间】:2018-07-12 06:08:30
【问题描述】:

我正在可视化 Titanic 数据集。我创建了 9 个不同的年龄类别,并尝试使用条形图可视化 age_categories 与 Survived。我写了以下代码:

age_cats = [1, 2, 3, 4, 5, 6, 7, 8, 9]
df_train['Age_Cats'] =  pd.cut(df_train['Age'], 9, labels = age_cats)
sns.barplot(x = 'Age_Cats', y = 'Survived', hue = 'Sex', data = df_train)

我不明白 Y 轴上的数字代表什么?

我的假设是:

{n(Survived = 1)}/{n(Survived = 1) + n(Survived = 0)} 或在该类别的所有人中幸存者的比例。但是seaborn是如何计算的呢? 还是 Y 轴上的数字代表什么?

【问题讨论】:

  • 你看数据了吗?通常 sns.barplot 应该始终输出您提供给命令的确切值。因此,数据应该显示在各个年龄段幸存下来的人的百分比。

标签: python-3.x pandas matplotlib data-visualization seaborn


【解决方案1】:

条形图显示了幸存者的存活率或百分比。

例如在年龄组 1 中,60% 的男性幸存下来。在 7 岁年龄段,不到 15% 的男性幸存下来。

这是通过取该年龄段的生存变量的平均值来计算的。例如。如果你有 3 个人,其中 2 人幸存下来,这个变量可能看起来像 [1,0,1],这个数组的平均值是 (1+0+1)/3=0.66;因此,条形图将显示一个高达 0.66 的条形。

【讨论】:

  • 我在寻找什么。谢谢
猜你喜欢
  • 2019-02-18
  • 2019-07-23
  • 2019-01-23
  • 2018-03-03
  • 2015-01-17
  • 2020-02-16
  • 2019-03-27
  • 1970-01-01
  • 2019-01-11
相关资源
最近更新 更多