【发布时间】:2018-07-12 06:08:30
【问题描述】:
我正在可视化 Titanic 数据集。我创建了 9 个不同的年龄类别,并尝试使用条形图可视化 age_categories 与 Survived。我写了以下代码:
age_cats = [1, 2, 3, 4, 5, 6, 7, 8, 9]
df_train['Age_Cats'] = pd.cut(df_train['Age'], 9, labels = age_cats)
sns.barplot(x = 'Age_Cats', y = 'Survived', hue = 'Sex', data = df_train)
我不明白 Y 轴上的数字代表什么?
我的假设是:
{n(Survived = 1)}/{n(Survived = 1) + n(Survived = 0)} 或在该类别的所有人中幸存者的比例。但是seaborn是如何计算的呢? 还是 Y 轴上的数字代表什么?
【问题讨论】:
-
你看数据了吗?通常 sns.barplot 应该始终输出您提供给命令的确切值。因此,数据应该显示在各个年龄段幸存下来的人的百分比。
标签: python-3.x pandas matplotlib data-visualization seaborn