【发布时间】:2022-01-11 00:26:26
【问题描述】:
目标:
我想创建PaperlessBilling 分类特征(电信客户流失数据集)的堆栈直方图,将 Y 轴显示为百分比,并将流失分布显示为色调。但是,百分比不是累积计算的。
如果使用 R,这就是我所期望的:
ggplot(Churn, aes(SeniorCitizen, fill = Churn)) +
geom_bar(position = "fill") +
xlab("Senior Citizen status") +
ylab("Percent") +
scale_y_continuous(labels = scales::percent) +
scale_x_discrete(labels = c("Non-Senior Citizens", "Senior Citizens")) +
scale_fill_manual(name = "Churn Status", values = c("green2", "red1"), labels = c("No", "Yes")) +
ggtitle("The Ratio of Churns by Senior Citizen status") +
theme_classic() +
theme(legend.position = "bottom",
plot.title = element_text(hjust = 0.5, size = 15))
这是上面代码的输出(看到两个类别的总和都是100%):
这是我所做的:
fig, axs = plt.subplots(figsize=(5, 5))
sns.histplot(
df,
x = "PaperlessBilling",
hue = "Churn",
multiple = "stack",
stat = "percent"
)
这是上面代码的输出:
【问题讨论】:
-
@JohanC 是的,总和是 100。但我想像绿红色那样显示。每个分类都是 100
标签: python r seaborn histogram