【发布时间】:2018-05-19 09:44:17
【问题描述】:
我在数据可视化和带有 ggplot2 的 R 方面相当陌生。我正在尝试在饼图中可视化一些数据。我使用的代码是这样的:
percentageData <- data.frame(Year = "1987",
TypeOfDelays = c(percDepDelays[1], percArrDelays[1], percAntDepdelays[1], percAntArrDelays[1]),
Label = factor(c("Departure delays", "Arrival Delays", "Early Departure", "Early arrival")))
labels = c("Departure delays", "Arrival Delays", "Early Departure", "Early arrival")
ggplot(data = percentageData) +
geom_bar(aes(x="", y=TypeOfDelays, fill=Label), stat = "identity", width = 1) +
coord_polar(theta = "y", start = 0) +
theme_void() +
geom_text(aes(x = 1, y=cumsum(TypeOfDelays) - TypeOfDelays/2, label=labels))
我正在分析的数据集是这样的:flights dataset
我的问题是每年可视化每种延迟类型的延迟数量(我正在考虑 4 种类型的延迟,出发、到达、提前出发和提前到达)。
我的想法是为每一年创建一个数据框,其中包含年份、每种类型的延误次数百分比(一年中的总#delays/当年的#flights)和描述延误类型的标签。我已经计算了每种延迟类型的百分比。我想在饼图中可视化这些数据,我尝试用上面的代码创建一个饼图,结果是这样的:
所以我的问题是:
1) 为什么百分比数据没有可视化?我的代码有什么问题?
2) 如何在正确的位置正确可视化标签?
提前致谢。
【问题讨论】:
-
我正在尝试找出您的数据:1) 您的链接的数据集中没有 百分比。你是如何计算它们的? 2) 什么是
percAntDepdelays和percAntArrDelays? 3) 首先,是不是Delays,加上大写的D?请用这些疑问的答案编辑问题,不要在评论中回答。