【发布时间】:2023-03-17 10:25:01
【问题描述】:
首先,我还是个初学者。我正在尝试用 R 解释和绘制堆栈条形图。我已经查看了许多答案,但有些答案并不针对我的案例,有些我根本不明白:
- https://stats.stackexchange.com/questions/31597/graphing-a-probability-curve-for-a-logit-model-with-multiple-predictors
- https://stats.stackexchange.com/questions/47020/plotting-logistic-regression-interaction-categorical-in-r
- Plot the results of a multivariate logistic regression model in R
我有一个数据集dvl,它有五列,Variant、Region、Time、Person 和 PrecededByPrep。我想对 Variant 与其他四个预测变量进行多变量比较。每列可以有两个可能的值之一:
- 变体:
elk或ieder。 - 地区 =
VL或NL。 - 时间:
time或no time - 人员:
person或no person - PrecededByPrep:
1或0
这是逻辑回归
从我收集到的答案中,ggplot2 库可能是最好的绘图库。我已经阅读了它的文档,但对于我的生活,我无法弄清楚如何绘制这个:如何将 Variant 与其他三个因素进行比较?
我花了一些时间,但我在 Photoshop 中做出了与我想要的相似的东西(虚构的价值!)。
深灰色/浅灰色:Variant 的可能值
y轴:频率
x 轴:每一列,细分为可能的值
我知道制作单独的条形图,both stacked and grouped,但基本上我不知道如何制作堆叠的、分组的条形图。 ggplot2 可以用,但如果不用我更喜欢。
我认为这可以看作是一个示例数据集,尽管我并不完全确定。我是 R 的初学者,我阅读了有关创建样本集的信息。
t <- data.frame(Variant = sample(c("iedere","elke"),size = 50, replace = TRUE),
Region = sample(c("VL","NL"),size = 50, replace = TRUE),
PrecededByPrep = sample(c("1","0"),size = 50, replace = TRUE),
Person = sample(c("person","no person"),size = 50, replace = TRUE),
Time = sample(c("time","no time"),size = 50, replace = TRUE))
我也想让情节在美学上令人愉悦。我的想法:
- 绘制颜色(即用于条形图):
col=c("paleturquoise3", "palegreen3") - 轴标签
font.lab=2为粗体,但值标签不是(例如,'regionin bold, butVLandNL` 不是粗体) -
#404040作为字体、轴和线的颜色 - 轴标签:x:
factors,y:frequency
【问题讨论】:
-
小点:拥有多个预测变量不会使您的分析“多变量”;这是 1970 年代的常见用法,但不再是。我已将“二价”编辑为“二进制”。
-
大点:看来您本质上是在要求R代码。这将使其偏离主题:请参阅帮助中心以获取有关软件相关问题的建议。可以使这更具统计性,但是您需要扩展您想象的绘图类型;目前它完全是开放式的,因此可以说太宽泛了。
-
@NickCox 请看我的编辑,我付出了很多努力,所以我希望它足以提出一个更可行的问题。
-
@Tim 并非如此,因为这些链接无法帮助将图形堆叠和分组。只有单独的可能性。
标签: r data-visualization ggplot2