【发布时间】:2021-08-01 15:50:23
【问题描述】:
这是我的数据框。它不是很长 - 只有六行。
df <- structure(list(Send_Month = c("2021-05", "2021-06", "2021-07",
"2021-05", "2021-06", "2021-07"), Order_Result = c("No", "No",
"No", "Yes", "Yes", "Yes"), Email_Send = c(135, 495, 475, 7,
28, 25), Unique_Email_Opens = c(45, 149, 143, 7, 28, 25), Unique_Email_Clicks = c(6,
21, 10, 7, 28, 25), Total_Orders = c(37, 106, 46, 7, 28, 25)), row.names = c(NA,
-6L), groups = structure(list(Send_Month = c("2021-05", "2021-06",
"2021-07"), .rows = structure(list(c(1L, 4L), c(2L, 5L), c(3L,
6L)), ptype = integer(0), class = c("vctrs_list_of", "vctrs_vctr",
"list"))), row.names = c(NA, -3L), class = c("tbl_df", "tbl",
"data.frame"), .drop = TRUE), class = c("grouped_df", "tbl_df",
"tbl", "data.frame"))
我无法想象如何获得可以绘制成条形图的摘要结果。我正在尝试在这里进行一些分组:
当月份相同(例如,“2021-05”)并且我查看 Email_Send 变量时,我可以看到发送的 142 封电子邮件中有 7 封(即 135+7)导致了订单.我还可以看到打开的 52 封电子邮件(即 45+7)中有 7 封导致了订单。在被点击的 13 封电子邮件中,有 7 封(即 6+7)导致了订单。那是给“2021-05”组的。
如何为每个分组创建这些统计信息,以便查看每个组的百分比将如何变化,分母在哪里不断变化?
我尝试使用 janitor 包一秒钟,只是为了确定自己的方向,我首先过滤为仅包含 2021-05 组:
df_may <- df %>%
filter(Send_Month == "2021-05")
df_may %>%
adorn_totals("row")
但我不知道这种方法对于同时查看所有组是否非常灵活,而且我不知道我是否真的想要一个摘要行或一个新列。所以我不知道我是否朝着正确的方向前进。
【问题讨论】: