【发布时间】:2021-06-02 14:56:48
【问题描述】:
我想计算每个类别在我的数据框中出现的频率。
为此,我需要计算每一行中的类别并将此数字乘以第 5 列的总和。
(我的分析不需要 c4 列)
首选输出是:
分析 = 131
广告 = 253
标识= ..
我的数据如下所示:
tracker_category <- data.frame = c("Tracker1", "Tracker2", "Tracker3", "Tracker4","Tracker5","Tracker6"),
c1 = c("Analytics", "Crash", "Location", "Identification", "Analytics", "Ads"),
c2 = c("Ads", "Analytics", "Location", "Analytics", "Identification", "Ads"),
c3 = c("Identification", "Analytics", "Ads", "Ads", "Analytics", "Location"),
c4 = c("url1.com","ur2.com","url3.com","url4.com","url5.com","url6.com"),
sum_tracker = c(1,20,100,0,5,76))
【问题讨论】:
-
table(unlist(tracker_Category[2:3]))? -
嗨,在这种情况下,它只计算名称一次。我需要将它与相关的求和形式 sum_trackers 相乘。计算分析为:第一行 1*1 +第二行 2*20/ +第三行 0*100 等等。
-
你到底在做什么?什么是 1*1、2*20、0*100?你从哪里得到 1,2,0?
-
@Paul 您能否检查一下我提出的答案以及您的 Google Analytics(分析)总数是否正确?如果是这样,我还没有理解你的算法。但是使用
{tidyr}的pivot_longer(),您应该得到一个表格,允许您创建您所追求的每行的总值,然后您可以使用group_by()和summarise()再次逐行添加这些值。