【发布时间】:2015-01-24 14:39:38
【问题描述】:
我有一个数据集,其中包含以下列:flavor、flavorid 和 unitSoled。
Flavor Flavorid unitsoled
beans 350 6
creamy 460 2
.
.
.
我想找出前十种口味,然后计算每种口味的市场份额。我的逻辑是每种口味的市场份额=特定口味的销售单位除以销售的总单位。
我该如何实现。对于输出,我只想要两个 col Flavorid 和相应的市场份额。我需要先在某个表中保存前十种口味吗?
【问题讨论】:
-
aggregate(unitsoled ~ Flavorid, df, sum) -> 这部分是按 id 计算单位鞋底的总和,之后我想显示前 10 种口味,然后计算前 10 种口味中的每一种的市场份额风味使用公式:特定风味的销售单位除以销售的总单位。 head(df2, 10)->> 这没有显示正确的结果。
-
看看Lyzander的详细解答