【发布时间】:2017-11-17 02:58:01
【问题描述】:
我有一个整洁的数据框,每行有一个术语和主题。它看起来像这样:
num_topic, term
1, blue
1, green
2, dog
2, cat
为了便于阅读,我想将每个主题安排在单独的列中
topic1, topic2
blue, dog
green, cat
这看起来很直观,但我不知道该怎么做。它与链接问题不同,因为每个术语没有唯一标识符。每个主题只有术语列表。
【问题讨论】:
-
这称为枢轴
-
谢谢,非常接近!但问题是,我只想要主题列。主题中的每个术语实际上没有唯一标识符。
-
@Adam_G 你能添加一个临时标识符吗?例如类似
df %>% group_by(num_topic) %>% mutate(id = seq(1, n())) %>% ungroup() %>% spread(num_topic, term) %>% select(-id)