【发布时间】:2021-09-24 14:30:43
【问题描述】:
所以我有一个 IMDB 电影数据集,其中有一列“流派”,其中有“|”分离的电影流派。前“犯罪|戏剧|恐怖”
现在每一行都有不同的流派组合,但我想将其分开,如果电影具有该流派,则分配 1,否则分配 0。
我编写了这段代码来获得我可以制作专栏的独特流派。
li = list()
for(x in movie_clean$genres) {
tokens = tokenize_words(x)
for(y in tokens)
li = append(li, y)
}
li = li[!duplicated(li)]
我现在如何将 1 和 0 分配给主要流派列中的每个单独的列?
所以我希望最终输出是
| Adventure | Crime | Drama |
| 1 | 0 | 1 |
编辑:每一行都有不同数量的流派,例如: https://imgur.com/a/WRru4Qc
【问题讨论】:
-
有一个名为
separate的函数,但我需要一些数据来组合解决方案。
标签: r