【发布时间】:2020-10-29 22:27:53
【问题描述】:
我有一个包含 2 列的数据框,即整数格式的 UserId 和字符串格式的 Actors,如下所示:
Userid Actors
u1 Tony Ward,Bruce LaBruce,Kevin P. Scott,Ivar Johnson, Naomi Watts, Tony Ward,.......
u2 Tony Ward,Bruce LaBruce,Kevin P. Scott, Luke Wilson, Owen Wilson, Lumi Cavazos,......
它代表平台特定用户观看的所有电影中的演员
我想要一个输出,其中我们有每个用户的每个参与者的计数,如下所示:
UserId Tony Ward Bruce LaBruce Kevin P. Scott Ivar Johnson Luke Wilson Owen Wilson Lumi Cavazos
u1 2 1 1 1 0 0 0
u2 1 1 1 0 1 1 1
我认为它类似于 countvectoriser,但我这里只有名词。
请帮忙
【问题讨论】:
标签: python matrix count nlp countvectorizer