【发布时间】:2017-07-28 18:48:36
【问题描述】:
我正在尝试创建一个共现矩阵,以查看哪些关键字在我的数据库中经常关联在一起。
数据看起来像这样,它是一个 .csv 文件。
id, keywords
1, apple;pear
2, apple;cherry
3, pear;cherry
4, apple;cherry
我想得到这样的东西
apple pear cherry
apple 0 1 2
pear 1 0 1
cherry 2 1 0
然后目标是使用 d3.js 来可视化矩阵。
我已经在R 标签中发布了这个,因为我以前在一些课程中使用过它,所以我不是一个完整的新手。我在寻找解决方案时看到也可以使用 python 来执行此操作,但我一生中从未接触过它。
【问题讨论】:
-
我发现 this way 这样做似乎非常适合我想做的事情!