【发布时间】:2014-03-04 05:06:33
【问题描述】:
我正在尝试创建一个共现数据的数据集,其中感兴趣的变量是一个软件应用程序,我想模拟一个 n × n 矩阵,其中每个单元格都有一个数字,表示应用程序 A 的次数与应用程序 B 一起使用。如何在 R 中创建可用于测试一组聚类和分区算法的数据集。我将使用什么模型以及如何在 R 中生成数据?
【问题讨论】:
-
您打算使用哪种聚类/分区算法或软件包?这通常会决定您需要作为输入的数据格式。
-
我正在考虑使用算法组合来测试它们的性能。但是,我需要样本数据来测试它们,那么如何创建数据集?
标签: r dataset cluster-analysis simulation