【发布时间】:2013-05-19 10:24:48
【问题描述】:
我的问题:
a) 我得到了 1000 个基因在 6 个时间点的表达数据集。
b) 一些基因 (testing set) 属于某个类别,其特征是基因表达在这些时间点上的分布。
c) 我还有一个此类已知基因的数据集 (training set)。
d) 此外,我想通过随机重组我的测试集来生成false 数据集,并将该数据集包含在我的 SVM 模型中。
我想我知道如何使用R 和e1071 包来执行(a)-(c),但我不确定如何实现(d)。我应该只用计算模型测试我的false 数据,然后比较这个数据集和test set 的结果吗?
我应该使用哪些分布进行比较? (paretro 或者 universal gamma 提供我计算的概率?)
【问题讨论】:
-
最后得到一个比较假数据和测试数据的分数是完美的! ; )