【发布时间】:2012-11-16 10:44:33
【问题描述】:
我有一个先前的问题here,我认为我遇到了一个问题,因为我不能同时洗牌样本数据和样本数据的索引 (idx)。
我有一个名为fulldata 的数据集,其中包含 49,000 行 x 6 列,然后我有另一个数据集,它是 fulldata (Book2) 的类标签,其中包含大量与 fulldata 中的确切行相对应的类标签。
我只想从 fulldata(normal. 和 smurf.)中选择两个类标签,我想要 750 个正常行和 250 个 smurf 行。
然后我想随机打乱新的样本数据 (1000x6)。
到目前为止,已被管理。但是后来我被卡住了... Dan 帮助解决了上一个问题,但后来我注意到 k1 输出了 Book2 中的一些其他类标签,例如海王星等,但事实并非如此... K1 应该只包含 smurf 和 normal 类标签。
我问这个的原因是因为我想在matlab中使用贝叶斯分类器,为了使用它我需要:
Test_Data (unseen data)
Trainning_data (This is the sample data im trying to create above)
Target_class (this is the class labels that match exactly each row in sample data)
【问题讨论】:
-
您能否改写一下,以便更清楚您到底在寻找什么?
-
同时洗牌两个数据集?我想不出另一种方式来改写它。
-
也许你会展示一些看起来像你的输入的东西,并展示你想要的输出数据。 (小规模或只有几行)
标签: matlab random permutation