数值分类器 (?) Weka / R答案

【问题标题】：Numerical classifier (?) Weka / R数值分类器 (?) Weka / R
【发布时间】：2012-11-06 21:13:57
【问题描述】：

我有一个具有“n 到 m”关系的数字数据集（作为数据库表）。例如：

A | B
-----
1 | 1
1 | 2
1 | 9
4 | 2
7 | 8
7 | 11

我想“训练”一个分类器（使用 weka？）来告诉我哪个 A 最有可能成为一组 B。举个例子：[1,2,8] 应该告诉我一些类似于 {1:2, 4:1, 7:1} 的内容，即：“该集合在 A N 次被发现”

我当然可以用 sql 和我最喜欢的脚本语言来实现它。但是，我想知道是否有更多 - 我猜是“正式的” - 方式来做到这一点。我有 weka 运行，并且我连接了我的数据库，但是我迷失了要采用哪个分类器（许多拒绝服务），我也非常感谢一些理论背景的链接（例如它叫什么我喜欢做的事情和存在哪些改进）。

如果您在 R 中更通用，我也会欣赏“R”方式。（但是，我不仅对解决我的问题感兴趣，而且对了解这是什么类型的问题感兴趣 - 我会通过 weka 解决方案。）如果这是一个重复的问题，我很抱歉，但遗憾的是我缺乏指定我在这里寻找的信息的信息。可视化和其他学习和研究的输出会很棒，你。

提前感谢您的阅读，希望您能提供帮助。

【问题讨论】：

我可以通过删除重复的 B 来减少数据的“m 到 n”性质，但是这应该是可选的。当然，我可以重新组织我的数据。

标签： r weka numerical classification

【解决方案1】：

在 R 中，您可以执行以下操作：

foo = data.frame(A=c(1,1,1,4,7,7),B=c(1,2,9,2,8,11))
foo
#   A  B
# 1 1  1
# 2 1  2
# 3 1  9
# 4 4  2
# 5 7  8
# 6 7 11

table(foo[foo$B %in% c(1,2,8),]$A)

# 1 4 7 
# 2 1 1

你还需要什么吗？

【讨论】：

感谢您的回答！你能告诉我这是怎么称呼的吗？我对weka特别感兴趣，就是想知道怎么称呼它，也就是它是一种什么样的“分类”（我应该多表达一下）。否则，感谢您的 R 解决方案，如果没有人可以在 weka 中回答我的问题或提供对该主题的更多见解，我将接受它作为解决方案。
这些只是 R 的非常基本的运算符/功能。我没有使用真正的“分类器”，您的问题也不需要分类器 - 像 svm - 来回答。我认为——但我不能保证——R 比 weka 更灵活，因为它提供了大量可供开发人员使用的软件包，尽管 weka 真的很棒。
是的，我怀疑这一点，谢谢。这就是为什么 weka 解决方案（如果存在）会告诉我更多关于问题的性质以及它是否是分类器的原因。但我很欣赏你的 R 解决方案，如果我找不到更多信息，我可能会使用它！