【问题标题】:Data format for LIBSVMLIBSVM 的数据格式
【发布时间】:2014-07-31 16:35:53
【问题描述】:

我需要知道如何为下面的 LIBSVM 示例准备数据格式

我有体育和政治两门课

在运动类别中,我有两个文档,内容如下

Doc1:2014 年足球世界杯
Doc2:C罗是最好的足球运动员

在政治类有三个文件,内容如下

Doc1:政治很糟糕
Doc2:远离政治
Doc3:政客是游戏玩家

现在从上面2个类别的6个文件中我想知道如何准备LIBSVM的训练文件?

还有一个问题,我可以为每个类别准备两个 LIBSVM 训练文件并在 LIBSVM.Net 中使用。
如果是,那么我如何使用两个培训文件并使用它们?

【问题讨论】:

    标签: machine-learning libsvm


    【解决方案1】:

    您似乎在混合两个不同的问题:

    1. 如何将文档表示为可输入分类器的特征向量
    2. 如何使用特定的库,例如 LIBSVM 或 LIMSVM.NET(我不确定第二个是什么,你的意思是 this?你应该更具体)。

    关于第一个问题,有很多可能性,具体取决于任务。一个可能的简单方法是tf-idf representation

    关于使用这些库,您尝试了哪些,哪些没有奏效?你读过文档吗? LIBSVM 有一个相当翔实和清晰的guide

    【讨论】:

    • 对于 1 个问题,您能否向我展示如何准备训练数据,而不是使用编码,而是像 1 1:2 2:4 这样的示例输出文件,用于两个类别的所有文档,因为那是什么对第二个问题感到困惑,我可以在最后的链接中使用 stackoverflow.com/questions/6172159/… int libsvm.net 吗?
    猜你喜欢
    • 2017-03-19
    • 2013-10-10
    • 2017-10-10
    • 2012-08-20
    • 2014-09-23
    • 2017-10-11
    • 2017-08-07
    • 2012-04-08
    • 2014-01-25
    相关资源
    最近更新 更多