【问题标题】:evaluating the array of strings using libsvm使用 libsvm 评估字符串数组
【发布时间】:2013-09-01 12:46:57
【问题描述】:

我正在使用 java libsvm,我创建了我的模型,现在我想用字符串数组对其进行评估,我已经为双精度数组完成了该操作

但我不知道如何评估字符串数组,希望有人能帮助我

提前致谢,

此代码适用于双精度数组

private double evaluate(Neighbor features, svm_model model) {
    svm_node[] nodes = new svm_node[features.getDocument().getAttributes().size()];
    Iterator<String> iteraitor = features.getDocument().getAttributes().keySet().iterator();
    int i = 0;
    while (iteraitor.hasNext()) {
        svm_node node = new svm_node();
        node.index = i;
        String key = (String) iteraitor.next();
        node.value = (features.getDocument().getAttributes().get(key));
        nodes[i] = node;
        i++;
    }
int totalClasses = 2;
    int[] labels = new int[totalClasses];
    svm.svm_get_labels(model, labels);

    double[] prob_estimates = new double[totalClasses];
    double v = svm.svm_predict_probability(model, nodes, prob_estimates);

    for (int j = 0; j < totalClasses; j++) {
        System.out.print("(" + labels[j] + ":" + prob_estimates[j] + ")");
    }
    // System.out.println("(Actual:" + features[0] + " Prediction:" + v + ")");

    return v;
}

【问题讨论】:

    标签: java machine-learning svm libsvm


    【解决方案1】:

    SVM 是在R^n 空间中工作的几何分类器,它只接受数字 值。要在字符串上使用 SVM,您必须执行以下操作之一:

    • 将字符串/文档转换为某种特征表示(数字),例如tfidf 等。
    • 使用string-based kernel(如wordnet kernel等),它将自行引入数值特征空间

    libsvm 允许使用预先计算的内核值,所以如果你实现一些内核 K(x_i,x_j) 你只需要为libsvm 提供内核矩阵,其中K[i,j]=K(x_i,x_j)(其中x_ii'th 训练示例)。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-01-25
      • 2014-03-03
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多