【发布时间】:2018-08-28 20:56:41
【问题描述】:
我们正在用python编写分类代码,我们想获得样本属于每个类的概率作为我们的输出。我们如何从分类器中获取概率而不是类标签? 我们想知道样本属于每个类别的概率。 (例如:如果有9个类,我们需要样本属于第一类,第二类等等的概率......)然后我们需要根据概率预测将它们归类并检查准确性。 我们根据提取的特征(如操作码、API 调用等)对数据样本进行分类。 我们不想使用 Weka 进行分类。
edit:我们计划使用像 NaiveBayes 这样的概率分类器。 使用的库有 Numpy、scikitlearn 另外,是否有特定的格式应该获取特征?
【问题讨论】:
-
您使用的是哪种分类模型?哪个图书馆?
-
scikit 中的大多数估算器都有 predict_proba 或 decision_path 方法,可以做到这一点。
标签: machine-learning classification feature-extraction