【发布时间】:2017-11-12 14:44:18
【问题描述】:
我正在为句子分类任务处理 SNLI 数据集here。该数据集包含两个句子,需要判断第二个句子是否包含、矛盾或与第一个句子中性。
出于分类目的,我实现了基于出现矩阵的 SVM 分类,其准确率约为 70%。
有人可以建议任何其他与 NLP 相关的分类策略,即使用二元组或三元组,因为我需要提出一些基线。
【问题讨论】:
标签: python nlp stanford-nlp
我正在为句子分类任务处理 SNLI 数据集here。该数据集包含两个句子,需要判断第二个句子是否包含、矛盾或与第一个句子中性。
出于分类目的,我实现了基于出现矩阵的 SVM 分类,其准确率约为 70%。
有人可以建议任何其他与 NLP 相关的分类策略,即使用二元组或三元组,因为我需要提出一些基线。
【问题讨论】:
标签: python nlp stanford-nlp
您应该考虑使用 k-means 聚类,这对于此类任务来说可能听起来有点不合常规,但将其用作以下内容,您可能会获得可靠的基线结果。
(可选)您可能可以通过在训练数据上运行 PCA 来进一步提高模型的准确性。这实质上会降低您的特征的相关性,从而减少噪音。
【讨论】: