SNLI 数据集上的句子分类

【问题标题】：Sentence Classification on SNLI datasetSNLI 数据集上的句子分类
【发布时间】：2017-11-12 14:44:18
【问题描述】：

我正在为句子分类任务处理 SNLI 数据集here。该数据集包含两个句子，需要判断第二个句子是否包含、矛盾或与第一个句子中性。

出于分类目的，我实现了基于出现矩阵的 SVM 分类，其准确率约为 70%。

有人可以建议任何其他与 NLP 相关的分类策略，即使用二元组或三元组，因为我需要提出一些基线。

【问题讨论】：

【解决方案1】：

您应该考虑使用 k-means 聚类，这对于此类任务来说可能听起来有点不合常规，但将其用作以下内容，您可能会获得可靠的基线结果。

（可选）您可能可以通过在训练数据上运行 PCA 来进一步提高模型的准确性。这实质上会降低您的特征的相关性，从而减少噪音。

【讨论】：