【发布时间】:2014-02-10 02:21:03
【问题描述】:
我正在使用Staford classifier 执行与 NLP 相关的任务。但我也需要尝试其他机器学习算法。所以我想将 prop 文件转换为 arff 或打印特征然后转换为 arff 文件。一个主要问题是分类器工具输出的特征具有稀疏表示(仅显示存在的特征)。如何做到这一点?
【问题讨论】:
标签: machine-learning nlp weka stanford-nlp
我正在使用Staford classifier 执行与 NLP 相关的任务。但我也需要尝试其他机器学习算法。所以我想将 prop 文件转换为 arff 或打印特征然后转换为 arff 文件。一个主要问题是分类器工具输出的特征具有稀疏表示(仅显示存在的特征)。如何做到这一点?
【问题讨论】:
标签: machine-learning nlp weka stanford-nlp
【讨论】:
1-set1Ngram 1-nextSetNgram 1-nextAgain,依此类推,直到形成所有的ngram。但我想这组中的每一个都以 arff 格式形成不同的特征,所以格式应该是,比如{ 1 set1Ngram, 2 nextSetNram, 3 nextAgain} rather than {1 set1Ngram, 1 nextSetNram, 1 nextAgain}