【问题标题】:how to remove irrelevant features in document classification from Weka? [closed]如何从 Weka 中删除文档分类中不相关的特征? [关闭]
【发布时间】:2021-10-25 02:38:56
【问题描述】:

在 Weka 中,文本分类在应用特征选择后有很多特征,如何快速去除进程选项卡中不相关的特征,而不是一一去除,因为在文本分类中,特征的数量很多,需要时间一一去除。

【问题讨论】:

    标签: machine-learning data-mining weka text-classification feature-selection


    【解决方案1】:

    使用Remove 过滤器删除预处理面板中的属性范围。

    除了对数据进行后处理之外,您还可以更改StringToWordVector 过滤器的默认参数以产生更有意义的输出:

    • 更改最低词频(选项:-M,属性:minTermFreq
    • 使用stopwords handler(选项:-stopwords-handler,属性:stopwordsHandler),如WordsFromFile

    【讨论】:

    • 非常感谢您的回复,我的问题是如何快速删除1500个特征而不是一个一个,因为我正在处理文本分类和大约2000个特征的数量所以它需要太多时间才能删除一个接一个。
    猜你喜欢
    • 2013-12-30
    • 1970-01-01
    • 2016-01-03
    • 2018-03-11
    • 1970-01-01
    • 2020-12-16
    • 2023-02-10
    • 1970-01-01
    • 2020-10-20
    相关资源
    最近更新 更多