【问题标题】:Can I get a word from its radical after stemming? [closed]词干后我能从它的部首中得到一个词吗? [关闭]
【发布时间】:2020-08-06 01:22:13
【问题描述】:

我对文本进行了词干化,得到了部首,现在我想要一个有意义的输出。我知道一个部首有很多可以创建的词,我只需要一个。有可能吗?

【问题讨论】:

    标签: python nltk stemming


    【解决方案1】:

    您可能想尝试词形还原而不是词干提取。这个过程试图为每个输入生成一个规范的“字典单词”而不是一个部首。见What is the difference between lemmatization vs stemming?

    否则,您可以使用 dict 来跟踪映射到每个词干的单词。 (此代码存储一组单词,但您可以将其修改为每个词干只记录一个单词。)

    from collections import defaultdict
    
    def get_stem_dict(words, stemmer):
        stem_to_words = defaultdict(set)
        for word in words:
            stem = stemmer.stem(word)
            stem_to_words[stem].add(word)
        return stem_to_words
    

    然后你可以使用 dict 来查找给定词干的示例词:

    def get_example(stem_to_words, stem):
        return next(iter(stem_to_words[stem]))
    

    【讨论】:

    • 哦,非常感谢您的帮助!
    猜你喜欢
    • 1970-01-01
    • 2015-05-17
    • 1970-01-01
    • 1970-01-01
    • 2022-08-12
    • 1970-01-01
    • 1970-01-01
    • 2014-10-16
    • 1970-01-01
    相关资源
    最近更新 更多