【问题标题】:NLTK doesn't lemmatize uppercase wordsNLTK 不会对大写单词进行词形还原
【发布时间】:2021-08-11 04:28:53
【问题描述】:

我正在尝试将字符串中的复数单词更改为单数,并混合使用大写和小写单词。例如纸板箱,尺寸:19 厘米高 x 10 厘米宽 x 30 厘米深

我使用 NLTK 包来执行此操作,但它只接受小写字符串,我不想将字符串中的所有单词都小写。有什么建议吗?

【问题讨论】:

    标签: python nlp nltk


    【解决方案1】:

    希望对你有帮助:

    from nltk.stem import WordNetLemmatizer
    lemmatizer = WordNetLemmatizer()
    lemma = []
    for t in text.split():
        if t.isupper():
                    t = lemmatizer.lemmatize(t.lower())
                    lemma.append(t.upper())
                else:
                    lemma.append(t)
            
    text = ' '.join(lemma)
    

    【讨论】:

      猜你喜欢
      • 2013-07-15
      • 2018-01-05
      • 1970-01-01
      • 1970-01-01
      • 2014-05-24
      • 1970-01-01
      • 2015-09-10
      • 2020-07-07
      • 1970-01-01
      相关资源
      最近更新 更多