【发布时间】:2021-08-11 04:28:53
【问题描述】:
我正在尝试将字符串中的复数单词更改为单数,并混合使用大写和小写单词。例如纸板箱,尺寸:19 厘米高 x 10 厘米宽 x 30 厘米深
我使用 NLTK 包来执行此操作,但它只接受小写字符串,我不想将字符串中的所有单词都小写。有什么建议吗?
【问题讨论】:
我正在尝试将字符串中的复数单词更改为单数,并混合使用大写和小写单词。例如纸板箱,尺寸:19 厘米高 x 10 厘米宽 x 30 厘米深
我使用 NLTK 包来执行此操作,但它只接受小写字符串,我不想将字符串中的所有单词都小写。有什么建议吗?
【问题讨论】:
希望对你有帮助:
from nltk.stem import WordNetLemmatizer
lemmatizer = WordNetLemmatizer()
lemma = []
for t in text.split():
if t.isupper():
t = lemmatizer.lemmatize(t.lower())
lemma.append(t.upper())
else:
lemma.append(t)
text = ' '.join(lemma)
【讨论】: