【发布时间】:2020-11-14 15:13:47
【问题描述】:
我目前正在使用 nltk.book iny Python 并希望找到特定二元组的频率。我知道有 bigram() 函数可以为您提供文本中最常见的二元组,如下代码所示:
>>> list(bigrams(['more', 'is', 'said', 'than', 'done']))
[('more', 'is'), ('is', 'said'), ('said', 'than'), ('than', 'done')]
>>>
但是,如果我只搜索“wish for”之类的特定内容怎么办?到目前为止,我在 nltk 文档中找不到任何相关内容。
【问题讨论】:
-
所以你想要“希望”的频率?请添加预期输出
-
@DaniMesejo 是的,输出应该类似于“Wish for: 5”。不过,我的问题现在已经解决了。 :)
标签: python nltk frequency nltk-book