【发布时间】:2015-04-06 16:56:46
【问题描述】:
我目前有一个包含 200 个单词的列表,我需要从中创建语义正确的排列。不幸的是,通过这种大小的列表进行排列将导致类似一万亿次排列。
我计划做的是利用 Microsoft Web Ngram 服务和 yield 函数在我的排列中查找联合分数高于某个阈值的 ngram。我希望通过基于分数进行过滤,我将只剩下语义正确的排列
我的问题是关于 Microsoft Ngram API:使用 200 个单词的列表,使用这种方法会有很多排列要经过 - 如果 api 函数能够处理那个量,有人可以给我一个感觉的请求?
谢谢!
【问题讨论】:
标签: python-3.x n-gram