【发布时间】:2018-02-20 21:38:26
【问题描述】:
我正在寻找一种快速计算 Python 中的语法错误的方法。例如,我需要一些类似的东西:
matches = grammar_checker.check('You is awesome!')
assert len(matches) == 1
速度比准确性更重要。作为快速检查的权衡,我可以忍受一些误报或误报。我在这里谈论的问题大小仅在几分钟内就达到了 100k 个文档(大约 5-10k 个字符)。
我在 Java 中遇到了 LanguageTool 及其 Python 包装器 language_check。然而,不幸的是,这些对于我的目的来说太慢了。还有其他建议或想法吗?谢谢!
【问题讨论】:
-
暂停,真的吗? This question 没有那么具体(没有效率限制)并且有超过 20 票。为什么那个不被搁置?
标签: python python-3.x performance nlp