【问题标题】:What is the benefit of NLP sentence segmentation over Python algorithm?NLP 句子分割比 Python 算法有什么好处?
【发布时间】:2020-01-03 12:28:04
【问题描述】:

我在 NLP 中有一个任务来做一个句子分割,但我想知道,使用内置的 NLP 句子分割算法,如 Spacy、NLTK、BERT 等,与 Python 相比有什么优势。分隔符还是类似的算法?

是速度吗?还是准确性?还是更少的代码行?

这些算法与我们可以在 Python 中自己构建的算法相比有何不同或强大?

【问题讨论】:

  • 问题似乎固执己见,因为一个人可能会使用 python/另一个与 NLTK、BERT 等一样强大的软件包来构建 NLP。但这不太可能,因为资源大学/大型软件公司可以随意使用。因此,并没有真正定义多少“更强”。

标签: python-3.x nlp


【解决方案1】:

来自 NLP 库(如 SpaCy、NLTK 等)的句子分割例程可以更好地处理边缘情况,并且在处理标点符号和上下文方面更加稳健。例如,如果您选择通过处理“。”来拆分句子。作为一个句子的边界,你会如何处理这样一个句子——“There are 0.5 liters of water in this bottle。”?

【讨论】:

    猜你喜欢
    • 2017-10-23
    • 2017-12-20
    • 1970-01-01
    • 2019-10-19
    • 2012-07-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-04-29
    相关资源
    最近更新 更多