【发布时间】:2017-05-24 12:49:54
【问题描述】:
Python 的 Spacy 包有一个统计分词器,可以智能地将句子拆分为分词。我的问题是,是否有一个包可以让我倒退,即从标记列表到格式良好的句子?本质上,我想要一个可以让我执行以下操作的函数:
>>> toks = ['hello', ',', 'i', 'ca', "n't", 'feel', 'my', 'feet', '!']
>>> some_function(toks)
"Hello, I can't feel my feet!"
它可能需要某种基于统计/规则的程序来了解空格、大写或收缩在正确的句子中应该如何工作。
【问题讨论】: