【发布时间】:2011-08-09 15:32:27
【问题描述】:
似乎很难检测文本中的句子边界。引号之类的 .!?可用于分隔句子,但不太准确,因为可能存在模棱两可的单词和引文,例如 USA 或 Prof. 或 Dr。我正在研究 Jan Goyvaerts 的 Tperlregex 库和正则表达式食谱,但我不知道如何编写表达式检测句子?
在delphi中使用Tperlregex可能比较准确的表达方式是什么?
谢谢
【问题讨论】:
-
我的评论有多少句,我很想知道? J. I. Wilbers 博士,博士。等。
标签: regex delphi nlp text-segmentation