【发布时间】:2020-06-25 15:46:17
【问题描述】:
我希望使用 Dart 将一段文本拆分成单独的句子。我遇到的问题是句子可以以许多标点符号结尾(例如“。”,“!”,“?”),在某些情况下(例如日语),句子可以以独特的符号结尾(例如'。')。
此外,Dart 的 split 方法会从字符串中删除拆分值。例如,“Hello World!”在使用代码text.split('! ');时变为“Hello World”
我查看了可用的 Dart 包,但找不到任何符合我要求的东西。
理想情况下,我正在寻找类似于 Java 中的 BreakIterator 的东西,它允许程序员在检测标点符号时定义他们希望使用的语言环境,并在将字符串拆分为句子时维护标点符号。我很高兴在 Dart 中使用一种不会根据 Locale 自动检测句子结尾的解决方案,但如果这不可用,我希望能够定义所有句子结尾以在拆分字符串时查找。
感谢任何帮助。提前谢谢你。
【问题讨论】: