【问题标题】:Java Regex for counting syllables用于计算音节的 Java 正则表达式
【发布时间】:2015-11-02 00:37:23
【问题描述】:

我正在编写一个正则表达式模式来计算一个单词中的所有音节,但是当单词末尾只有一个“e”时,我很难忽略这种情况。

我现在的模式是:

[aeiouy]+[^$e]

我给出了一些不完全精确的规则,但我需要这样做以进行练习,规则如下:

一个音节是一个连续的元音序列,除了最后一个单独的元音“e”,元音是“aeiouy”,例如“句子”这个词应该只有2个音节但我的模式是数3, “那里”这个词应该只有一个音节,我的模式是计数 2。

提前感谢您的帮助!

编辑:以 Yassin 为例,我注意到主要问题是当“e”后面跟着另一个字符、问号、逗号等时。正则表达式正在计算另一个音节

【问题讨论】:

  • 它个人给了我两个。例如,您能否提供一个关于 Regex101 的演示?
  • 你是对的,句子给了我两个音节,问题是在测试文本中我有“句子”这个词,末尾有一个逗号,这就是为什么 e,被算作一个音节。
  • [^$e] 表示“除小写字母‘e’或美元符号之外的任何字符。”在方括号内,$ 没有任何特殊含义。

标签: java regex


【解决方案1】:

因为您在使用“e”结尾词以及后跟点或逗号等方面遇到问题。

这是一个使用 12 个音节句子的解决方案。

我们排除了“e”字母后跟以下任何字符。


解决方案

Pattern p = Pattern.compile("[aeiouy]+[^$e(,.:;!?)]");
Matcher m = p.matcher("This is a sentence:this is another sentence.");

int syllables = 0;
while (m.find()){
    syllables++;
}
System.out.println(syllables);

输出

12

【讨论】:

  • 感谢您的解决方案,我已经尝试过了,但现在我在使用点、逗号等后面的实际音节时遇到了问题。例如“很多?”应该是 2 但正在计数。
猜你喜欢
  • 2016-01-30
  • 2013-03-13
  • 2020-04-22
  • 1970-01-01
  • 2016-02-13
  • 2016-02-13
  • 2018-11-07
  • 1970-01-01
  • 2015-12-13
相关资源
最近更新 更多