论文名称:A Bi-directional LSTM Approach for Polyphone Disambiguation in Mandarin Chinese
时间:2016年ISCSLP
单位:西工大,微软
基本思路:依靠sentence中多音字的POS(Part-of-Sentence)和上下文的POS确定多音字的发音。POS标注使用工具NLPIR toolkit标出。

依靠多音字的POS确定多音字的发音的例子:
【TTS多音字消歧】1

可以看出通过朝字所在的词的POS既可以区分出读音。

需要依靠上下文的POS确定多音字发音的例子:
【TTS多音字消歧】1

转字在两句中具有同样的POS标签,可以通过上下文的POS标签判断出读音。

其中表现最好的模型的网络结构:两层Bi-LSTM,hidden size=512,context = 1 word,即前看一个词后看一个词。

数据集:从网上摘取了174899个句子,自行用拼音标注,选取了79个出现频率高的多音字,共186个发音和null。

输入:带POS标注的多音字(或者多音字在的词),即上下文的POS标注。
输出:多音字的发音。

效果:该基于数据的方法比之前基于规则的方法要好
【TTS多音字消歧】1

相关文章:

  • 2022-12-23
  • 2021-04-03
  • 2021-07-17
  • 2021-11-01
  • 2022-12-23
  • 2022-12-23
  • 2021-07-20
猜你喜欢
  • 2022-12-23
  • 2021-12-17
  • 2021-12-09
  • 2021-12-18
  • 2021-12-19
  • 2021-07-14
  • 2021-10-11
相关资源
相似解决方案