【问题标题】:Google cloud speech to text difficulty on certain short words谷歌云语音到某些短词的文本困难
【发布时间】:2021-03-13 08:21:39
【问题描述】:

我已经用 Angular/websockets/node js 和谷歌语音转文本 api 构建了一个语音识别系统。

我几乎在所有单词上都表现得很好,但是“no”这个词确实存在问题 - 似乎“no”这个词甚至没有传递给 API,因为没有中间结果发生。对于诸如“yes”之类的词、更长的词或偶数(1、2、3 等)不会出现此问题。

IE th .on('data', (data) => { of streamingRecognise 什么都不输出 - 似乎直到它“听到”诸如“是”、“你好”等词,但不是“不”而没有很多 umph。

有什么想法吗?

配置:

  sampleRateHertz = 48000;                
  languageCode = 'en-US';                 
  single_utterance = true;                // Processes after short sound burst (sentence/word)
  interimResults = true;                  // Reports back findings mid-sentence. Useful for "processing" UI
  metadata = {
    microphoneDistance: 'NEARFIELD',       
    interactionType: 'VOICE_SEARCH',      
    recordingDeviceType: 'PC',             
  };```

【问题讨论】:

    标签: audio google-cloud-platform google-speech-api google-cloud-speech google-speech-to-text-api


    【解决方案1】:

    我可以提出一些想法:

    • 您是否检查过当您尝试识别单词no 时是否出现了一些END_OF_SINGLE_UTTERANCE 事件?由于您使用的是single_utterance,因此这有助于了解问题发生在哪里。
    • 您可以尝试使用this 来增加 Speech-to-Text 识别单词 no 的概率。 即:
    
      "config": {
        "sampleRateHertz": 8000,
        "languageCode":"en-US",
        "single_utterance":true,                
        "interimResults":true,                
        "metadata" : {
          "microphoneDistance": 'NEARFIELD',       
          "interactionType": 'VOICE_SEARCH',      
          "recordingDeviceType": 'PC',             
        };
        "speechContexts": [{
          "phrases": ["no"]
        }]
      }
    
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2019-03-13
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-09-15
      • 1970-01-01
      相关资源
      最近更新 更多