【问题标题】:Google Speech API metadata doesn't effect the results or conversion methodGoogle Speech API 元数据不会影响结果或转换方法
【发布时间】:2018-06-22 17:53:20
【问题描述】:

我正在使用以下函数参数将语音转换为文本,但我为元数据参数设置的额外参数对带或不带参数的转换结果没有影响。

function transcribe_async_gcs($bucketName, $objectName, $languageCode = 'en-US', $options = ['enableAutomaticPunctuation'=> true,'enableWordTimeOffsets'=> false,'encoding'=> 'FLAC','sampleRateHertz ' => 44100, "元数据"=> [ "interactionType"=> "PHONE_CALL", "industryNaicsCodeOfAudio"=> 621210, "microphoneDistance"=> "NEARFIELD", "originalMediaType"=> "AUDIO", "recordingDeviceType"=> "PHONE_LINE", "originalMimeType"=> "audio/mp3", "audioTopic"=> "appointment"],'useEnhanced' => true])

【问题讨论】:

    标签: speech-recognition speech-to-text google-speech-api google-cloud-speech


    【解决方案1】:

    为了提高语音识别的准确性,除了元数据[1],您还可以在您的配置[2] 中提供短语提示。如果您知道语音的上下文,这可能会提高准确性。还有一个选项可以使用增强的语音识别模型来获得更好的质量结果[3],您需要选择加入数据记录并能够使用一组特殊的机器学习模型。这些都是可选字段,关于音频内容可能会或可能不会对结果产生影响。

    【讨论】:

    • 这些选项可用于提高准确性。如果这些对您不起作用,您需要更具体地了解您的用例,包括您的结果是什么以及您希望通过提供元数据看到什么变化。
    • 所以我正在使用你上面提到的所有建议。我面临的问题是在cloud.google.com/speech-to-text 转录的文件与我通过api 获得的结果不匹配,即使我使用与它们相同的参数。
    • this 是您尝试语音 API 的确切链接吗?在这里,您无法编辑配置部分并添加您在问题中提到的元数据。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多