【发布时间】:2020-05-06 01:46:33
【问题描述】:
我想做一个语音到文本分析的项目,我想 1) 说话者识别 2) 说话者分类 3) 语音到文本。现在我正在测试为微软、谷歌、AWS、IBM等公司提供的各种API 我可以在 Microsoft 中找到您可以选择用户注册和说话人识别 (https://cognitivewuppe.portal.azure-api.net/docs/services/563309b6778daf02acc0a508/operations/5645c3271984551c84ec6797) 然而,所有其他平台确实有说话人分类,但没有说话人识别。在演讲者分类中,如果我理解正确,它将能够“区分”用户,但除非我不注册他们,否则它将如何识别?我只能找到 azure 中可用的注册选项
但我想确定一下,所以只是想在这里检查一下,也许我正在查看正确的文档,或者也许有其他方法可以在 Google 云、Watson 和 AWS 转录中实现这一目标。如果是这种情况,请各位帮我解决一下
【问题讨论】:
标签: google-cloud-platform ibm-watson azure-cognitive-services google-cloud-speech azure-speech