ibm-cloud - 如何将Watson Speech to Text精确度提高？

如何将Watson Speech to Text精确度提高？

时间：2017-07-28 23:01:54

标签： ibm-cloud speech-recognition speech-to-text watson

据我所知，Watson Speech To Text在口语会话和1或2位发言者方面有所调整。我也知道它可以比WAV和OGG更好地处理FLAC。

我想知道如何在声学方面改进算法识别。

我的意思是，增加音量有帮助吗？也许使用一些压缩过滤器？降噪？

什么样的预处理可以为这项服务提供帮助？

1 个答案:

答案 0 :(得分：4)

提高基本模型准确性的最佳方法（非常准确但非常一般）是使用Watson STT定制服务：https://www.ibm.com/watson/developercloud/doc/speech-to-text/custom.html。这样您就可以根据域的具体情况创建自定义模型。如果您的域名与基本模型捕获的域名不匹配，那么您可以期望识别准确性大大提升。

回顾你的评论“我也知道它可以比WAV和OGG更好地处理FLAC”，事实并非如此。 Watson STT服务提供对flac，wav，ogg和其他格式的完全支持（请参阅文档的这一部分：https://www.ibm.com/watson/developercloud/doc/speech-to-text/input.html#formats）。