Google语音添加了多余的数字,并误记了9和10位数字的字符串

时间:2018-08-08 20:51:53

标签: google-cloud-platform speech-recognition speech-to-text google-speech-api

场景:用户说出9或10位数字的ID,然后使用Google语音进行转录。

Google STT有时会强制将号码转换为电话号码格式,并添加神秘数字以使其适合(从而无法准确捕获该号码)。

例如,如果呼叫者说“ 485839485”,则它可能会显示为“ 485-839-4850”,并带有呼叫者从未说过的额外数字。有时也会在数字中间添加数字。

即使添加了诸如“ 1、2、3、4、5、6、7、8、9、0”之类的提示,也会发生这种情况

有人找到解决此问题的方法吗?

2 个答案:

答案 0 :(得分:0)

有许多开源语音识别工具包可以可靠地识别数字序列,而且是免费的,您只需要花一个小时来设置它们。

答案 1 :(得分:0)

此行为似乎与执行转录任务时API模型所使用的逻辑有关。由于此问题是内部过程的一部分,该过程试图使转录的数字适合电话格式,因此我认为目前尚无解决方案。但是,我建议您查看为查看此问题而创建的this ticket,以及语音转文本API的Release Notes文档,以跟踪添加的新功能服务。

相关问题