在Android上使用音素识别的Pocketsphinx识别准确性差,法语

时间:2016-04-25 00:42:24

标签: android speech-recognition cmusphinx pocketsphinx phoneme

我正在开发一个项目,我必须将Pocketsphinx的语音功能集成到Android应用程序中。事实上,我必须整合Pocketpshinx提供的音素识别功能,该功能应该能够用法语识别音素,例如:语音识别器应该能够识别音节(如“de”,“re”,“se”等),辅音(如“m”,“f”,“g”等),双辅音(如“ kl“,”ks“,”gr“等)和元音(如”a“,”o“,”e“等)。 现在,我已经集成了Pocketsphinx来识别上面提到的音素,但是我的结果非常糟糕。例如,当我发出“o”时,识别的结果有时是:“SIL ff ei au”(即使我根本没有发出字母“f”和“e”),或者在开头出现了其他内容这不是发音。在开头出现的字母并不总是相同的(有时候我会得到“ll”,“uu”等)。但有时候,我发音的字母出现在开头(例如“a”,我得到“SIL aa SIL”),但这种情况很少发生。 所以,你们可以请帮忙,让我知道可能是什么问题以及解决这个问题的任何建议?我是否需要使用我感兴趣的这些字母创建语言模型和字典(因为字母数是固定的)?或者,我是否需要对声学模型进行调整,或者训练声学模型?

非常感谢你!

Leutrim

1 个答案:

答案 0 :(得分:1)

在您的模型中找到feat.params并根据您的选择更改 -cmuinit 值,此外,&#34; -kws_threshold&#34; 的值为<强> 1e-40f 用于消除误报。

相关问题