speech-recognition - 如何为CMU Sphinx创建语音语言模型？

我需要为俄语制作语音识别。我按照project page的教程。

在教程中我看到了

您可以使用语音字典为您的语言转换文本，将其转换为语音字符串。只需用相应的转录替换单词即可。由于手机的数量很少，文字也不应该很大，只是一本书就可以了。

但在哪里可以找到拼音字典？我如何用整本书中的相应转录替换这些单词？

或者......我能在哪里找到完整的语音模型？

已更新

我用line：

创建了文件test.txt

SIL i0 lj j a1 i1 lj f j e0 v gj e1 nj i0 j pj e0 t r o1 v z o0 l o o t o 1 j tj e0 lj o1 n o0 k SIL

这是线形式测试wav文件，将替换的俄语单词替换为拼音表示字典（ru.dic）。

然后我使用SRILM使用命令构建模式：

ngram-count -interpolate -text test.txt -lm test.phonetic.lm

接下来我用命令启动它：

pocketsphinx \ bin \ Debug \ Win32 \ pocketsphinx_continuous.exe -samprate 16000 -allphone testModel \ test.phonetic.lm -hmm cmusphinx-ru-5.2 -remove_noise no -infile testModel \ decoder-test.wav -backtrace是

但是当我使用它时，我发现错误的手机有错误的结果。

如何为CMU Sphinx创建语音语言模型？

1 个答案: