model - Pocketsphinx建立小词汇模型

我想为Pocketsphinx（.lm）用德语建立一个小的词汇模型，该模型只能识别0-9之间的德语数字。使用Voxforge de-de模型时，性能非常差（几乎无法识别）。我用类似的英语方法尝试了TIDIGTS-使用仅包含数字的专用模型。这一工作正常。因此，显然我需要构建一个仅包含我的数字的.lm模型-为此，我已经记录了很多wav文件并将其转录为所需的XML格式。但是，当我查看https://cmusphinx.github.io/wiki/tutoriallm/的操作方法时，只会得到关于如何建立具有大量词汇的语言模型或如何基于SRILM进行构建的提示-由于限制性许可，这对于我来说完全没有用。那么，如何根据我的wav数据构建LM？

Pocketsphinx建立小词汇模型

1 个答案: