Question

我使用PocketSphinx进行语音识别。例如，我使用这样的语言模型：

我说＆＃34; Hello world＆＃34;，现在我想要识别的概率/分数列表。喜欢第一个单词＆＃34; Hello＆＃34;可能的匹配可能是：

我不知道PocketSphinx如何代表概率。这只是一个例子。有人有线索吗？

谢谢

莫萨

Answer 1

您可以使用迭代器检索各个假设段：

 print 'Best hypothesis segments: ', [(seg.word, seg.prob) for seg in decoder.seg()]

seg.prob包含置信度分数。要获得有意义的置信度分数，您需要确保您的语言模型足够大。

对于小型单一短语发现，最好使用关键字定位模式。