PocketSphinx:获取单词的概率

时间:2014-10-26 20:45:02

标签: python speech-recognition voice-recognition cmusphinx

我使用PocketSphinx进行语音识别。例如,我使用这样的语言模型:

  • 你好
  • 您好
  • 世界
  • 地球

我说" Hello world",现在我想要识别的概率/分数列表。喜欢第一个单词" Hello"可能的匹配可能是:

  • "你好" 90%
  • "您好" 10%
  • "世界" 30%
  • "地球" 30%

我不知道PocketSphinx如何代表概率。这只是一个例子。有人有线索吗?

谢谢

莫萨

1 个答案:

答案 0 :(得分:2)

您可以使用迭代器检索各个假设段:

 print 'Best hypothesis segments: ', [(seg.word, seg.prob) for seg in decoder.seg()]

seg.prob包含置信度分数。要获得有意义的置信度分数,您需要确保您的语言模型足够大。

对于小型单一短语发现,最好使用关键字定位模式。