语音识别,字典中的单词

时间:2014-06-20 22:54:48

标签: speech-recognition

我正在使用传统程序进行单词识别。 我正在提取MFCC功能。然后我正在创建一个代码簿来进行矢量量化。之后,我训练了两个单词的离散HMM:1stWrod,2dWord。

到目前为止,我一直在执行这样的分类: 我通过适当的特征提取和量化估计了两个训练模型中新音频片段的概率。我说音频对应的概率最高的类。这给了我很好的结果。

但是,任何音频片段都被归类为任何一个词,有时则不是。我不怎么说不对应任何一个班级。我不确定我是否可以通过使用所有其他数据训练另一个模型来解决这个问题,因为它非常不同,我认为模型还不够。

1 个答案:

答案 0 :(得分:1)

一种非常简单的方法是得分归一化。

首先,对于每个单词模型(W1W2),您需要计算许多真阳性测试实例的可能性。 然后,您可以使用高斯拟合,计算每个单词模型的平均值和标准差来对这些可能性进行建模。 最后,在检查未知单词wj是否属于W1W2时,您只需将其得分标准化如下:

score normalization

模型W1W2

,其中LLjj-th字测试实例的对数似然。 以下-3中的任何分数表示特定测试词无法通过标准化过程中使用的模型(W1或W2)正确建模。如果两个标准化分数都小于-3,那么测试词不能是W1W2的模型,因此是另一个词。

每个模型需要一个正确个真正的阳性测试词,以便正确估计平均值和标准偏差。那么,正确的号码是多少,这取决于您的实际数据。