speech-recognition - 在Sphinx4中将语音解码为音素

时间：2013-01-26 06:31:09

标签： speech-recognition sphinx4 phoneme

我可以使用CMUSphinx4将特定语音解码为音素并将这些音素用于进一步的实现吗？

答案 0 :(得分：3)

如果你正在使用sphinx4（beta 6），框架中有一个名为 getBestPronunciationResult（）

的方法

“当应用程序需要音素时，使用该方法   最好的最终路径。请注意，单词可能有多个发音，   所以这不等于单词路径，例如一个[HH，W，AH，N]   至[T，UW]三[TH，R，IY]

返回：       最佳路径上的单词和相关音素字符串“

位置：src / sphinx4 / edu / cmu / sphinx / result / Result.java

Token.java是完成实际工作的类。

希望这有帮助。

答案 1 :(得分：1)

找到此示例代码，该代码将接收识别结果对象并转储音素：http://cmusphinx.sourceforge.net/wiki/sphinx4:unittimestamps

一旦我理解了这个架构，我就浏览了javadoc页面上的软件包列表。

希望有所帮助。祝你好运！