在Sphinx4中将语音解码为音素

时间:2013-01-26 06:31:09

标签: speech-recognition sphinx4 phoneme

我可以使用CMUSphinx4将特定语音解码为音素并将这些音素用于进一步的实现吗?

2 个答案:

答案 0 :(得分:3)

如果你正在使用sphinx4(beta 6),框架中有一个名为 getBestPronunciationResult()

的方法
  

“当应用程序需要音素时,使用该方法   最好的最终路径。请注意,单词可能有多个发音,   所以这不等于单词路径,例如一个[HH,W,AH,N]   至[T,UW]三[TH,R,IY]

     

返回:       最佳路径上的单词和相关音素字符串“

位置:src / sphinx4 / edu / cmu / sphinx / result / Result.java

Token.java是完成实际工作的类。

希望这有帮助。

答案 1 :(得分:1)

找到此示例代码,该代码将接收识别结果对象并转储音素 :http://cmusphinx.sourceforge.net/wiki/sphinx4:unittimestamps

我发现本文对理解Sphinx4非常有用:http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4Whitepaper.pdf

一旦我理解了这个架构,我就浏览了javadoc页面上的软件包列表。

希望有所帮助。祝你好运!