我可以使用CMUSphinx4将特定语音解码为音素并将这些音素用于进一步的实现吗?
答案 0 :(得分:3)
如果你正在使用sphinx4(beta 6),框架中有一个名为 getBestPronunciationResult()
的方法“当应用程序需要音素时,使用该方法 最好的最终路径。请注意,单词可能有多个发音, 所以这不等于单词路径,例如一个[HH,W,AH,N] 至[T,UW]三[TH,R,IY]
返回: 最佳路径上的单词和相关音素字符串“
位置:src / sphinx4 / edu / cmu / sphinx / result / Result.java
Token.java是完成实际工作的类。
希望这有帮助。
答案 1 :(得分:1)
找到此示例代码,该代码将接收识别结果对象并转储音素 :http://cmusphinx.sourceforge.net/wiki/sphinx4:unittimestamps
我发现本文对理解Sphinx4非常有用:http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4Whitepaper.pdf
一旦我理解了这个架构,我就浏览了javadoc页面上的软件包列表。
希望有所帮助。祝你好运!