让WAV文件转录与Sphinx4一起使用

时间:2009-10-04 16:55:06

标签: speech-recognition speech-to-text cmusphinx

我的Windows XP系统安装了Sphinx-4并设置了JSAPI。我想将英语口语WAV(或MP3)文件转录成文本。

当我运行"WavFile" demo时 - 它成功运行。

java -jar WavFile.jar

但是,当我像这样传递自己的wav文件时:

java -jar WavFile.jar c:\test.wav

我明白了:

  

加载'jar:file:/ C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/config.xml'中定义的识别器...

     

解码jar:文件:/ C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/12345.wav   结果:一二三四五

似乎这个演示设置为加载并运行内部wav文件(“12345.wav”)或其他东西。

我已经阅读了文档,无法想象如何设置“config.xml”,甚至无法设置放置它的目录。我只是试图使用标准演示获得一个简单的概念证明。

所以,问题是:如何运行Sphinx4程序来转录wav文件?

感谢。

4 个答案:

答案 0 :(得分:6)

需要编写一个使用CMU Dictionary(美国英语)而不是Transcriber.jar支持的数字的新应用程序(基于Transcriber.java)。

很奇怪Sphinx没有这么有用的样本。

答案 1 :(得分:1)

不确定您是否还需要答案。但我认为这个链接是你想要的(但只适用于数字数据): http://cmusphinx.sourceforge.net/sphinx4/src/apps/edu/cmu/sphinx/demo/transcriber/README.html

答案 2 :(得分:1)

我知道这是一个超级老线程,但我只想指出你的例子似乎运行得很好。如果你看一下输出的最后一部分:

解码jar:文件:/ C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/12345.wav结果:一二三四五< ==========解码WAV音频的结果!

答案 3 :(得分:0)

看看pocketsphinx包。它是用C语言编写的,已经为每个平台编译,可以用作命令行或作为应用程序的一部分。我一直在使用命令行,它非常通用。

相关问题