我在python中编写了一些语音识别代码,我希望它能够启用微软语音识别系统,但我希望该系统忽略所有常规gui接口命令。因此,如果我说出它识别的内容,它将忽略它并让我的程序处理它。
答案 0 :(得分:1)
我相信有一个名为pyspeech的python API,它是Microsoft语音API的包装器。有关可能有用的一些答案,请参阅pyspeech (python) - Transcribe mp3 files?。
通常,当人们看到“常规GUI界面命令”时,使用Microsoft语音API,这意味着他们已经实例化了共享识别器。您需要实例化一个inproc识别器。您可以通过在应用程序中实例化SpeechRecognitionEngine()来完成此操作。见SpeechRecognitionEngine Class。我怀疑您正在实例化共享识别器 - SpeechRecognizer Class
几年前在http://msdn.microsoft.com/en-us/magazine/cc163663.aspx发表了一篇关于微软演讲的非常好的文章。这可能是迄今为止我发现的最好的介绍性文章。它有点过时了,但非常好。 (测试结束后,AppendResultKeyValue方法被删除了。)
这两个问题可能会为您提供一些其他好的信息: