我需要构建一个脚本(VBS或WSH),它只是在“收听”特定声音时运行一些命令。 因此,它会将音频流(例如“blink.wav”文件)与来自OS(win xp)的任何传入音频轨道进行比较。 请注意,这不是任何语音识别脚本,而是音频驱动软件。
以下是我基本上想要实现的(更加发达的)商业产品。
http://www.zonetrigger.com/sound-detection/
是否有可用的代码示例? SAPI界面对我的目的有用吗? 非常感谢你!
答案 0 :(得分:1)
有开源软件,但将它集成到VBS并不是一件容易的事。例如,您可以使用Python构建很酷的东西:
http://willdrevo.com/fingerprinting-and-audio-recognition-with-python.html
要匹配的整体算法很简单 - 您从目标音频和传入音频流中提取一些功能,并且只是在每个时刻进行比较。