audio - 自动语音匹配的开源？

自动语音匹配不是自动语音识别，它是比较两个语音音频信号并返回这两个音频信号匹配的百分比。

这种技术通常会像这样的场景一样使用：

发音学习，例如，有单词“Hello”的标准发音信号，对于正在学习英语的学生，他们发出自己的“Hello”，所以我们需要使用ASM技术来比较相似或如何正确的学生宣布。因此我们需要找出一种比较这两个1-D音频信号的算法。

2.我们可以从上面从单个单词延伸到句子。那么如何匹配这些音频信号？

这里的问题是为ASM寻找一些好的开源或商业解决方案。

还是针对这些实际需求的其他任何好的解决方案？

提前致谢！