signals - 检测元音和辅音？

检测元音和辅音？

时间：2018-08-01 21:22:49

标签： signals signal-processing speech-recognition speech-synthesis

我正在语音信号处理领域，我想从音频文件中检测元音和辅音并为其加上时间标记。

我想要诸如（只是示例，不确定其工作原理）：

使用单词完成： D [0-3 ms]， o [4-7 ms]， n < / strong> [8-11毫秒]和 e [12-13毫秒]。

我认为我正面临某种分类问题，我考虑使用支持向量机或隐马尔可夫模型或 Recurcurant神经网络

有关如何操作，元音或辅音检测，时间标记的任何建议。

可能我会使用MATLAB。你怎么看？

谢谢。

1 个答案:

答案 0 :(得分：0)

以防万一，您更喜欢使用HMM，我的建议是使用HTK（隐藏的markov工具包），其中有一个精确/详细的教程，但是它使用C（ANSI）。使用HMM时，您必须首先训练HMM（在有监督的情况下），当然，您需要完整的音素/标记为train / examples的标签。最后，您需要做的是所谓的音素识别，以识别其他人的语音/测试音频。之后，每个被识别的音素/标签的持续时间可以在被HTK识别后计算出来。

相关问题

分开元音和辅音

如何检测程序中的元音和辅音

用辅音计数元音

计算元音，辅音和数字

辅音和元音斯威夫特

元音和辅音Java

计算元音和辅音

存储和计数独特的元音/辅音

检测元音和辅音？

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？