“框架阻挡”是什么意思?

时间:2013-03-05 15:07:40

标签: c# speech-recognition naudio audio-processing feature-extraction

我很好奇“框架阻挡”,这是我在网站上看到的第一步。它说这些步骤应该遵循音频的特征提取:

  1. 框架拦截
  2. 窗口
  3. fft
  4. mel-frequency warping
  5. 倒谱
  6. “帧阻挡”是什么意思?任何人都可以为此提供算法或代码(c#)吗?

    顺便说一下,这个特征提取的步骤是否正确?

    在提取特征之前,我应该怎么做“预过滤”aduio?

    感谢。

1 个答案:

答案 0 :(得分:2)

以下是我在谷歌搜索中发现的术语“框架阻止” - 谷歌自动完成“框架阻止语音信号”。

http://books.google.com/books?id=B9VuCBBYzJ4C&pg=PA21&lpg=PA21&dq=frame+blocking+of+speech+signal&source=bl&ots=FCzp86g8F0&sig=P5aolL4OAAyPwxZ2nMd-Ye_5M_I&hl=en&sa=X&ei=oLM3UeK3DsTfrQHyvYD4DQ&sqi=2&ved=0CC4Q6AEwAA#v=onepage&q=frame%20blocking%20of%20speech%20signal&f=false

相关文字:

  

语音信号处理中最常用的方法是基于短时分析。预先聚集的信号被阻挡成 N 样本的帧。帧持续时间通常在10-30mxec之间。该范围内的值表示频谱变化率与系统复杂性之间的折衷。适当的帧持续时间最终取决于语音生成系统中发音器的速度。一些声音(例如,停止辅音)表现出明显的光谱过渡,这可能导致光谱峰值移动多达80 Hz / msec(Mar76)。图2.3说明了一个字对 J 帧的阻塞。重叠量在一定程度上控制参数在帧与帧之间的变化速度。

现在问题是,你在框架拦截方面做了什么尝试?