Numpy fft冻结更长的样本

时间:2014-05-07 20:03:31

标签: python audio numpy signal-processing fft

我正在玩numpy.fft库。我有200个带单个音符的.wav文件,每个文件长约4秒。我逐个运行numpy.fft但是对于4.5秒或更长时间的样本numpy.fft冻结。我不明白为什么会这样?此外,如果我明确指定fft的长度,该功能工作正常,但它检测错误的频率(它检测频率偏移一个或两个半音更高)。

这是我的代码:

(framerate, sample) = wav.read(wav_file)
monoChannel = sample.mean(axis=1)
fft_length = int(duration * framerate)     # duration is usually around 4sec long
FFT = numpy.fft(monoChannel, n=fft_length)

对于fft_length小于216090的样本numpy.fft工作正常,对于任何更长的fft,算法会挂起但是在我按下终端中的ctrl + C后它会继续。

我正在使用python 2.7.3

我是FFT的新手,我真的很想了解这里发生了什么。

1 个答案:

答案 0 :(得分:1)

np.fft中使用的FFT算法在输入长度具有许多小素数因子时非常好(意味着O(n log n)),并且非常差(意味着需要O(n ^ 2)的天真DFT) )当输入大小是素数时。查看两个幂和下一个最小素数的一些示例时序:

In [69]: a = np.random.rand(1024)
In [70]: b = np.random.rand(1031)

In [71]: %timeit np.fft.fft(a)
10000 loops, best of 3: 20.8 µs per loop

In [72]: %timeit np.fft.fft(b)
100 loops, best of 3: 2.09 ms per loop

In [73]: a = np.random.rand(65536)
In [74]: b = np.random.rand(65537)

In [75]: %timeit np.fft.fft(a)
100 loops, best of 3: 3.16 ms per loop

In [76]: %timeit np.fft.fft(b)
1 loops, best of 3: 11.8 s per loop

对于您的具体情况,请注意:

216090 = 2 * 3**2 * 5 * 7**4
216091 = 216091 (prime)
216092 = 2**2 * 89 * 607

因此:

In [77]: %timeit np.fft.fft(np.random.rand(216090))
10 loops, best of 3: 37.1 ms per loop

In [78]: %timeit np.fft.fft(np.random.rand(216092))
10 loops, best of 3: 149 ms per loop

In [79]: %timeit np.fft.fft(np.random.rand(216091))
# Got bored and killed it before it finished, should take ~2 min
# based on the other results for prime numbers