模糊匹配图像的部分

时间:2011-03-11 07:12:56

标签: c# image-processing comparison audio

我需要确定较大图像中较小图像的存在。

比赛必须模糊,最好我应该知道它的匹配程度(%),但如果需要,我可以在完成比赛后计算我自己的准确度。

我的目标是将FFT(快速傅里叶变换)频谱图(音乐中的频率可视化)与原始音乐曲目相匹配。我匹配的小图像只是原始轨道的一个子集(在时间和频率范围内)(如下图所示)。

我应该从哪里开始?用于对象识别的相同算法是否适合此任务?

我主要寻找C#/ .Net库/样本,但也有关于实现和问题/陷阱的信息。

我正在考虑使用人工神经网络训练识别。有什么想法吗?

我想要匹配的图像的示例可能如下所示: http://img812.imageshack.us/img812/548/musicspectogram2.png

2 个答案:

答案 0 :(得分:0)

图像关联可能有效。取决于您的完整图像和部分图像之间的差异。

Mathematica中的示例:

enter image description here

如果您发布完整和部分图像的完整示例,也许我们可以解决更多问题。

还存在其他替代方案:比较FFT和进行小波分析,仅列举两个。

答案 1 :(得分:0)

我认为将此问题视为图像识别问题忽略了问题的基本结构。具体来说,您可能希望了解Shazam如何解决问题。关于Quora的这个问题有几个有趣的链接:

http://www.quora.com/How-does-Shazam-work

首先,an academic paper描述算法。您会注意到它们也是从频谱图开始,但从那里使用针对该问题定制的算法选择少量地标。然后,他们基本上将其用作数据库中的指纹ID。

其次,an article on Slate可以理解为更高级别,但可能仍然有用。