对于不熟悉Verizon的SongID程序的人来说,它是一个可通过Verizon的VCast网络下载的免费应用程序。它会在歌曲中的任何一点听一首歌10秒钟,然后将这些数据发送给一些全知的算法兽,将其咀嚼起来并送回所有ID3标签(艺术家,专辑,歌曲等......)
前两部分和最后一部分很简单,但是在录制声音发送后的处理过程中会发生什么?
我认为它必须采用声音文件(什么格式?),解析它(如何?用什么?)一些关键标识符(这些是什么?波函数的常规属性?相位/移位/幅度/等),并根据数据库进行检查。
我在网上找到的关于它如何工作的一切都像我上面输入的一样通用。
此服务基于a 复杂的音频识别 结合高级音频的算法 指纹技术和大型 歌曲的数据库。当你上传一个 音频文件,它正在被分析 音频引擎。在分析期间 音频“指纹”被提取出来 通过比较它来确定 音乐数据库。完成后 这个认可过程,信息 关于他们匹配的歌曲 概率显示在屏幕上。
答案 0 :(得分:5)
所有这些服务都是通过从客户端采样的音频数据中获取“指纹”,将其发送到服务器并将其与指纹数据库进行比较来实现的。
Shazam的一位开发人员撰写了一篇关于该技术如何运作的非常翔实的white paper。这应该为您提供所需的所有信息。