machine-learning - 音乐分类的最佳功能

时间：2019-05-04 05:55:36

标签： machine-learning neural-network deep-learning audio-analysis

我正在尝试通过从音乐中训练一个神经网络（已被用户本人标记为喜爱）来将音乐分类为可能喜欢或不太喜欢的应用程序。我之前从未做过音频分析，因此对此几乎一无所知。 要使其成为一个准确的分类模型，我需要在音乐数据集中包含哪些功能。例如：-分贝值，频率值，音频长度

谢谢

答案 0 :(得分：1)

声谱图是一种有用的技术，用于可视化声音的频谱以及它们在非常短的时间内如何变化。您可以使用称为“ Mel-频率倒谱系数”（MFCC）的类似技术作为数据集的特征。

您可以使用Librosa's mfcc()函数，该函数根据时间序列音频数据生成MFCC，从而使任务更加轻松

答案 1 :(得分：0)

首先使用Essentia的音乐特征提取器。例如，您可以使用其commandline tool。这为您提供了大量的低级音频功能（30多种类型），节奏（6+多种特征类型）和音调（6+多种特征）。您也可以对Python绑定执行相同的操作。