标签: python machine-learning pytorch cluster-analysis transformer
我正在尝试对音乐数据集(以整数表示的音符)执行无监督聚类任务。在使用 k-means 对它们进行聚类之前,我想使用 Transformer 对不同歌曲之间的相关性进行编码,并且我对如何最好地解决这个问题有些困惑。 我最初的想法是取encoder层的输出,直接应用聚类方法,但是每个向量的维度从输入到输出急剧增加(从100到10000),这不适合聚类。我不确定这是否是我自己的实现错误,但我想知道以下内容: