machine-learning - 时间序列DFT信号聚类

您可以简单地将虚部视为向量中的另一个组件。在其他应用程序中，您将要忽略它！

但是你将面临其他更严峻的挑战。

数据挖掘，特别是聚类，很少像appliyng函数a（dft）和函数b（k-means）一样简单，然后你得到了结果，万岁。对不起 - 这不是探索性数据挖掘的工作方式。

首先，对于许多时间序列，DFT根本没有帮助。在其他情况下，您首先必须进行适当的重新取样或分割，或摆脱季节性等无趣的影响。即使DFT有效，它也可能会强调诸如采样频率或某些干扰之类的伪像。

然后你会遇到一个主要问题：k-means基于所有属性具有相同重要性的假设。 DFT基于完全相反的观点：第一个组件捕获大部分信号，后者只捕获与它的微小偏差（这就是使用它作为降维的动机）。因此，基于这种直觉，你可能永远不会应该在DFT系数上应用k-means。与此同时，数据挖掘反复表明，这些应用程序是“统计无意义的”。但仍然可以提供有用的结果...所以你可以尝试，但要小心验证你的结果，避免过于热情或乐观。

借助FFT，它可以将数据集转换为dft信号。它有助于为每个小数据集计算DFT。

时间序列DFT信号聚类

2 个答案: