machine-learning - 使用在大型数据集上训练的PCA来处理较小的数据集

我可以使用经过训练的pca子空间，例如八个要素和一千个时间点来评估单个读数吗？也就是说，如果我保留前六个组件，我的变换矩阵将是8x6并使用它来转换与训练数据相同大小的测试数据将给我一个6x1000向量。

但是如果我想独立地寻找每个时间点的异常怎么办？也就是说，可以而不是使用8x1000测试集，我可以在8x1维度测试向量上使用1000个单独的变换并获得相同的结果吗？该向量将被转换为完全相同的点，就好像它是更大的数据矩阵中的第一行，但是该向量与主轴的距离似乎没有意义。当我对截断的参考数据执行相同的过程时，该距离也不为零，只有整个参考数据集上的所有距离之和为零。因此，如果我无法证明参考数据不是“＃34;异常”，那么如何在测试数据上使用它？

是否存在数据大小＆＃34; object＆＃34;用于训练pca的是物体的大小，可以用它来评估吗？

感谢您提供任何帮助。

使用在大型数据集上训练的PCA来处理较小的数据集

0 个答案: