使用在大型数据集上训练的PCA来处理较小的数据集

时间:2017-04-03 02:13:23

标签: machine-learning pca

我可以使用经过训练的pca子空间,例如八个要素和一千个时间点来评估单个读数吗?也就是说,如果我保留前六个组件,我的变换矩阵将是8x6并使用它来转换与训练数据相同大小的测试数据将给我一个6x1000向量。

但是如果我想独立地寻找每个时间点的异常怎么办?也就是说,可以而不是使用8x1000测试集,我可以在8x1维度测试向量上使用1000个单独的变换并获得相同的结果吗?该向量将被转换为完全相同的点,就好像它是更大的数据矩阵中的第一行,但是该向量与主轴的距离似乎没有意义。当我对截断的参考数据执行相同的过程时,该距离也不为零,只有整个参考数据集上的所有距离之和为零。因此,如果我无法证明参考数据不是“#34;异常”,那么如何在测试数据上使用它?

是否存在数据大小" object"用于训练pca的是物体的大小,可以用它来评估吗?

感谢您提供任何帮助。

0 个答案:

没有答案