如何过滤一组数据中的异常值?

时间:2016-01-05 18:22:35

标签: python filter filtering

我试图过滤数据,如第一张图片所示。有些异常值会定期发生。过滤这些异常值的最佳方法是什么?我希望有一组数据,如第二张图所示。

我的目标是在用多项式过滤后拟合这些数据。

有没有办法在python中付出很多努力?如果没有,那么对正确算法的暗示就会很棒。

带有明显异常值的数据: Data with marked outliers

目标: Goal

1 个答案:

答案 0 :(得分:0)

您可以使用scikit-learn运行多项式回归。确保创建足够的功能,以便获得在观察时看起来很好的适合线。一旦你有了这个多项式,那么我认为通过找到它们与多项式函数的距离并设置一个阈值来找到异常值是很简单的。