切点处的解是最佳解决方案吗?

时间:2018-06-16 04:30:39

标签: machine-learning neural-network gradient-descent regularized

根据我对this文章的理解,蓝色圆圈是水平曲线,蓝点是最小化成本函数的最佳解决方案。黄色圆圈是L2范数约束。

我们需要的解决方案是尽可能地降低成本函数,同时也在圈内。意思是,解决方案是黄色圆圈和水平曲线之间的切点。

但是,我的问题是,如果切点处的W值不能完全降低成本函数,那么这是如何解决的?只有蓝点才能最大限度地降低成本函数。

enter image description here

1 个答案:

答案 0 :(得分:1)

如果没有约束,蓝点可以最大限度地降低成本函数。 如果最小化受L2范数约束,那么蓝点不能成为解决方案,因为它违反了约束。因此,点w *是解决方案。

使用L2约束的原因是我们试图最小化测试数据的误差,而不是列车数据(即我们不直接对最小化损失函数感兴趣)。更简单的解决方案(具有更小的L2范数)倾向于过度设置,因此我们期望测试和列车误差之间的差距更小(这是期望的)。

相关问题