python - 较大的神经网络收敛于较大的误差而不是较小的误差

我在测试中注意到，增加参数数量需要一段时间来检查您如何准备输入数据或如何初始化权重。我发现通常增加参数的数量需要不同地初始化权重（意味着用较小的值初始化）或者你需要规范化输入数据（我猜你已经这样做了），或者甚至将它们除以一个常数因子来制作它们小。有时候降低学习速度会有所帮助，因为你的成本函数会随着参数的增加而变得更加复杂，而且之前工作正常的学习率可能会因你的新案例而过大。但要给出一个确切的答案是非常困难的。

其他：你的意思是更大的错误是什么意思？你在做分类还是回归？ 另外您是在谈论列车组或开发/测试组的错误吗？这是一个很大的不同。很可能是（如果你正在谈论开发/测试集），你过度拟合数据，因此在开发/测试集上得到更大的错误（偏差 - 方差权衡）...你能给我们更多的细节吗？？

较大的神经网络收敛于较大的误差而不是较小的误差

1 个答案: