神经网络拥有正常分布的数据是否重要?

时间:2015-10-14 17:50:13

标签: machine-learning statistics neural-network normalization normal-distribution

因此,对数据进行标准化处理之一是将其标准化并将其标准化以使数据正常分布,均值为0且标准差为1,对吗?但是,如果数据不是正常分布的呢?

此外,所需的输出是否也必须正常分配?如果我希望我的前馈网络在两个类(-1和1)之间进行分类,那么将不可能标准化为均值0和1的标准正确分布怎么办?

前馈网是非参数的吗?因此,如果它们是,那么标准化数据仍然很重要吗?人们为什么要对它进行标准化呢?

1 个答案:

答案 0 :(得分:5)

标准化功能不是为了使数据符合正态分布,而是将特征值放在已知范围内,使算法更容易从数据中学习。这是因为大多数算法不是缩放/移位不变的。例如,决策树既是规模也是移位不变的,因此进行规范化对树的性能没有影响。

  

此外,所需的输出是否也必须正常分配?

没有。那不是一件好事。输出是输出的任何输出。您必须确保网络最后一层的激活功能可以进行所需的预测(即:Sigmoid激活不能输出负值或值> 1)。

  

前馈网是非参数的吗?

不,它们通常被认为是参数化的。参数/非参数实际上没有硬定义。谈到这个时,人们可能意味着略有不同的事情。

  

因此,如果它们是,标准化数据仍然很重要吗?

这些事情完全没有任何关系。

  

为什么人们会将其标准化?

这是我提到的第一件事,就是让学习变得更容易/可能。

相关问题