为什么扩张的卷积可以保持分辨率?

时间:2017-08-22 05:25:40

标签: machine-learning computer-vision convolution

enter image description here

动画来自here。我想知道为什么要求扩张卷积保持分辨率。显然,蓝色输入为7x7,绿色输出为3x3。

修改

解决分辨率损失的一种方法是将输入填充大约当前感受区大小的一半,但

  1. 这基本上破坏了扩张卷积不会失去分辨率的说法,因为它是保留分辨率的填充物。为了使输入具有相同的输出大小,传统的卷积需要更少的填充。
  2. 由于填充以指数方式增长,相对不那么小的膨胀因子将导致严重填充的输入图像。想象一下1024x1024输入,10倍扩张,它将变成大约2048x2048(如果我错了,请告诉我)。这是原始尺寸的4倍,这意味着大多数卷积都是在填充区域而不是实际输入上完成的。就个人而言,这似乎与我非常违反直觉。

1 个答案:

答案 0 :(得分:8)

这确实是一个带有5x5滤波器的扩张卷积。如果您将动画的蓝色部分想象为填充的3x3图像,则会保留分辨率。

关于你的编辑,重点在于你所链接的帖子中的这个陈述:扩张的卷积支持感知领域的指数式扩展而不会损失分辨率或覆盖率

填充是为了保持分辨率。那是正确的。

我们真正想要的是扩大感受野的大小。在您链接的帖子中,3个3x3扩张的卷曲在不断增加的扩张中,我们已经在特征图中实现了15x15的感知域。

为了达到相当于3x3卷积和没有覆盖率损失没有损失分辨率,我们可以以3的步幅(4会导致丢失)覆盖范围)和极其沉重的填充(在某种程度上,它与你所说的一样,主要是填充零的卷积)。但是,我们需要4个3x3卷积,步幅3而不是3个,以达到15x15的感知范围。

最重要的是,与扩张的卷积案例相比,正常的卷积会有更多的卷积,这些卷积是没有意义的。