tensorflow - 如何设想在3色通道的图像上卷积/合并 - Thinbug

如何设想在3色通道的图像上卷积/合并

时间：2016-06-16 07:47:01

标签： tensorflow convolution pooling

我是初学者，我理解mnist教程。现在我想了解一下SVHN数据集。与mnist相比，它配备了3个颜色通道。我很难想象卷积和合并如何与颜色通道的附加维度一起工作。

有没有人有好的方式来考虑它或链接给我？

我感谢所有输入：）

1 个答案:

答案 0 :(得分：3)

这很简单，区别仅在于第一次卷积：

在灰色图片中，输入的形状为[batch_size, W, H, 1]，因此您的第一个卷积（让我们说3x3）具有形状[3, 3, 1, 32]的滤镜，如果您想要在之后有32个尺寸。
在RGB图像中，输入形状为[batch_size, W, H, 3]，因此您的第一个卷积（仍为3x3）具有形状[3, 3, 3, 32]的滤镜。

在这两种情况下，输出形状（步幅为1）为[batch_size, W, H, 32]