关于神经网络的一般图片问题

时间:2019-04-27 04:58:21

标签: python tensorflow

我一直在尝试制作一个可以比较两个不同动漫角色的神经网络。我添加了很多卷积,因为似乎添加更多抽象将使我想做的事情受益。

model.add(Conv2D(512, (2,2), activation='relu'))
model.add(Conv2D(256, (2,2), activation='relu'))
model.add(Conv2D(128, (2,2), activation='relu'))
model.add(Conv2D(64, (2,2), activation='relu'))

像上面那样设置它们是一个好主意吗?我将图片处理为20px x 20px,以提高速度。

整理数据是一场噩梦,我使用VLC手动将图片放在正确的文件夹中。我注意到有些其他字符的图片。我还应该添加这些吗?为神经网络组织图片的一般做法是什么?

1 个答案:

答案 0 :(得分:0)

这在很大程度上取决于您要实现的目标。

首先,将神经网络与数据获取/处理任务分离。通常,数据越好(更清晰),您的结果就会越好。

在图像识别中,有2个标准数据集被广泛使用。 MNIST和Fashion-MNIST。它们相对简单,但是为基准测试模型提供了一个很好的工具。另外,您还可以获得有关如何创建数据集和组织数据集的一些想法。

您的模型可能会产生一些结果,但并不完美。您至少需要一个输出层(我假设您在这里进行分类),并且可以使用一些正则化。看看this教程。它是keras,而不是张量流,但是很好地解释了一个简单而有效的模型。