我有用于 MNIST 数据分类问题的简单多层感知器。
model = tf.keras.Sequential([
tf.keras.layers.Flatten(),
tf.keras.layers.Dense(128, activation='relu'),
tf.keras.layers.Dense(10, activation='softmax')
])
打印摘要时,我收到以下输出:
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
flatten_8 (Flatten) (None, 784) 0
_________________________________________________________________
dense_16 (Dense) (None, 128) 100480
_________________________________________________________________
dense_17 (Dense) (None, 10) 1290
=================================================================
Total params: 101,770
Trainable params: 101,770
Non-trainable params: 0
_________________________________________________________________
如何解释摘要中打印的输出形状?为什么输出形状元组中没有 therm?为什么第一层不只是(784)?
答案 0 :(得分:1)
“无”值是指输入样本的数量(批量大小)。为了允许您在不同大小的训练集上进行训练,该值为 None。如果它是一个数字,例如 50,这意味着您只能训练 50 个样本,这通常不是很有用(但偶尔会有应用)。