如何解释张量流模型摘要中打印的输出形状?

时间:2021-03-11 16:50:29

标签: python tensorflow

我有用于 MNIST 数据分类问题的简单多层感知器。

model = tf.keras.Sequential([
  tf.keras.layers.Flatten(),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dense(10, activation='softmax')
])

打印摘要时,我收到以下输出:

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
flatten_8 (Flatten)          (None, 784)               0         
_________________________________________________________________
dense_16 (Dense)             (None, 128)               100480    
_________________________________________________________________
dense_17 (Dense)             (None, 10)                1290      
=================================================================
Total params: 101,770
Trainable params: 101,770
Non-trainable params: 0
_________________________________________________________________

如何解释摘要中打印的输出形状?为什么输出形状元组中没有 therm?为什么第一层不只是(784)?

1 个答案:

答案 0 :(得分:1)

“无”值是指输入样本的数量(批量大小)。为了允许您在不同大小的训练集上进行训练,该值为 None。如果它是一个数字,例如 50,这意味着您只能训练 50 个样本,这通常不是很有用(但偶尔会有应用)。

相关问题