Keras LSTM中的批量培训

时间:2020-04-19 10:26:05

标签: keras lstm loss

如果在由batch_size构成的LSTM中使用32的Keras,是将损失函数应用于每个序列然后进行平均,还是直接应用于所有序列而没有考虑每个序列?

谢谢。

1 个答案:

答案 0 :(得分:1)

由于batch_size为1意味着在一个序列之后将更新权重,因此批次大小为32将意味着在这32个序列之后将更新权重。

因此,仅在这32个序列块之后才更新权重,所有序列的损失均为平均值,因为否则,如果损失将被更新为每个序列本身,则实际上将用batch_size =表示纯SGD。 1。

相关问题