标签: python-3.x tensorflow deep-learning keras-layer autoencoder
我正在制作一个变分自动编码器卷积模型,以预测视频中的下一个帧序列。我发现此链接可在入口处处理15个视频帧,并预测接下来的15帧。我有以下问题:应该使用多少个ConvLSTM2D层?层数是否取决于视频帧数?是否有必要像链接示例中那样保持数据尺寸?
Guide Link
我在tensorflow页面上找不到信息。非常感谢您可以帮助我