TensorFlow对象检测API掩码-RCNN训练导致OOM错误

时间:2018-12-06 08:30:44

标签: python tensorflow object-detection-api

我正在尝试使用TensorFlow对象检测API在单个GPU上训练Mask-RCNN(ResNet101)模型。

This the configuration I'm using for Mask-RCNN

培训开始后立即占用约24GB的CPU RAM。在10分钟的标记处,当第一轮评估开始时,我的所有32GB CPU RAM都被填满,进程被终止。

我的数据集由训练集中的1个样本(即1张图像)和评估集中的1个样本组成。图像为775 x 522像素。每个样本(图像+框+蒙版)在磁盘上的大小不得超过2MB。我这样做是为了确保将数据集对内存消耗的影响降到最低。

我还尝试在同一数据集上训练Faster RCNN模型,并且该模型按预期工作(使用2-3 GB的CPU RAM)。

This is the configuration I'm using for Faster RCNN

为什么在Mask-RCNN的训练和评估过程中内存使用如此之高(与Faster RCNN相比),我该怎么做才能减少它?

0 个答案:

没有答案