训练时,张量流量损失不会减少

时间:2017-11-16 21:02:05

标签: tensorflow deep-learning

我正在为我自己的数据集使用tensorflow对象检测api我遇到了一些问题。我正在使用centos,GPU Geforce 1080,8 GB GPU内存,张量流1.2.1。我在训练集中有500张图像,在测试中有40张图像。我做了以下步骤,我有两个问题。 1.我使用LabelImg工具注释我的图像 2.成功治疗tfrecord 3.我使用了ssd_inception_v2_coco.config。我修改了唯一的路径,没有上课,我没有从头开始训练,我使用了ssd_inception_v2_coco模型检查点。

问题1:从第0步到第3000步,我的损失急剧减少但在此之后,它在5到6之间保持不变。没有得到我如何减少它,但仍然我的模型能够检测所需的对象。 Here is my Tensorborad samples 即使我尝试过不同的模型,例如。在一些步骤丢失后,faster_rcnn_inception_resnet_v2_atrous_coco保持在1和2之间不变

问题2:根据我能够运行eval.py但是收到以下错误的文档: 警告:root:以下类没有基本事实示例:该程序终止后为0。 我尝试同时运行train.py和eval.py同样的错误。 请给我一个建议。我是张量流初学者所需的建议。

1 个答案:

答案 0 :(得分:2)

您在Tensorboard上看到的损失曲线非常正常。最初,损失将迅速下降,但随着时间的推移似乎会“触底反弹”。训练是一个缓慢的过程,经过多次迭代后,您应该会看到稳定的下降。