caffe - 将.caffemodel转换为yolo / object检测

如果您当前的模型是分类器，则无法使用它来检测图片中对象的位置，因为没有经过培训可以执行此操作。

您必须训练一个不只是进行分类的模型，还需要训练对象检测。检测部分将告诉您对象在图像中的位置（它为您提供零个或多个边界框），而分类部分将告诉您这些边界框中的对象是什么。

一种非常简单的方法是在模型中添加“回归”图层，除了分类之外还输出4个数字（因此模型现在有两个输出而不是一个）。然后训练它使这4个数字成为图像中物体的边界框的坐标。（此模型只能检测图像中的单个对象，因为它只返回单个边界框的坐标。）

要训练此模型，您不仅需要图像，还需要图像内部物体的边界框的坐标。换句话说，您需要使用边界框信息注释您的训练图像。

YOLO，SSD，R-CNN和类似的模型建立在这个想法的基础上，允许每个图像多次检测。