将.caffemodel转换为yolo / object检测

时间:2018-01-13 14:02:50

标签: caffe coreml

我有一个.caffemodel文件,将其转换为.coreml文件,我在应用程序中使用它来识别特殊类型的瓶子。它有效,但只显示瓶子是否在图片中。

现在我想知道瓶子在哪里,偶然发现https://github.com/hollance/YOLO-CoreML-MPSNNGraphhttps://github.com/r4ghu/iOS-CoreML-Yolo,但我不知道如何将我的.caffemodel转换成这些文件;甚至可能是这样的转换,还是培训必须完全不同?

1 个答案:

答案 0 :(得分:3)

如果您当前的模型是分类器,则无法使用它来检测图片中对象的位置,因为没有经过培训可以执行此操作。

您必须训练一个不只是进行分类的模型,还需要训练对象检测。检测部分将告诉您对象在图像中的位置(它为您提供零个或多个边界框),而分类部分将告诉您这些边界框中的对象是什么。

一种非常简单的方法是在模型中添加“回归”图层,除了分类之外还输出4个数字(因此模型现在有两个输出而不是一个)。然后训练它使这4个数字成为图像中物体的边界框的坐标。 (此模型只能检测图像中的单个对象,因为它只返回单个边界框的坐标。)

要训练此模型,您不仅需要图像,还需要图像内部物体的边界框的坐标。换句话说,您需要使用边界框信息注释您的训练图像。

YOLO,SSD,R-CNN和类似的模型建立在这个想法的基础上,允许每个图像多次检测。

相关问题