python - 张量流图像对象位置

时间：2017-06-12 07:04:05

标签： python machine-learning tensorflow

这是一个相当简单的问题，但我是该领域的新手。使用此tutorial我有一种检测某些模式或功能的好方法。然而，我测试的图像很大，并且我寻找的特征通常只占图像的一小部分。当我在整个画面上运行时，分类很糟糕，但是当它被缩放并裁剪时，分类是好的。

我考虑过编写一个脚本，将图像分成许多不同的图像并对所有图像进行测试（时间并不是一个巨大的问题）。然而，这似乎仍然效率低下且不理想。我想知道最好的建议，也是最容易实现的解决方案。

我正在使用Python。

答案 0 :(得分：1)

这似乎是一个简单的问题，但答案并非如此简单。本地化是一项艰巨的任务，需要比分类整个图像更多的腿部工作。人们已经尝试过许多不同的工具和模型。一些型号包括R-CNN，它以与您建议的方式不太相似的方式查看许多区域。或者，您可以查看YOLO或TensorBox等模型。

您希望在研究论文中寻找的术语是“本地化”。如果你正在寻找一个肮脏的解决方案（这不是时间敏感的），那么滑动窗口肯定是第一步。我希望这可以让你进入你的项目，你可以从那里进步。