computer-vision - 密集的SIFT VS HOG

时间：2014-07-07 20:25:56

标签： computer-vision sift

您好我是Computer Vision的新手。我正在研究Dense SIFT和HOG。对于密集SIFT，算法只将每个点视为感兴趣点并计算其梯度向量。 HOG是用渐变矢量描述图像的另一种方式。

我认为Dense SIFT是HOG的特例。在HOG中，如果我们将bin大小设置为8，则每个窗口有4个块，每个块有4个单元格，块步长与块大小相同，我们仍然可以为此窗口获得128个暗淡的向量。我们可以设置任何窗口步幅来滑动窗口以检测整个图像。如果这两个算法的窗口步幅相同，它们可以得到相同的结果。

我不确定我是否正确。任何人都可以帮助我吗？

答案 0 :(得分：7)

SIFT描述符选择16x16然后将其划分为4x4窗口。在这4个窗口中的每个窗口上，它计算直方图的直方图。在计算该直方图时，它还在相邻角度之间执行插值。一旦你拥有了所有4x4窗口，它就会使用一半窗口大小的高斯，以16x16块的中心为中心，对整个16x16描述符中的值进行加权。

另一方面，HoG只计算一个简单的定向梯度直方图，如名称所示。

由于所涉及的高斯权重，我认为SIFT更适合描述一个点的重要性，而HoG没有这样的偏差。由于这个原因，（理想情况下）如果所有特征向量连接成一个巨大的向量（这是我的观点，可能不是真的），HoG应该更适合于密集SIFT上的图像分类。