需要帮助矢量化此代码

时间:2013-03-12 11:50:30

标签: c++ opencv vectorization

我有一个8位图像。对于每个像素,我需要计算当前行中的序号位置。例如,如果行是:

32 128 16 64,

然后我需要结果:

1 3 0 2,

因为32是该行中的第1个最高值,128是第3个最高,16个是第0个最高,64个是第2个。

我需要对图像的所有行重复上述过程。这是非矢量化代码:

for (int curr = 0; curr < new_height; ++curr)
{
    vector<pair<unsigned char, char> > ordered;
    for (char i = 0; i < 4; ++i)
    {
        unsigned char val = luma24.at<unsigned char>(curr, i);
        ordered.push_back(pair<unsigned char, char>(val, i));
    }
    sort(ordered.begin(), ordered.end(), cmpfun);
    for (int i = 0; i < 4; ++i)
        signature.at<char>(curr, ordered[i].second) = i;
}

luma24是我正在读取的8位图像,它有new_height行和4列。 signature是一个大小相同的签名图像(暂时忽略符号的差异,因为它不相关) - 它是我存储结果的地方。 cmpfun是一个简单的比较函数。

我试图对上面的代码进行矢量化并得到了这个:

Mat ordinal;
luma24.convertTo(ordinal, CV_16UC1, 256, 0);
Mat sorted = ordinal.clone();
for (int i = 0; i < 4; ++i)
    ordinal(Range::all(), Range(i, i+1)) += i;
cv::sort(ordinal, sorted, CV_SORT_EVERY_ROW | CV_SORT_ASCENDING);
bitwise_and(sorted, Scalar(0x00ff), ordinal);
Mat ordinal8;
ordinal.convertTo(ordinal8, CV_8SC1, 1, 0);
ordinal8.copyTo(signature(Range::all(), Range(0, 4)));

由于OpenCV不对多通道图像执行排序,因此我必须将8位值和8位序数打包到单个16位通道中。这几乎是我需要的,但并不完全。对于示例输入,它给了我:

2 0 3 1

因为最低值在第2列,下一个最低值在第0列,等等。如何在不单独访问每个像素的情况下将其转换为我需要的结果?

基本上,我需要以某种方式对此进行矢量化:

uint8_t x[] = {2, 0, 3, 1};
uint8_t y[4];
for (uint8_t i = 0; i < 4; ++i)
    y[x[i]] = i;

其中x是中间结果,我当前的矢量化代码给了我y是我想要的结果。

可以吗?

2 个答案:

答案 0 :(得分:0)

我相信这会为你做到这一点。它不需要分配或堆栈或排序,但假设您的范围是0-255(例如uint8)。更大的假设:如果你有宽行,它只会是高效的。如果它们真的是4像素宽,那么i <256有点难看。有办法让它消失,但我假设4像素只是一个“例如”为简单起见。

void processRow (int* rowpos, uint8_t* pixelsForRow, int w) {
   uint32_t i, pv, v=0, hist[256]={0};
   for (i=0; i<w; i++)      hist[pixelsForRow[i]]++;
   for (i=0; i<256; i++)    {pv=hist[i]; hist[i]=v; v+=pv;}
   for (i=0; i<w; i++)      rowpos[i] = hist[pixelsForRow[i]]++;
}

好的 - 那它是如何运作的呢? 此函数中的第1行声明并清空直方图表 第2行计算直方图 第3行将其转换为计数排序 - 这就是为什么hist使用比uint8更大的元素大小的原因 第4行应用分类位置。

有两个技巧;首先,在第3行中,直方图“移动1个索引”,这样第一个值总是“0”,不管它是什么,第二个值是第一个计数,依此类推。 第二个技巧是第4行中的“++” - 始终确保序数值是唯一的。

让我们根据您的输入进行尝试:
[32 128 16 64]
第2行:分别为[0,16,32,64,128,255]的[0 ... 1 .... 1 .... 1 ... 1 ... 0] 第3行:分别为[0,16,32,64,128,255]的[0 ... 0 .... 1 ... 2 ... 3 ... 0] 第4行:[1,3,0,2] ......看起来正确
让我们尝试稍微不同的输入:
[32 128 16 32]
第2行:分别为[0,16,32,64,128,255]的[0 ... 1 .... 2 ... 0 ... 1 ... 0] 第3行:分别为[0,16,32,64,128,255]的[0 ... 0 .... 1 ... 3 ... 3 ... 0] 第4行:[1,3,0,2] ......完美的

但我不太确定它是否符合您对矢量化的需求 - :)

答案 1 :(得分:0)

我能想到的另一种方式是, 对于每一行,创建二叉搜索树。在进行顺序遍历时,我们可以得到每个像素的等级。

节点的每个元素都是一个结构

// Members of struct explained here.
// row_pos: stores position of that pixel in that row.
//     we populate this while creating binary search tree. 
//
// rank: stores its rank in that row. ()
//  while doing in-order traversal, we come to know rank of that pixel. At that point only, we update that pixel location with its rank.

typedef struct node
{
    int row_pos, rank; 
    node *left, *right;    // left and right nodes.
};

每一行的步骤顺序为:

a)O(w):通过在节点中存储每个像素的位置来创建二叉搜索树。

b)O(w):开始按顺序遍历。对于每个节点,用rank填充该节点的像素位置(从第一个节点开始计数为0)。