帮助templatizing byteswapping函数,性能命中?

时间:2011-02-03 14:29:19

标签: c++ performance templates bit-manipulation

template<int size>
inline void* byteswap(void* __x);

template<>
inline void* byteswap<2>(void* __x)
{
    return (*(uint16*)__x >> 8) | (*(uint16*)__x << 8);
}

template<>
inline void* byteswap<4>(void* __x)
{
    return (byteswap<4>(__x & 0xffff) << 16) | (bswap_16 (__x >> 16));
}

template<typename T>
inline T byteswap(T& swapIt)
{
    return (T*)byteswap<sizeof(T)>(swapIt);
}    

int main() {
    uint32 i32 = 0x01020304;
    uint16 i16 = 0x0102;

    byteswap(i32);
    byteswap(i16);

    return 0;
}

以上显然甚至没有编译。我很困惑,因为看起来我需要void *作为函数的参数,而且在byteswap&lt; 4&gt;中有些东西变得丑陋了。当我需要调用byteswap&lt; 2&gt;但有参考。

知道如何让它看起来漂亮吗?是否有可能实现(使用内联或其他技巧)使其成为直接执行位操作的性能?

4 个答案:

答案 0 :(得分:4)

这就是我编码的方式:

#include <iostream>

typedef unsigned short uint16;
typedef unsigned int uint32;

template<typename T> T byteswap(T value);

template<>
uint16 byteswap<uint16>(uint16 value)
{
    return (value >> 8)|(value << 8);
}

template<>
uint32 byteswap<uint32>(uint32 value)
{
    return uint32(byteswap<uint16>(value) << 16) | byteswap<uint16>(value >> 16);
}

int main() {
    uint32 i32 = 0x11223344;
    uint16 i16 = 0x2142;

    std::cout << std::hex << byteswap(i32) << std::endl; // prints 44332211
    std::cout << std::hex << byteswap(i16) << std::endl; // prints 4221
}

换句话说,我不会像你那样使用size作为模板参数。

修改
对不起,我的第一个代码是错误的wrt / uint32交换。

答案 1 :(得分:2)

Borrowing from some code

template<int N>
void byteswap_array(char (&bytes)[N]) {
  // Optimize this with a platform-specific API as desired.
  for (char *p = bytes, *end = bytes + N - 1; p < end; ++p, --end) {
    char tmp = *p;
    *p = *end;
    *end = tmp;
  }
}

template<typename T>
T byteswap(T value) {
  byteswap_array(*reinterpret_cast<char (*)[sizeof(value)]>(&value));
  return value;
}

答案 2 :(得分:0)

我会像那样改写:

template < size_t size >
inline void sized_byteswap(char* data);

template <>
inline void sized_byteswap< 2 >(char* data)
{
    uint16_t* ptr = reinterpret_cast<uint16_t*>(data);
    *ptr = (*ptr >> 8)|(*ptr << 8);
}

template <>
inline void sized_byteswap< 4 >(char* data)
{
    uint32_t* ptr = reinterpret_cast<uint32_t*>(data);
    *ptr = (*ptr >> 24)|((*ptr & 0x00ff0000) >> 8)|((*ptr & 0x0000ff00) << 8)|(*ptr << 24);
}

template < typename T >
T byteswap(T value)
{
    sized_byteswap< sizeof(T) >(reinterpret_cast<char*>(&value));
    return value;
}

int main()
{
    uint32 i32 = byteswap(uint32(0x01020304));
    uint16 i16 = byteswap(uint16(0x0102));

    return 0;
}

答案 3 :(得分:0)

我认为你在概念上错误的是byteswap(2)和byteswap(4)的定义。我不认为你定义的方式是正确的,请参考网址 http://www.iis.sinica.edu.tw/~kathy/vcstl/templates.htm#T6