将字节数组(char数组)转换为整数类型(short,int,long)

时间:2012-12-03 06:22:02

标签: c++

我想知道将字节数组转换为short / int / long时系统字节顺序是否重要。如果代码在big-endian和little-endian机器上运行,这会不正确吗?

short s = (b[0] << 8) | (b[1]);
int i = (b[0] << 24) | (b[1] << 16) | (b[2] << 8) | (b[3])

5 个答案:

答案 0 :(得分:18)

是的,字节序很重要。在little endian中,你在short或int的上半部分有最重要的字节 - 即8-15位为short,24-31为int。对于大端,字节顺序需要反转:

short s = ((b[1] << 8) | b[0]);
int i = (b[3] << 24) | (b[2] << 16) | (b[1] << 8) | (b[0]);

请注意,这假设字节数组是小端序。字节数组和整数类型之间的字节顺序和转换不仅取决于CPU的字节顺序,还取决于字节数组数据的字节顺序。

建议将这些转换包装在将知道(通过编译标志或在运行时)系统的字节顺序并正确执行转换的函数中。

此外,为字节数组数据创建标准(例如,总是使用大端),然后使用socket ntoh_sntoh_l将有关字节序的决定卸载到知道此类事情的操作系统socket实现。请注意,默认网络顺序是大端(n中的ntoh_x),因此将字节数组数据作为大端将是最直接的方法。

正如OP(@Mike)所指出的那样,boost也提供了字节序转换功能。

答案 1 :(得分:3)

// on little endian:

unsigned char c[] = { 1, 0 };       // "one" in little endian order { LSB, MSB }

int a = (c[1] << 8) | c[0];         // a = 1

// --------------------------------------------- -------------------------------

// on big endian:

unsigned char c[] = { 0, 1 };       // "one" in big endian order { MSB, LSB }

int a = (c[0] << 8) | c[1];         // a = 1

// --------------------------------------------- -------------------------------

// on little endian:

unsigned char c[] = { 0, 1 };       // "one" in big endian order { MSB, LSB }

int a = (c[0] << 8) | c[1];         // a = 1 (reverse byte order)

// --------------------------------------------- -------------------------------

// on big endian:

unsigned char c[] = { 1, 0 };       // "one" in little endian order { LSB, MSB }

int a = (c[1] << 8) | c[0];         // a = 1 (reverse byte order)

答案 2 :(得分:1)

你可以使用工会。字节序很重要,要改变它,你可以使用x86 BSWAP指令(或其他平台的类似物),由大多数c编译器提供作为内在函数。

#include <stdio.h>
typedef union{
  unsigned char bytes[8];
  unsigned short int words[4];
  unsigned int dwords[2];
  unsigned long long int qword;
} test;
int main(){
  printf("%d %d %d %d %d\n", sizeof(char), sizeof(short), sizeof(int), sizeof(long), sizeof(long long));
  test t;
  t.qword=0x0001020304050607u;
  printf("%02hhX|%02hhX|%02hhX|%02hhX|%02hhX|%02hhX|%02hhX|%02hhX\n",t.bytes[0],t.bytes[1] ,t.bytes[2],t.bytes[3],t.bytes[4],t.bytes[5],t.bytes[6],t.bytes[7]);
  printf("%04hX|%04hX|%04hX|%04hX\n" ,t.words[0] ,t.words[1] ,t.words[2] ,t.words[3]);
  printf("%08lX|%08lX\n" ,t.dwords[0] ,t.dwords[1]);
  printf("%016qX\n" ,t.qword);
  return 0;
}

答案 3 :(得分:0)

不,就字节序而言,这很好,但如果int只有16位宽,则可能会出现问题。

答案 4 :(得分:0)

您指定的问题(使用现有字节数组)将在所有计算机上正常运行。你最终会得到同样的答案。

但是,根据您创建该流的方式,它可能会受到字节序的影响,您可能不会得到您认为的数字。