如何读取二进制文件?

时间:2018-11-06 21:05:15

标签: python file-io binary corruption hex-editors

我正在尝试获取一个二进制文件,并使用python对其进行反向加密。

问题在于Python无法读取文件中的实际内容,而且内部数据似乎也已损坏。

从python打印出二进制文件会产生:

b'[\xbb\x90\x92\x00\xdd\x7f\xe5\xe9\x81y\x82\x9a[\x0fOf\x19\t\xe8k\xa8R\xb5\x0c\x9f\xadZA\xb5\xd3\xef\xcd\xa9#U\xef\x996\xdc+N\xbe\xc8D\x1c?\xa8\xb3\xd7#\xbf\xb7\x18\xcd\xdf\xe5\xe5\xcf\xb5`?\xe3[J\x06\x041).'

HxD产生:

5B BB 90 92 00 DD 7F E5 E9 81 79 82 9A 5B 0F 4F 66 19 09 E8 6B A8 52 B5 0C 9F AD 5A 41 B5 D3 EF CD A9 23 55 EF 99 36 DC 2B 4E BE C8 44 1C 3F A8 B3 D7 23 BF B7 18 CD DF E5 E5 CF B5 60 3F E3 5B 4A 06 04 31 29 2E

Python不仅错过了第一个字节,而且开始在E9字节周围大量破坏东西。

我该如何解决?

编辑:我读取文件的代码如下。 python调试器和print函数产生如上所述的错误。

binary_file= open("Challenge-RE-Obfuscated", "rb")
full_string = binary_file.read()

2 个答案:

答案 0 :(得分:3)

bytes表示中,可打印字符按原样显示,因此0x5b显示为[,0x79显示为y,等等。

答案 1 :(得分:2)

我认为Python可能正在按照您的要求进行操作。至少对我的口译员来说看起来一样!

inp = '5B BB 90 92 00 DD 7F E5 E9 81 79 82 9A 5B 0F 4F 66 19 09 E8 6B A8 52 B5 0C 9F AD 5A 41 B5 D3 EF CD A9 23 55 EF 99 36 DC 2B 4E BE C8 44 1C 3F A8 B3 D7 23 BF B7 18 CD DF E5 E5 CF B5 60 3F E3 5B 4A 06 04 31 29 2E'

bb = bytes(int(b, base=16) for b in inp.split())

给予bb

b'[\xbb\x90\x92\x00\xdd\x7f\xe5\xe9\x81y\x82\x9a[\x0fOf\x19\t\xe8k\xa8R\xb5\x0c\x9f\xadZA\xb5\xd3\xef\xcd\xa9#U\xef\x996\xdc+N\xbe\xc8D\x1c?\xa8\xb3\xd7#\xbf\xb7\x18\xcd\xdf\xe5\xe5\xcf\xb5`?\xe3[J\x06\x041).'

和:

' '.join('{:02x}'.format(b) for b in bb)

给予:

'5b bb 90 92 00 dd 7f e5 e9 81 79 82 9a 5b 0f 4f 66 19 09 e8 6b a8 52 b5 0c 9f ad 5a 41 b5 d3 ef cd a9 23 55 ef 99 36 dc 2b 4e be c8 44 1c 3f a8 b3 d7 23 bf b7 18 cd df e5 e5 cf b5 60 3f e3 5b 4a 06 04 31 29 2e'

运行[i for i in bb[:10]]list(bb[:10])会给出:

[91, 187, 144, 146, 0, 221, 127, 229, 233, 129]

哪个可能更接近您期望的输出?