Base64解码:特定字符串不正确的填充(正确填充)

时间:2017-05-24 17:14:37

标签: python base64 python-3.6

我正在尝试使用Python的base64.b64decode(str)方法对字符串(字节)进行Base64解码:

  

46oWrWpy2gTEGwNnN6Ayy

我确保它有4 ='的倍数用于填充或挫败其中任何一个:

  

46oWrWpy2gTEGwNnN6Ayy =

     

46oWrWpy2gTEGwNnN6Ayy ==

     

46oWrWpy2gTEGwNnN6Ayy ===

     

46oWrWpy2gTEGwNnN6Ayy ============================================== ====

然而我仍然在Python v3.6.1上得到“不正确的填充”。其他字符串也没问题。

我向同事展示,他尝试使用Python 2并观察相同的响应。

我注意删除第一个“4”足以确保Base64解码正常工作。

我有浏览Python's docs(注意案例不适用于Base64)并且尚未进一步冒险进入RFC3548但是想知道其他人是否曾经遇到过类似的问题。有人有任何线索:)?当然这不是Python的Base64解码器中的错误吗?

2 个答案:

答案 0 :(得分:2)

完成了工作。

Base64文本的每个字符都是原始8位的6位。如果一个字符在raw的字节中间,那么你就会遗漏一些剩余的位。维基百科的文章(以及许多在线答案)似乎使用填充作为'0'字节的可互换而不是这种情况(在Base64字典中它应该被编码为A)。

填充不能与丢失的数据互换。

#!/usr/bin/env python3

# We use hexlify for debugging.
import binascii

# We use the Base64 library.
import base64

# Base64 works on multiples of 4 characters..
# ..Sometimes we get 3/2/1 characters and it might be midway through another.
def relaxed_decode_base64(data):

 # If there is already padding we strim it as we calculate padding ourselves.
 if '=' in data:
  data = data[:data.index('=')]

 # We need to add padding, how many bytes are missing.
 missing_padding = len(data) % 4

 # We would be mid-way through a byte.
 if missing_padding == 1:
  data += 'A=='
 # Jut add on the correct length of padding.
 elif missing_padding == 2:
  data += '=='
 elif missing_padding == 3:
  data += '='

 # Actually perform the Base64 decode.
 return base64.b64decode(data)

# Debugging
print(str(relaxed_decode_base64('46oWrWpy2gTEGwNnN6Ayy')) + '\n')

testString = ''

for count in range(0, 1024):
 testString += '/'
 print(str(len(testString)) + ' - ' + testString)
 print(binascii.hexlify(relaxed_decode_base64(testString)))
 input()

答案 1 :(得分:0)

似乎是您的数据中的问题,与Python无关:

$ echo 46oWrWpy2gTEGwNnN6Ayy | base64 -d
㪭jrÚÄg7 2base64: invalid input
$ echo 46oWrWpy2gTEGwNnN6Ayy= | base64 -d
㪭jrÚÄg7 2base64: invalid input
$ echo 46oWrWpy2gTEGwNnN6Ayy== | base64 -d
㪭jrÚÄg7 2base64: invalid input
$ echo 46oWrWpy2gTEGwNnN6Ayy=== | base64 -d
㪭jrÚÄg7 2base64: invalid input
$ echo 46oWrWpy2gTEGwNnN6Ayy==== | base64 -d
㪭jrÚÄg7 2base64: invalid input

我设法以这种方式解码(删除了最后一个'y'):

$ echo 46oWrWpy2gTEGwNnN6Ay | base64 -d
㪭jrÚÄg7 2