没有任何编码的Gzip压缩和解压缩

时间:2016-08-19 11:03:57

标签: java python base64 gzip compression

我想在java中解压缩一个字符串,这是在python中压缩的gzip。

通常,我在python中对压缩字符串使用base64编码,然后在java中执行解压缩之前解码该压缩字符串。这在使用base64编码时工作正常。

但是有没有办法解压缩java中的字符串,这是在python中压缩的gzip而不使用base64编码。

实际上,我想将压缩的二进制数据http发布到二进制数据被解压缩的服务器上。在python和服务器端完成压缩和http post是java。

我在python中尝试了没有base64编码的代码,并在java中使用缓冲读取器读取,然后使用getBytes()将读取的压缩字符串转换为byte [],并将其提供给GZIPInputStream进行解压缩。但这引发了一个例外:

java.io.IOException: Not in GZIP format at 
java.util.zip.GZIPInputStream.readHeader(GZIPInputStream.java:154)
    at java.util.zip.GZIPInputStream.<init>(GZIPInputStream.java:75)
    at java.util.zip.GZIPInputStream.<init>(GZIPInputStream.java:85)
    at GZipFile.gunzipIt(GZipFile.java:58)
    at GZipFile.main(GZipFile.java:42)

请给我一个解决方案,无需任何编码即可执行压缩和解压缩。有没有办法在python中的http post中发送二进制数据?

这是python中的压缩代码:

import StringIO  
import gzip  
import base64  
import os  


m='hello'+'\r\n'+'world'  

out = StringIO.StringIO()  
with gzip.GzipFile(fileobj=out, mode="wb") as f:  

    f.write(m)  
f=open('comp_dump','wb')  
f.write(base64.b64encode(out.getvalue()))  
f.close()  

这是java中的解压缩代码:

//$Id$

import java.io.*;  
import java.io.FileInputStream;  
import java.io.FileOutputStream;  
import java.io.IOException;  
import java.util.zip.GZIPInputStream;  
import javax.xml.bind.DatatypeConverter;  
import java.util.Arrays;

public class GZipFile
{


    public static String readCompressedData()throws Exception
    {
            String compressedStr ="";
            String nextLine;
            BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream("comp_dump")));
            try
            {
                    while((nextLine=reader.readLine())!=null)
                    {
                            compressedStr += nextLine;
                    }
            }
            finally
            {
                    reader.close();
            }
            return compressedStr;
    }

    public static void main( String[] args ) throws Exception
    {
            GZipFile gZip = new GZipFile();
            byte[] contentInBytes = DatatypeConverter.parseBase64Binary(readCompressedData());

            String decomp = gZip.gunzipIt(contentInBytes);
            System.out.println(decomp);
    }

    /**
     * GunZip it
     */
    public static String gunzipIt(final byte[] compressed){

            byte[] buffer = new byte[1024];
            StringBuilder decomp = new StringBuilder() ;

            try{

                    GZIPInputStream gzis = new GZIPInputStream(new ByteArrayInputStream(compressed));

                    int len;
                    while ((len = gzis.read(buffer)) > 0) {

                            decomp.append(new String(buffer, 0, len));

                    }

                    gzis.close();

            }catch(IOException ex){
                    ex.printStackTrace();
            }
            return decomp.toString();
    }

}

1 个答案:

答案 0 :(得分:0)

  

并非每个byte []都可以转换为字符串,并且转换回来   可以给其他字节。

请在压缩时明确定义编码,并在解压缩时执行相同操作。否则,您的OSJVM等...将为您完成。并且可能会搞砸它。

例如:在我的Linux机器上:

的Python

import sys
print sys.getdefaultencoding()
>> ascii

爪哇

System.out.println(Charset.defaultCharset());
>> UTF-8

相关答案:https://stackoverflow.com/a/14467099/3014866