Java:解压缩比压缩慢得多

时间:2011-06-17 01:06:58

标签: java file-io zip

我有一些代码可以压缩文件,然后通过网络将其解压缩,然后在另一端解压缩。我还在测试代码,源和目标都是一样的。压缩文件大约需要一分钟。解压缩文件大约需要一个小时。我认为我的代码中必定存在一个缺陷才能产生如此大的差异。这是解压缩的代码:

public String uncompressLocalZip(String filename,String strUUID,ParentEntry pe,boolean bControlFileProgress) {
        final int BUFFER = 2048;
        BufferedOutputStream out  = null;
        ZipInputStream zis = null;

        try {

            FileInputStream fis = new FileInputStream(Constants.conf.getFileDirectory() + Constants.PATH_SEPARATOR + strUUID + Constants.PATH_SEPARATOR + filename);
            zis = new  ZipInputStream(new BufferedInputStream(fis));
            ZipEntry entry;
            long totallength = 0;
            long size = 0;
            if (pe !=null)
                size = pe.getSize();


            while((entry = zis.getNextEntry()) != null) {
                System.out.println("Extracting: " +entry);
                int count;
                byte data[] = new byte[BUFFER];
                // write the files to the disk

                File fileOutput = new File(Constants.conf.getFileDirectory() + Constants.PATH_SEPARATOR + strUUID + Constants.PATH_SEPARATOR + Constants.conf.getUncompressFolderName() + Constants.PATH_SEPARATOR + entry.getName());
                new File(fileOutput.getParent()).mkdirs();


                BufferedOutputStream fos = new BufferedOutputStream(new FileOutputStream(fileOutput));

                out = new BufferedOutputStream(fos, BUFFER);
                while ((count = zis.read(data, 0, BUFFER)) != -1) {
                       out.write(data, 0, count);
                       totallength += count;

            }
            out.flush();

        }

     }
     catch(Exception e) {
        e.printStackTrace();
        return("FAILED");
     }
     finally {
        try {if ( out!= null) out.close();} catch (IOException ioe) {}
        try {if ( zis!= null) zis.close();} catch (IOException ioe) {}

     }

    return("SUCCESS");      



}

以下是zip代码:

public void createLocalZip(String filename,ProcessEntry pe) {
    ZipOutputStream out=null;
    try {

        File fileOutput = new File (filename);
        out = new ZipOutputStream(new BufferedOutputStream(new FileOutputStream(fileOutput)));
        long totallength=0;
        long size = pe.getParentEntry().getSize();

        String strStartDirectory;
        if (pe.getParentEntry().isDirectory())
            strStartDirectory=pe.getParentEntry().getUrl();
        else
            strStartDirectory=pe.getParentEntry().getFolder();



        for (int i=0;i<pe.getParentEntry().tableModel3.getRowCount();i++) {
            FileEntry fe = pe.getParentEntry().tableModel3.getFileEntry(i);
            File fileInput = new File (fe.getUrl());
            FileInputStream input = new FileInputStream(fileInput);
            BufferedInputStream in = new BufferedInputStream(input);

            String strRelativeDir = fe.getUrl().substring(strStartDirectory.length()+1,fe.getUrl().length());

            ZipEntry entry = new ZipEntry(strRelativeDir);

            out.putNextEntry(entry);


            byte[] bbuf = new byte[2048];
            int length=0;




             while ((in != null) && ((length = in.read(bbuf)) != -1)) {

                    out.write(bbuf,0,length);
                    totallength += length;
                    pe.setProgress((int) (totallength*100/size));

             }

             in.close();


        }






    }
    catch (Exception e) {
        System.out.println(e.getMessage());
    }
    finally {
        try {if (out!=null) out.close();} catch(IOException ioe){}
    }


}

更新:此特定测试的压缩率约为90%(1.2GB至约100MB)。所以我认为它可能是针对解压缩与压缩的额外写入磁盘,尽管我预计接近10倍差异而不是60倍。

3 个答案:

答案 0 :(得分:2)

不要使用BufferedOutputStream对您的OutputStream进行双重包装(您只需要1个BufferedOutputStream包装器),并在完成写入后将其关闭。

另外,ZipEntry可以是目录,因此请检查并相应处理。

答案 1 :(得分:0)

我没有真正的大文件来测试你的代码,所以我只能猜测。

  1. 您说未压缩的zip大小超过1 GB。这可能不仅适合你的记忆,如果有什么东西迫使VM适应内存中的所有东西,它将不得不交换。使用分析器观察您的程序。

  2. 确保在写入后关闭每个FileOutputStream。 (你创建了很多,只关闭了最后一个。)

  3. 我不确定ZipInputStream实现(可能会强制你的BufferedStream缓冲大量数据)。您可以尝试使用ZipFile(基本上允许随机访问)。

答案 2 :(得分:0)

考虑使用专门的库来进行压缩/解压缩。 http://sevenzipjbind.sourceforge.net/可能有帮助。