从zip存档中提取文件,不包括某些文件名

时间:2016-06-21 15:14:06

标签: python python-3.x zipfile

在Python中,如何在保留文件夹结构的同时提取zip存档,但从提取中排除某些文件名(文件类型)?例如,我想要排除所有.tif图像。

我使用的是Python 3.x和zipfile模块。

2 个答案:

答案 0 :(得分:1)

将已过滤的members传递给extractall()archive.extractall(members=(member for member in archive.namelist() if not member.endswith('.tif')))

def extractall(self, path=None, members=None, pwd=None):
    """Extract all members from the archive to the current working
       directory. `path' specifies a different directory to extract to.
       `members' is optional and must be a subset of the list returned
       by namelist().
    """
    if members is None:
        members = self.namelist()

    for zipinfo in members:
        self.extract(zipinfo, path, pwd)

答案 1 :(得分:1)

自从我使用这个例程已经有一段时间了,所以我不得不把它挖出来。 您可能希望测试/适应您的特定需求。

排除if语句仅检查要提取的文件名的最后三个字符,您可以使用.split('.')更改此选项以检查完整扩展名,因为现在有多个文件超过3个扩展名字符。

这是为Windows编写的,如果在其他操作系统上运行,您可能想要更改某些位

此代码保留了文件夹结构,但可能不是最快的例程(尽管我从来没有抱怨过:

import zipfile


def unzip_file(zippedfile = '', targetdir = '', exclude_ext = ''):

    if zippedfile == '': ## this is the .zip file
        return
    if targetdir == '':
        targetdir = os.path.join(os.path.dirname(zippedfile), os.path.basename(zippedfile)[:-4])    
    if not os.path.exists (targetdir):
        os.makedirs (targetdir)

    zfile = zipfile.ZipFile(zippedfile)

    for name in zfile.namelist():
        (dirName, fileName) = os.path.split(name)
        if not dirName == '':
            if not os.path.exists (os.path.join(targetdir, dirName)):
                os.makedirs (os.path.join(targetdir, dirName))
        if fileName == '':
            # directory
            newDir = os.path.join(targetdir, dirName)
            if not os.path.exists(newDir):
                os.makedirs (newDir)
        else:
            # file
            if exclude_ext == '':
                print ('Extracting File : ' + name)
                fd = open(os.path.join(targetdir, name), 'wb')
                fd.write(zfile.read(name))
                fd.close()
            else:
                if not exclude_ext == name[-3:]:
                    print ('Extracting File : ' + name)
                    fd = open(os.path.join(targetdir, name), 'wb')
                    fd.write(zfile.read(name))
                    fd.close()                    
                else:
                    print ('File with extension ' + exclude_ext + ' is excluded')
    zfile.close()

    return

祝你好运。