Python:比较具有不同结构的两个目录并列出新文件

时间:2012-07-02 09:49:12

标签: python file filecompare

我有一个脚本可以将文件从一个文件夹结构复制到另一个具有不同结构的文件夹。

ex. Folder 1
    c.txt
    d.txt
    subdir1
      a.txt
      b.txt

脚本以这种格式将文件/目录从文件夹1复制到文件夹2(文件夹2具有不同的结构)

Folder 2
   subdir2
     c.txt
     d.txt
   subdir1
     a.txt
     b.txt

在文件夹2中,我可以创建自己的文件,如new1.txt,new2.txt。创建新文件后,文件夹2结构将是这样的:

Folder 2
   new1.txt
   new2.txt
   subdir2
     c.txt
     d.txt
   subdir1
     a.txt
     b.txt

现在我需要比较Folder1和Folder2的目录内容。我使用filecmp.dircmp来比较目录内容。 filecmp.dircmp对这些 两个文件夹将给我subdir2,subdir2 / c.txt,subdir2 / d.txt作为新目录和new1.txt和new2.txt的新文件。 但实际上我只创建了new1.txt和new2.txt作为新文件,其他文件只从一个文件夹复制到不同的文件夹。

作为新文件,我只需要new1.txt和new2.txt。知道我该怎么做。我在python中编写这段代码

1 个答案:

答案 0 :(得分:3)

Tim是对的,os.walk是解决方案:

>>> path = r'D:\DATA\FP12210\My Documents\Temp\Python'
>>> import os
>>> files1 = []
>>> for root, dirs, files in os.walk(os.path.join(path, 'Folder 1')):
    files1.extend(files)


>>> files1
['c.txt', 'd.txt', 'a.txt', 'b.txt']
>>> files2 = []
>>> for root, dirs, files in os.walk(os.path.join(path, 'Folder 2')):
    files2.extend(files)


>>> files2
['new1.txt', 'new2.txt', 'a.txt', 'b.txt', 'c.txt', 'd.txt']

然后你可以区分输出:

>>> print [f for f in files2 if f not in files1]
['new1.txt', 'new2.txt']