我怎样才能整理这个文件名清理工具?

时间:2011-07-25 01:44:28

标签: python indexing

我知道有更好的方法可以做到这一点,但我不知道它是什么。我正在整理文件列表,我想删除“通常的嫌疑人”,以便我可以将一个列表与另一个列表进行比较。

根据我的理解,name.replace()会查看listToClean中的每个项目以查找我选择的短语,如果存在则替换它们。必须有更好的方法来做到这一点......

def cleanLists(listToClean, extList):
    cleanFileList = []
    for filename in listToClean:
        name = os.path.split(filename)[1]
        ext = os.path.splitext(name)
        if ext[1] in extList:
            name = name.replace(ext[1], '') 
            name = name.replace('1080p', '')
            name = name.replace('1080P', '')
            name = name.replace('720p', '')
            name = name.replace('720P', '')
            name = name.replace('HD', '')
            name = name.replace('(', ' ')
            name = name.replace(')', '')
            name = name.replace('.', ' ')
            cleanFileList.append(name)
    cleanFileList.sort(key=lambda x: x.lower())
    return cleanFileList

2 个答案:

答案 0 :(得分:5)

bad_names = ['1080p', '720p'] # and so on
for bad_name in bad_names:
    name = name.replace(bad_name, '')

显然,从每个名称清除的单词声明将发生在函数的顶部,而不是文件列表中的每次迭代。

答案 1 :(得分:1)

# do this once
import re
bad_strings = ['1080p', '720p'] # etc
regex = '|'.join(re.escape(x) for x in bad_strings)
subber = re.compile(regex, re.IGNORECASE).sub

# do this once for each name
name = name.replace(ext[1], '')
# OR maybe better: name = ext[0] # see below
cleanFileList.append(subber('', name))

考虑扩展列表中的'csv',你有一个名为'summary_of_csv_files.csv'的文件...