Python:从比较两个绝对路径获取相对路径

时间:2011-09-02 18:52:42

标签: python

说,我有两条绝对路径。我需要检查其中一条路径引用的位置是否是另一条路径的后代。如果是真的,我需要找出祖先的后代的相对路径。在Python中实现这个的好方法是什么?我可以从中受益的任何图书馆吗?

6 个答案:

答案 0 :(得分:143)

os.path.commonprefix()os.path.relpath()是您的朋友:

>>> print os.path.commonprefix(['/usr/var/log', '/usr/var/security'])
'/usr/var'
>>> print os.path.commonprefix(['/tmp', '/usr/var'])  # No common prefix: the root is the common prefix
'/'

您可以测试公共前缀是否是其中一条路径,即其中一条路径是否是共同的祖先:

paths = […, …, …]
common_prefix = os.path.commonprefix(list_of_paths)
if common_prefix in paths:
    …

然后您可以找到相对路径:

relative_paths = [os.path.relpath(path, common_prefix) for path in paths]

您甚至可以使用此方法处理两个以上的路径,并测试所有路径是否都在其中一个路径之下。

PS :根据您的路径的样子,您可能需要先执行一些规范化(这在人们不知道它们是否总是以'/'结尾的情况下很有用,或者如果某些路径是相对的)。相关功能包括os.path.abspath()os.path.normpath()

PPS :正如Peter Briggs在评论中提到的,上述简单方法可能会失败:

>>> os.path.commonprefix(['/usr/var', '/usr/var2/log'])
'/usr/var'

即使/usr/var 不是路径的公共前缀。在调用commonprefix()之前强制所有路径以'/'结尾解决了这个(特定)问题。

PPPS :如bluenote10所述,添加斜杠并不能解决一般问题。以下是他的后续问题:How to circumvent the fallacy of Python's os.path.commonprefix?

PPPPS :从Python 3.4开始,我们有pathlib,一个提供更好的路径操作环境的模块。我想通过获取每个路径的所有前缀(使用PurePath.parents()),获取所有这些父集的交集,并选择最长的公共前缀,可以获得一组路径的公共前缀。

PPPPPS :Python 3.5为这个问题引入了一个正确的解决方案:os.path.commonpath(),它返回一个有效的路径。

答案 1 :(得分:67)

os.path.relpath

  

将相对文件路径从当前目录或可选起点返回到路径。

>>> from os.path import relpath
>>> relpath('/usr/var/log/', '/usr/var')
'log'
>>> relpath('/usr/var/log/', '/usr/var/sad/')
'../log'

因此,如果相对路径以'..'开头 - 则意味着第二条路径不是第一条路径的后代。

在Python3中,您可以使用PurePath.relative_to

Python 3.5.1 (default, Jan 22 2016, 08:54:32)
>>> from pathlib import Path

>>> Path('/usr/var/log').relative_to('/usr/var/log/')
PosixPath('.')

>>> Path('/usr/var/log').relative_to('/usr/var/')
PosixPath('log')

>>> Path('/usr/var/log').relative_to('/etc/')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/local/Cellar/python3/3.5.1/Frameworks/Python.framework/Versions/3.5/lib/python3.5/pathlib.py", line 851, in relative_to
    .format(str(self), str(formatted)))
ValueError: '/usr/var/log' does not start with '/etc'

答案 2 :(得分:14)

另一种选择是

>>> print os.path.relpath('/usr/var/log/', '/usr/var')
log

答案 3 :(得分:2)

我找了一个python2的解决方案,没有任何外部依赖。找不到符合我需求的东西。虽然commonprefix只比较字符串而不是路径元素,但我写道:

def _relpath(cwd, path):
    # Create a relative path for path from cwd, if possible
    if sys.platform == "win32":
        cwd = cwd.lower()
        path = path.lower()

    _cwd = os.path.abspath(cwd).split(os.path.sep)
    _path = os.path.abspath(path).split(os.path.sep)
    equal_until_pos = None
    for i in xrange(min(len(_cwd), len(_path))):
        if _cwd[i] != _path[i]:
            break
        else:
            equal_until_pos = i
    if equal_until_pos is None:
        return path
    newpath = [".." for i in xrange(len(_cwd[equal_until_pos + 1:]))]
    newpath.extend(_path[equal_until_pos + 1:])
    if newpath:
        return os.path.join(*newpath)
    return "."

欢迎任何评论!

答案 4 :(得分:0)

编辑:请参阅jme的回答,了解Python3的最佳方法。

使用pathlib,您有以下解决方案:

我们想要检查son是否是parent的后代,两者都是Path个对象。 我们可以在list(parent.parts)的路径中获取部分的列表。 然后,我们只检查儿子的开头是否等于父母的段列表。

>>> lparent = list(parent.parts)
>>> lson = list(son.parts)
>>> if lson[:len(lparent)] == lparent:
>>> ... #parent is a parent of son :)

如果你想获得剩下的部分,你可以做到

>>> ''.join(lson[len(lparent):])

它是一个字符串,但您当然可以将其用作其他Path对象的构造函数。

答案 5 :(得分:0)

在Python 3中使用pathlib编写jme的建议。

from pathlib import Path
parent = Path(r'/a/b')
son = Path(r'/a/b/c/d')            
​
if parent in son.parents:
    print(son.relative_to(parent)) # returns Path object equivalent to 'c/d'
相关问题