在字典中对元素组合进行配对,无需重复

时间:2012-11-26 10:12:06

标签: python combinatorics itertools

在python中,我有一个这样的字典......

pleio = {'firstLine': {'enf1': ['54', 'set'], 
                      'enf2': ['48', 'free'], 
                      'enf3': ['34', 'set'], 
                      'enf4': ['12', 'free']}

        'secondLine':{'enf5': ['56','bgb']
                      'enf6': ['67','kiol']
                      'enf7': ['11','dewd']
                      'enf8': ['464','cona']}}

我想制作成对的组合而不重复内部字典中的元素,最终得到这样的结果......

{'enf3': ['34', 'set'], 'enf2': ['48', 'free']}
{'enf3': ['34', 'set'], 'enf1': ['54', 'set']}
{'enf3': ['34', 'set'], 'enf4': ['12', 'free']}
{'enf2': ['48', 'free'], 'enf1': ['54', 'set']}
{'enf2': ['48', 'free'], 'enf4': ['12', 'free']}
{'enf1': ['54', 'set'], 'enf4': ['12', 'free']}

我建立了一个让我这样做的功能......

import itertools

def pairwise():
    '''
    '''
    leti=[]
    for snp, enfs in pleio.items():        
        for x in itertools.combinations(enfs, 2 ):
            leti.append(x)    
    pleopairs=[]
    for i in leti:
        pipi={}
        for c in i:
            pipi[c]= enfs[c]
        pleopairs.append(pipi)

..但我想知道是否有一种更有效的方式,比如来自itertools或任何其他来源的另一个特定功能。顺便说一句,我在itertools文档中找到了一个名为“pairwise”的函数。但我不知道如何适应它,如果在我的情况下可行,或改善我的尝试。有什么帮助吗?

2 个答案:

答案 0 :(得分:4)

您的combinations方法是正确的,您只需要将每个组合的结果再次转换为词典:

import itertools

def pairwise(input):
    for values in input.itervalues():
        for pair in itertools.combinations(values.iteritems(), 2):
            yield dict(pair)

这个版本是一个生成器,有效地产生对,在内存中没有任何东西比绝对必要的更长。如果您需要列表,只需在生成器上调用list()

list(pairwise(pleio))

输出:

>>> from pprint import pprint
>>> pprint(list(pairwise(pleio)))
[{'enf2': ['48', 'free'], 'enf3': ['34', 'set']},
 {'enf1': ['54', 'set'], 'enf3': ['34', 'set']},
 {'enf3': ['34', 'set'], 'enf4': ['12', 'free']},
 {'enf1': ['54', 'set'], 'enf2': ['48', 'free']},
 {'enf2': ['48', 'free'], 'enf4': ['12', 'free']},
 {'enf1': ['54', 'set'], 'enf4': ['12', 'free']}]

您甚至可以将整个事物组合成一个单线程生成器:

from itertools import combinations

for paired in (dict(p) for v in pleio.itervalues() for p in combinations(v.iteritems(), 2)):
    print paired

哪个输出:

>>> for paired in (dict(p) for v in pleio.itervalues() for p in combinations(v.iteritems(), 2)):
...     print paired
... 
{'enf3': ['34', 'set'], 'enf2': ['48', 'free']}
{'enf3': ['34', 'set'], 'enf1': ['54', 'set']}
{'enf3': ['34', 'set'], 'enf4': ['12', 'free']}
{'enf2': ['48', 'free'], 'enf1': ['54', 'set']}
{'enf2': ['48', 'free'], 'enf4': ['12', 'free']}
{'enf1': ['54', 'set'], 'enf4': ['12', 'free']}

如果您使用的是Python 3,请分别将.itervalues().iteritems()替换为.values().items()

答案 1 :(得分:1)

如果您想要所有配对组合,您可能会使用以下更短的配对,但我不会说这更有效。

[dict([(x,vx),(y,vy)]) for (x,vx) in pleio['firstLine'].iteritems()
                       for (y,vy) in pleio['firstLine'].iteritems()
                       if x < y]

输出

[{'enf3': ['34', 'set'], 'enf4': ['12', 'free']},
 {'enf2': ['48', 'free'], 'enf3': ['34', 'set']},
 {'enf2': ['48', 'free'], 'enf4': ['12', 'free']},
 {'enf1': ['54', 'set'], 'enf3': ['34', 'set']},
 {'enf1': ['54', 'set'], 'enf2': ['48', 'free']},
 {'enf1': ['54', 'set'], 'enf4': ['12', 'free']}]