如何根据部分字符串匹配过滤字典?

时间:2017-08-01 14:47:36

标签: python string python-3.x dictionary lookup

我有一本价值词典:

dic = {1: "a1+b+c", 2: "a1+c+v", 3: "a1+z+e", 4: "a2+p+a", 5: "a2+z+v", 6: "a3+q+v", ...} 

我在Flask中有一个页面,其中包含字典中每个部分字符串值的复选框,例如复选框“a”,“b”,“c”,...等。在页面上,复选框位于组a1,a2,a3等中。

我需要根据所选复选框的值按部分值过滤字典,例如,当在组a1中选择“c”时,它将返回:

 1: a1+b+c
 2: a1+c+v

从组a2中选择“z”时,它将返回:

 5: "a2+z+v"

生成错误的代码是:

sol = [k for k in dic if 'a1' in k]

有人能指出我正确的方向吗?

1 个答案:

答案 0 :(得分:1)

您可以使用非常短的功能轻松解决此问题:

def lookup(dct, *args):
    for needle in args:
        dct = {key: value for key, value in dct.items() if needle in value}
    return dct

例如:

>>> dic = {1: "a1+b+c", 2: "a1+c+v", 3: "a1+z+e", 4: "a2+p+a", 5: "a2+z+v", 6: "a3+q+v"}
>>> lookup(dic, "a1", "c")
{1: 'a1+b+c', 2: 'a1+c+v'}

然而,总是需要迭代每个"针"的所有键。如果你有一个帮助字典(我会在这里使用collections.defaultdict)存储所有匹配一个针的键(假设+应该是你字典中的分隔符),你可以做得更好:

from collections import defaultdict

helperdict = defaultdict(set)
for key, value in dic.items():
    for needle in value.split('+'):
        helperdict[needle].add(key)

helperdict现在包含与值的某个特定部分匹配的所有键:

>>> print(dict(helperdict))
{'z': {3, 5}, 'p': {4}, 'a1': {1, 2, 3}, 'a3': {6}, 'v': {2, 5, 6}, 'a2': {4, 5}, 'e': {3}, 'b': {1}, 'a': {4}, 'c': {1, 2}, 'q': {6}}

使用set.intersection可以快速获得不同组合的所有匹配项:

>>> search = ['a2', 'z']
>>> matches = set.intersection(*[helperdict[needle] for needle in search])
>>> {match: dic[match] for match in matches}
{5: 'a2+z+v'}

它肯定比第一种方法更长,需要更多的外部存储器,但如果你计划进行多次查询,它会更快。

相关问题