python中值的所有可能组合

时间:2016-02-28 18:07:12

标签: python dictionary combinations itertools

版本: Python 3.4.3

嗨,我正在尝试创建一个脚本,该脚本从html文件中的某些选项中读取可用选项,并创建一个包含所有可能选项的数据库,根据它们的值为它们分配唯一ID。

这是html的结构:

              <select id="perforar" onchange="Actualiza(this.id, this.options[this.selectedIndex].value)">
              <option value="g1">sin perforacion</option>
              <option value="g2">1 Linea de perforación</option>
              <option value="g3">2 Lineas de perforación</option>
              <option value="g4">3 Lineas de perforación</option>
              <option value="g5">4 Lineas de perforación</option>
              <option value="g6">5 Lineas de perforación</option>
              <option value="g7">6 Lineas de perforación</option>
            </select></td>
            </tr><tr><td>Ennoblecimiento: </td><td>
            <select id="ennoblecimiento" onchange="Actualiza(this.id, this.options[this.selectedIndex].value)">
              <option value="h1">sin ennoblecimiento</option>
              <option value="h2">barniz UV</option>
              <option value="h3">laminado</option>
            </select></td>
            </tr><tr><td>Plegado: </td><td>
            <select id="plegado" onchange="Actualiza(this.id, this.options[this.selectedIndex].value)">
              <option value="i1">plegado envolvente</option>
              <option value="i2">plegado en acordéon</option>
              <option value="i3">plegado en ventana</option>

我手动将所有内容复制/粘贴到.txt中,然后运行此代码:

#load file into buffer
leyendo = open("generadorbasedatos.txt", 'r')
archivotxt = leyendo.read()
leyendo.close()
#split it for lines
listadividida = []
listadividida= archivotxt.split("\n")
#create a dict for later
basededatos = {}

#for each line
for i in listadividida:
    if not "<option" in i: #if isn't an option, delete that line
        i = ""
    else: #if it's an option, get the value and the text
        #the text
        desde = '>'
        hasta = '<'
        _,_,resto = i.partition(desde)
        opcion,_,_ = resto.partition(hasta)
        #the value
        desde = 'value="'
        hasta = '">'
        _,_,resto = i.partition(desde)
        laid,_,_ = resto.partition(hasta)
        #add them to a dict
        basededatos[laid] = [opcion, laid]
        #And this is where I'm lost and I need help
print(basededatos)

现在出现问题,我希望脚本创建所有可能组合的列表,并使用值创建每个组合的ID来创建ID,因此输出应如下所示:

g1h1i1: [1 Linea de perforación, Sin ennoblecimiento, plegado envolvente]
g1h1i2: [1 Linea de perforación, Sin ennoblecimiento, plegado en acordeón]
g1h1i3: [1 Linea de perforación, Sin ennoblecimiento, plegado en ventana]
g1h2i1: [1 Linea de perforación, barniz, plegado envolvente]
g1h2i2: [1 Linea de perforación, barniz, plegado plegado en acordeón]
g1h3i3: [1 Linea de perforación, barniz, plegado en ventana]

最终所有可能的组合。我尝试使用itertools并以某种方式设法冻结我的计算机(可能是由于内存不足或无限循环问题)所以现在我在这里问。

达到我想做的最佳方式是什么?

注意:有超过12个选项,这里仅复制/粘贴3个选项,但代码应该能够创建超过3个选择的所有组合。

1 个答案:

答案 0 :(得分:0)

从您的观点来看,这可以实现您的目标:

from itertools import product
base={'g':[],'h':[],'i':[]}
for (key,value) in basededatos.items(): base[key[0]].append(value) # to split the fields.
products=product(*base.values()) #make all combinations
finaldict={ "".join([p[1] for p in t]) : [p[0] for p in t] for t in products }
# formatting in a dictionnary.

一些值:

In [263]: base
Out[263]: 
{'g': [['1 Linea de perforación', 'g2'],
  ['4 Lineas de perforación', 'g5'],
  ['2 Lineas de perforación', 'g3'],
  ....,
 'h': [['laminado', 'h3'], ['barniz UV', 'h2'], ['sin ennoblecimiento', 'h1']],
 'i': [['plegado en ventana', 'i3'],
  ['plegado en acordéon', 'i2'],
  ....]}


In [265]: finaldict
Out[265]: 
{'g1h3i2': ['sin perforacion', 'laminado', 'plegado en acordéon'],
'g7h2i1': ['6 Lineas de perforación', 'barniz UV', 'plegado envolvente'],
'g2h3i3': ['1 Linea de perforación', 'laminado', 'plegado en ventana'],....