如何构建从文本文件收集的名称数组,这些名称对应于从同一文件收集的链接数组?

时间:2012-06-13 19:00:51

标签: arrays parsing text hyperlink names

我需要创建一个名称数组,这些名称对应于我存储在另一个数组中的图像链接。图像的名称和链接都在同一文本文件中找到,图像链接遵循文件中的相应名称。我通过使用以下代码解析文本文件来构建图像链接数组:

import re
images = []
with open('html_test.txt') as f:
    for line in f:
        images.extend(re.findall(r'"([^"]*\.(?:jpg|gif)[^"]*)"',line))

如果每个图像链接只有一个名称,我可以使用类似的方法构建名称列表。不幸的是,每个名称后面的图像链接数量是可变的,有些名称后面只有一个图像链接,有些后面跟着很多。

我认为我需要做的是计算每个名称跟随图像的链接数量,然后在名称数组中为每个名称创建重复条目,后面跟着多个图像。 (每个名称的重复名称条目的数量将等于每个名称后面的图像链接的数量减去1.)当我尝试这样做时,我得到的只是整个文本中的名称总数的计数文件。有没有人知道如何建立一个名称数组,以便每个名称输入到数组一次,每个链接到一个跟随它的图像文件? (除了文本文件中的下一个名称之外)

下面是文本文件的示例:

<a href="/admin/user/view/41900" title="example_name_1" rel="41900">
<div class="thumb"><a href="#"><img src="https://jibbertyjob.com/asset/image/resize/2/32/32/1/5d4e6a0fjfe94980ny8en9uf98frnoad1876c00.jpg" width="32" height="32" alt="" /></a></div>
<a href="/admin/user/view/41900" title="example_name_2" rel="41900">
<div class="thumb"><a href="#"><img src="https://jibbertyjob.com/asset/image/resize/2/32/32/1/5d4e6a0fjfe9dfgsdfg9uf98frnoad1876l00.jpg" width="32" height="32" alt="" /></a></div>
<div class="thumb"><a href="#"><img src="https://jibbertyjob.com/asset/image/resize/2/32/32/1/5d4e6a0fjf4567w034098h9h5fg4gr33r3rggr376c09940.jpg" width="32" height="32" alt="" /></a></div>

非常感谢我在半天的时间里一直坚持这一点!

0 个答案:

没有答案
相关问题