Selenium在Python3中获取表内容

时间:2018-06-06 06:19:52

标签: html python-3.x selenium selenium-chromedriver

我想使用Selenium(Chrome驱动程序)

获取表格中的所有href

我有一个项目表,每个表格行都是这样的。

<tr>
    <td>
      <a href="a html page reference" class="itemName">
         <img data-script="item_image" data-widget="item-image" data-item="i165187" 
              data-size="70x70"  class="img" 
              src="html://source of image" alt="">The item name</a>
    </td>
    <td class="hide-s">Kitchen</td>
    <td class="hide-s">
      <span class="flag UK"></span>
      <span class="itemCountry">UK</span>
    </td>
</tr>

我一直在玩各种硒方法,其基本问题(我认为)是没有&#34;名称&#34;与href相关联。

例如,在下面我希望得到&#39;链接&#39;包含行,以便我可以选择hrefs。

links = []

links = driver.find_elements_by_class_name('itemName')

for link in links:
    link_urls_list.append(link.text)

1 个答案:

答案 0 :(得分:1)

根据您共享的 HTML 收集所有 hrefs ,您可以使用以下解决方案:

link_urls_list = []
links = driver.find_elements_by_xpath("//tr//td/a[@class='itemName']")
for link in links:
    link_urls_list.append(link.get_attribute("href"))
相关问题