Question

我正在使用Selenium，Python和PhantomJS编写一个爬虫来使用Google的反向图像搜索。到目前为止，我已成功上传图片并在第一页抓取搜索结果。但是，当我尝试单击搜索结果导航时，我收到了StaleElementReferenceError。我在很多帖子中都读过它，但我仍然无法实现解决方案。这是破解的代码：

ele7 = browser.find_element_by_id("nav")
ele5 = ele7.find_elements_by_class_name("fl")

count = 0
for elem in ele5:
    if count <= 2:
        print str(elem.get_attribute("href"))
        elem.click()
        browser.implicitly_wait(20)
        ele6 = browser.find_elements_by_class_name("rc")
        for result in ele6:
            f = result.find_elements_by_class_name("r")
            for line in f:
                link = line.find_elements_by_tag_name("a")[0].get_attribute("href")
                links.append(link)
                parsed_uri = urlparse(link)
                domains.append('{uri.scheme}://{uri.netloc}/'.format(uri=parsed_uri))
            count += 1

代码在print str(elem.get_attribute("href"))处中断。我该如何解决这个问题？

提前致谢。

Answer 1

点击链接会使浏览器转到另一个页面;引用旧页面中的元素（ele5，elem）无效。

修改代码不引用无效元素。

例如，您可以在访问其他页面之前获取网址：

ele7 = browser.find_element_by_id("nav")
ele5 = ele7.find_elements_by_class_name("fl")

urls = [elem.get_attribute('href') for elem in ele5]  # <-----

browser.implicitly_wait(20)

for url in urls[:2]:  # <------
    print url
    browser.get(url)  # <------ used `browser.get` instead of `click`.
                      #         ; using `element.click` will cause the error.

    ele6 = browser.find_elements_by_class_name("rc")
    for result in ele6:
        f = result.find_elements_by_class_name("r")
        for line in f:
            link = line.find_elements_by_tag_name("a")[0].get_attribute("href")
            links.append(link)
            parsed_uri = urlparse(link)
            domains.append('{uri.scheme}://{uri.netloc}/'.format(uri=parsed_uri))

StaleElementReferenceException selenium webdriver python

1 个答案: