使用Selenium刮取多个框架/#文档的网站

时间:2014-07-15 01:54:13

标签: r selenium web-scraping

我正在尝试使用Relenium抓取一个网站。然而,由于网站似乎有多个框架/#文件并且使用getElementbyXpath()不访问内部框架,因此我陷入困境。我找到了一个关于如何使用selenium webdriver(http://assertselenium.com/2013/02/22/handling-iframes-using-webdriver/)执行此操作的相关链接。但我无法用Relenium来解决这个问题。来源如下:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
    <head>...</head>
    <frameset rows="80,*" style="border: 1px black;" noresize="noresize">
      <frame name="surftopframe" src="gpt.php?v=timer&amp;user=satoshimines&amp;pretime=1405388100&amp;id=1025&amp;sid=24526TVM0eU16RTFOVE0&amp;sid2=24526&amp;type=ptc&amp;siduid=24526&amp;" scrolling="no" marginheight="2" marginwidth="2" noresize="noresize">
        #document
         <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
         <html xmlns="http://www.w3.org/1999/xhtml">
            <head>...</head>
            <body marginwidth="2" marginheight="2">
            <!--
            <div id="banner"><a href="bannerclick.php?id=228" target="_blank"><img src="http://click2dad.net/_static/_css/img/click2dad_en.gif" alt="Banner Advertisement" /></a></div>
            -->
            <div id="timer">...</div>
            <div id="buttons" style="display: block;">...</div>
            <div id="menu">...</div>

显示Relenium是否以及如何处理这些案例的示例的任何指针都会很棒。

由于

0 个答案:

没有答案