使用RSelenium读取下拉菜单元素中的值

时间:2015-07-24 17:46:48

标签: r selenium web-scraping rselenium

我正在使用RSelenium导航到网站并与元素进行交互。

问题:使用RSelenium,我如何阅读下拉菜单中的选项列表,以便我可以识别最新的月份,并使用它将下拉菜单设置为正确的值?

a certain site上,为用户提供了一个下拉菜单,用于设置一年中的月份,从而定义用于显示或下载月度数据的日期范围的终点。随着全年提供额外数月的数据,下拉列表中的选项会发生变化。

Dropdown menu options

到7月底,下拉将有1个选项,1月到6月。请注意,特定月份的数据会在该月末后的4-6周内发布,因此您不会在7月底之前获得6月份的数据,依此类推。我可以使用数字1到12设置值而没有任何问题,前提是下拉列表实际上包含相应的选项。

例如,如果7月的数据尚未发布(即7月尚未出现在选项下拉列表中),并且如果我尝试将下拉列表设置为'7',我将获得错误,我想避免。数据没有定期出现,因此我不能简单地假设月X的数据将出现在Y日。

我相信Selenium本身有a helper class可用,但我不确定我是否可以通过RSelenium访问它。

示例代码如下 - 可能有点松懈,因为我还远未熟悉该软件包。

library(RSelenium)
RSelenium::checkForServer()
RSelenium::startServer()

remDr <- remoteDriver(remoteServerAddr = "localhost",
                      port = 4444,
                      browserName = "firefox"
                      )
remDr <- remoteDriver()
Sys.sleep(5)
remDr$open()
remDr$getStatus()

remDr$navigate("http://jamaserv.jama.or.jp/newdb/eng/index.html")

## Switch to left frame
frameElems <- remDr$findElements(using = "tag name", "frame")
sapply(frameElems, function(x){x$getElementAttribute("src")})
remDr$switchToFrame(frameElems[[1]])

webElem <- remDr$findElement(using = 'xpath', "//select[@name='txtTargetToMm']")

## Use javascript to set values
script <- paste0("arguments[0].value = '", 2, "'; arguments[0].onchange();") # set to February
remDr$executeScript(script, list(webElem))
webElem$getElementAttribute('value')    # check to see if it worked

0 个答案:

没有答案