R:从密码保护站点提取数据

时间:2015-08-28 07:50:50

标签: html r web-scraping

我正在尝试通过R从密码安全站点提取数据。我尝试了很多选项。但即使在传递登录凭据后,我也只获得非登录页面的HTML。这是我的一次尝试:

loginurl ="https://login.recruit.naukri.com/"
dataurl  = "http://resdex.naukri.com/search/setSrchSess?     SRCHTYPE=ez&SRCH_INC_KEYWORD=XXX"
pars=list(username="XXX", password="XXX")
curl = getCurlHandle()
curlSetOpt(cookiejar="",  useragent = agent, followlocation = TRUE,  curl=curl)
html=postForm(loginurl, .params = pars, curl=curl)
html=getURL(dataurl, curl=curl)

两个htmls都是相同的,它们是非登录页面的HTML。

其他命令也是如此。

0 个答案:

没有答案
相关问题