登录网站使用RCurl获取数据

时间:2013-03-02 00:03:44

标签: r login web rcurl

我想使用RCurl登录网站并从网上获取数据(如果没有登录,则无法看到数据。)

我想在使用RCurl登录后将此(例如)“http://www.appannie.com/app/ios/instagram/ranking/history/chart_data/?s=2010-10-06&e=2012-06-04&c=143441&f=ranks&d=iphone”导出到R中。问题是我无法使用RCurl登录。我之前没有尝试过,所以大多数时候我提到了http://www.omegahat.org/RCurl/philosophy.html

所以这就是我的尝试。 (这里,'me@gmail.com'是我的用户名,'9999'是我的密码 - 我刚刚完成了。)

library(RJSONIO)
library(rjson)
library(RCurl)
appannie <- getURL("http://www.appannie.com/app/ios/instagram/ranking/history/chart_data/.json?s=2010-10-06&e=2012-06-04&c=143441&f=ranks&d=iphone, userpwd = me@gmail.com:9999", verbose = TRUE)

但这给了我以下信息:

About to connect() to www.appannie.com port 80 (#0)
*   Trying 69.167.138.64... * connected
* Connected to www.appannie.com (69.167.138.64) port 80 (#0)
> GET /app/ios/instagram/ranking/history/chart_data/?s=2010-10-06&e=2012-06-04&c=143441&f=ranks&d=iphone HTTP/1.1
Host: www.appannie.com
Accept: */*

< HTTP/1.1 403 FORBIDDEN
< Server: nginx/1.1.19
< Date: Fri, 01 Mar 2013 23:41:32 GMT
< Content-Type: text/html; charset=utf-8
< Transfer-Encoding: chunked
< Connection: keep-alive
< Keep-Alive: timeout=10
< Vary: Accept-Encoding
< Vary: Cookie,Accept-Encoding
< 
* Connection #0 to host www.appannie.com left intact

所以,我回去再次阅读http://www.omegahat.org/RCurl/philosophy.html并且不知道该怎么做,所以我在看到stackoverflow中的类似问题后尝试了这个。

getURL("http://www.appannie.com/app/ios/instagram/ranking/history/chart_data/?s=2010-10-06&e=2012-06-04&c=143441&f=ranks&d=iphone",.opts=list(userpwd=me@gmail.com:9999"))

但这会让我低于输出。

[1] ""

任何人都可以给我一个提示吗? (经过一系列不同的试用,网站开始向我发送警告=(

1 个答案:

答案 0 :(得分:0)

这是某种身份验证问题,而不是你最有可能犯错的RCurl。

您已接通服务器,但您的登录信息不正确,无效或数据无法通过API提供。

http://en.wikipedia.org/wiki/HTTP_403

相关问题