如何访问需要身份验证的Web服务

时间:2011-06-20 18:36:40

标签: r web-applications web-scraping

  

可能重复:
  Reading information from a password protected site

我有一个web服务,它以csv形式提供数据,基于您用来访问它的URL。即http://sever.com/parameter1返回参数1的csv,http://sever.com/parameter1返回参数2的csv等。当我第一次在浏览器中访问该站点时,我输入用户名和密码,然后可以访问任何数据我想要。

当我尝试将该数据导入R时出现问题。我尝试了这个函数:

readLines('http://sever.com/parameter1')

但是出现了以下错误:

Error in file(con, "r") : cannot open the connection
In addition: Warning message:
In file(con, "r") : cannot open: HTTP status was '401 Unauthorized'

当然,这是因为R不知道我的用户名和密码是否与请求一起传递。如何在R中定义这些附加参数?有没有办法在请求中添加cookie?

谢谢。

/编辑:这里的答案(SO没有提出不同的问题措辞)对我有用:

Reading information from a password protected site

如果其他人有任何其他建议,请告诉我。

1 个答案:

答案 0 :(得分:3)

为什么不使用curl抓取文件?这样您就可以为用户名和密码设置http标头:

curl --user name:password http://www.example.com

R

有一个卷曲库
http://curl.haxx.se/libcurl/r/
相关问题