用“代理”抓取https网站的网页“rvest”

时间:2016-03-16 17:46:28

标签: r web-scraping rvest

我想废弃一个https网站,但我失败了。

这是我的代码:

require(rvest)
url <- "https://www.sunnyplayer.com/de/"
content <- read_html(url)

但我在控制台中出错 - “open.connection(x,”rb“)出错:达到了超时” 我该如何解决这个问题?

1 个答案:

答案 0 :(得分:11)

同样的事情发生在我的代理上。要解决此问题,请使用download.file并指定下载位置。然后,您可以使用read_html解析文件。

first
econd
hird
fourth
fifth
ixth