使用RVest在Web上抓取图像的质量太差了

时间:2018-12-01 18:14:35

标签: r image web-scraping rvest

我抓取了如下图像:

library(rvest)
library(magrittr)
url = 'http://x.yupoo.com/photos/05941188/albums'
web = read_html(url)

现在我需要考虑节点。我将使用extract2()函数来选择精确的节点:

gianni = html_nodes (web, '.showindex__gallerycardwrap')
ugo = gianni %>%  extract2(1) %>%  html_nodes('img') %>%  html_attr('src')

现在我下载图像。我正在使用download.file函数,它需要我建立一个新的对象protocol才能拥有完整的URL字符串:

protocol = 'http:'
scarica = download.file(paste0(url,ugo[1], destfile = 'imm.jpg', method = 'wininet')

当我看到图像时,看起来像这样,这显然不是我期望的质量:

web scrape img gianni

1 个答案:

答案 0 :(得分:1)

不是用“ url”创建链接,而是用“ http:”创建链接对我有用:

download.file(paste0("http:",ugo[1]),destfile = "imm.jpg", method = 'wininet',mode='wb')

better quality image