如何将t.co网址转换为大网址?

时间:2019-05-27 14:45:21

标签: r curl get sapply httr

我试图了解如何将t.co网址转换为大网址?

我有一个7,175 t.co URL的数据集。我有点知道如何将单个URL转换为大URL(使用httr::GET)。但是,当涉及到7,175个URL时,我应该使用sapply在所有URL上应用Get函数(在R中,这可以通过httr包来完成)。

例如,假设我的数据集名称为“ urls_common”,其中包含两个变量:source_url(包含t.co url)和每个URL的计数。我使用以下代码集将t.co转换为大网址。

urls <- t(sapply(urls_common$source_url, GET)) %>%
  as_tibble() %>%
  select(urls, status_code)

但是我得到了不同的错误,例如:

  

curl :: curl_fetch_memory(url,handle = handle)中的错误:     无法连接至jamaica-gleaner.com端口80:连接被拒绝

OR

  

curl :: curl_fetch_memory(url,handle = handle)中的错误:     来自服务器的空回复

当我在较小的数据集(例如第一个或第二个或第三个500 t.co URL)上运行上述代码时,它有时对于某些数据集效果很好,并且有时会出现以下错误:

  

curl :: curl_fetch_memory(url,handle = handle)中的错误:     无法解析主机:my-news-feed.com

     

curl :: curl_fetch_memory(url,handle = handle)中的错误:     SSL证书问题:证书已过期

     

curl :: curl_fetch_memory(url,handle = handle)中的错误:     无法解析主机:experience.safety

希望您能帮助我解决此错误。

0 个答案:

没有答案