用Rvest刮一个网站链接

时间:2015-09-02 16:33:33

标签: r coercion rvest

我试图想出一种从维基页面中提取链接的方法。 该网页如下:

wiki <- html("https://en.wikipedia.org/wiki/Category:1879_births")

我对以下链接感兴趣:

v =  html_node(wiki, "a[href*='pages']")
<a href="/w/index.php?title=Category:1879_births&amp;pagefrom=Barrymore%2C+Ethel%0AEthel+Barrymore#mw-pages" title="Category:1879 births">next page</a> 

我想在href之后提取链接但是当我尝试将v转换为字符并将其拆分时,我收到以下错误消息:“无法强制输入'externalptr'到'字符'“

类型的向量

有谁知道如何处理此“externalptr”类型并解压缩链接?

提前致谢!

1 个答案:

答案 0 :(得分:0)

这应该提取href属性:

List< Animal > nonModList = List.copyOf( allAnimals ) ;  // Or pass Animals.values() 
相关问题