未知的IO错误无法加载外部实体

时间:2018-01-28 10:14:50

标签: r xml

我正在尝试在R中学习文本挖掘。

我不知道为什么会出现这个错误?

library(XML)
xml.url <- "http://www.w3schools.com/xml/plant_catalog.xml"
plants <- xmlParse(xml.url)
plants.l <- xmlToList(plants)
length(plants.l)

我很感激能得到的任何帮助。

1 个答案:

答案 0 :(得分:2)

您已发现XML个问题。它不适用于重定向(http -> https,您的网址以http开头)和https

您可以使用其他一些软件包下载该文件。以下是httr的示例。

library(XML)
library(httr)
xml.url <- "http://www.w3schools.com/xml/plant_catalog.xml"
plants <- xmlParse(rawToChar(GET(xml.url)$content))
plants.l <- t(xmlToList(plants, simplify = TRUE))
length(plants.l)

我还添加了t()simplify = TRUE,以便在R中有一个漂亮而简单的列表。

相关问题