如何在RStudio服务器中解析非常大的XML文件?

时间:2019-07-04 13:36:49

标签: r xml xml-parsing rstudio

我有一个来自加拿大统计局的大型XML文件(〜35 GB),正在尝试在RStudio服务器中进行解析并将其转换为一个或多个数据帧。

我已将文件下载到服务器上的存储文件夹中。到目前为止,我已经尝试使用XML中的xmlParse函数,该函数大约2小时后就放弃了。以及xml2中的read_xml函数,这使RStudio崩溃了。有一个名为rsdmx的程序包可以解析SDMX格式的文件,但是很遗憾,加拿大统计局不是受支持的数据提供者之一。

我假设文件太大,以至于这些解析功能无法正常运行。有什么解决办法吗?我是否需要在RStudio外部进行解析,然后再导入结果?

0 个答案:

没有答案