如何在R中导入ical .ics文件

时间:2017-04-23 16:56:50

标签: r dplyr icalendar tidyverse

我想将.ics file导入到R中,但是,当我尝试这样做时...

sneak_cal <- read.delim("iCal-TribeEvents.ics", sep = ":", header=FALSE, stringsAsFactors = FALSE, strip.white = TRUE, na.strings = "")

...我最终分割出网站的字符串(属于X-ORIGINAL-URLUID字段),这是不可取的

https//www.kicksonfire.com

最终目标是将数据转换为整齐的格式,其中每行代表一个VEVENT,我认为这将由唯一的UID表示,而不会丢失任何信息(例如URL)

是否存在另一种建议的方法,例如预先定义预期作为键的字段并将值或空格与该键匹配?由于.ics文件每次都有相同的预期字段,因此将这些字段用作模板来读入数据似乎是有意义的,但我无法弄清楚如何进行操作。

2 个答案:

答案 0 :(得分:9)

这是一个例子

x <- readLines("https://www.kicksonfire.com/releases/?ical=1&tribe_display=list", warn = FALSE)
stopifnot(!any(grepl("^\\s+", x))) # disregarding value fields that have linefeeds for the sake of simplicity 
keyval <- do.call(rbind, regmatches(x, regexpr(":", x, fixed = TRUE), invert = TRUE))
keyval <- keyval[which.max(keyval[,1]=="BEGIN" & keyval[,2]=="VEVENT"):tail(which(keyval[,1]=="END" & keyval[,2]=="VEVENT"), 1),]
keyval <- cbind.data.frame(keyval, id=cumsum(keyval[,1]=="BEGIN" & keyval[,2]=="VEVENT"))
df <- reshape(keyval, timevar="1", idvar="id", direction = "wide")
head(df[,c(3,4,9)])
#    2.DTSTART;VALUE=DATE 2.DTEND;VALUE=DATE                              2.SUMMARY
# 1              20170422           20170423         Air Jordan 11 Low GS Blue Moon
# 14             20170422           20170423     Air Jordan 5 Premium Pure Platinum
# 27             20170427           20170428              Nike Air VaporMax Asphalt
# 40             20170427           20170428                 Nike Air VaporMax Oreo
# 53             20170427           20170428  Nike WMNS Air VaporMax White Ice Blue
# 66             20170427           20170428 wings+horns x adidas NMD R2 Light Grey

答案 1 :(得分:0)

CRAN上的calendar软件包(文档here)现在提供了一个更简单,更强大的选项。从ICS文件导入到数据框需要一行代码,创建新事件然后导出到新ICS文件也很简单。