通过其API访问kaggle数据集

时间:2018-07-10 13:14:38

标签: nlp rstudio kaggle

我希望使用Kaggle上的一些公共数据集。 是否可以使用RStudio通过其API访问kaggle数据集?

欢呼声,

1 个答案:

答案 0 :(得分:1)

Kaggle刚刚于2018年2月(今年年初)启动了其公共API。根据他们的Github存储库Kaggle/kaggle-api,Kaggle(至少到目前为止)已使其API可访问 "using a command line tool implemented in Python"

我也很高兴发现Kaggle API的存在,同样,我也很感兴趣是否有人编写了用于与R中Kaggle API交互的API包装程序包。我找不到任何人,所以我写了一个我自己,您可以在这里找到:https://github.com/mkearney/kaggler。从我创建回购协议到现在,不到一周的时间,所以我还不能说出它的可靠性,但是就目前而言,它似乎是最好的起点。而且,为了记录在案,只要人们愿意使用它,我就会竭尽全力保持对该程序包的最低支持(假设没有热情的第三方介入他们自己的R程序包),但是API本身是新的,因此可能还要几个月才能找到真正的稳定选择。

;;

此外,尽管我完全理解您所提问题的意思,但我认为值得指出的是,从技术上讲,Rstudio是一个集成开发环境(IDE),并不一定是将您连接到非开发环境的源/库/程序Rstudio Web API。您实际上正在寻找的是R扩展/库/软件包,旨在充当Kaggle API的包装器/客户端/接口。当然,这种区别几乎是微不足道的,因为如果您使用Rstudio(一种出色的开源R中心IDE)与Kaggle的外部API通信,那么您 {{1 }} 。但是,为了在应得的信用额度上给予信用,可以说您希望利用 {Rstudio }和 {pkgname} 软件包通过 R环境与Kaggle的API通信。