如何安装RHadoop软件包(Rmr,Rhdfs,Rhbase)?

时间:2015-04-15 09:26:45

标签: r hadoop rhadoop

实际上我正在努力与R集成,但我得到了这个错误。

包'rmr','rJava','RJSONIO','rhdfs','rhbase','plyrmr'不可用(对于R版本3.1.3)

将Hadoop与R集成的步骤:

在ubuntu中安装了R和Hadoop。

在〜/ .bashrc文件中添加这三行。

*导出HADOOP_PREFIX = / Users / hadoop / hadoop-1.1.2

导出HADOOP_CMD = / Users / hadoop / hadoop-1.1.2 / bin / hadoop

导出HADOOP_STREAMING = / Users / hadoop / hadoop-1.1.2 / contrib / streaming / hadoop-streaming-1.1.2.jar *

使用此命令安装R软件包

install.packages(c("rJava", "RJSONIO", "rmr", "rhdfs", "rhbase", "plyrmr").

但我犯了上述错误。如何集成R和Hadoop的主要问题是什么? 我已按照此link to integrate

4 个答案:

答案 0 :(得分:9)

https://github.com/RevolutionAnalytics/RHadoop/wiki下载rhdfs,rhbase,rmr2和plyrmr软件包并安装如下:

install.packages("<path>/rhdfs_1.0.8.tar.gz", repos=NULL, type="source")
install.packages("<path>/rmr2_2.2.2.tar.gz", repos=NULL, type="source")
install.packages("<path>plyrmr_0.2.0.tar.gz", repos=NULL, type="source")
install.packages("<path>/rhbase_1.2.0.tar.gz", repos=NULL, type="source")

答案 1 :(得分:3)

使用devtools,您可以直接从Github安装:

install.packages('devtools')
devtools::install_github(c('RevolutionAnalytics/rmr2/pkg', 'RevolutionAnalytics/plyrmr/pkg'))

答案 2 :(得分:1)

您可以通过指定存储库来尝试安装这些软件包:

install.packages(c("rJava", "RJSONIO", "rmr", "rhdfs", "rhbase", "plyrmr"), repos="http://cran.r-project.org/")

答案 3 :(得分:1)

您可以从CRAN的网站下载软件包并安装它们,而无需连接到存储库。

例如,要下载'rJava'包,您可以访问此链接: http://cran.r-project.org/web/packages/rJava/index.html

从那里下载'Package source',然后手动安装它们:

install.packages('path to downloads/rJava_0.9-6.tar.gz',repos=NULL)

您可以按照与其他提到的包相同的模式。 rhdfs,rhbase和rmr包位于https://github.com/RevolutionAnalytics/RHadoop/wiki/Downloads