rx在RevoScaleR

时间:2017-06-15 15:21:10

标签: sql-server r microsoft-r

我有一个SQL连接到我的SQLServer上的表,我用以下行导入了它:

master_table <- RxSqlServerData(etc...)

然后,我的目标是使用rxImport保存/导入此表并将其保存到.xdf文件,我称之为readTest <- 'read_test.xdf

该表非常大,所以我在rxImport中设置了它:

rxImport(master_table, outFile=readTest, rowsPerRead=100000,reportProgress=1)

但是,它现在已经运行了10分钟,并且屏幕上正在打印正在读取/导入的行的进度。我这样做了吗?我想输出类似的&#34;进展&#34;当ML算法像RxForest或类似的那样运行时打印?

感谢。

1 个答案:

答案 0 :(得分:1)

与SQL Server数据库的连接可能相对较慢,报表进度只会在一批行完成时显示进度。如果行相对较大,您可能会在终端上看到没有返回任何内容。

为了获得rxImport()的最佳性能,请确保rowsPerRead是本地计算机内存可以处理的最大可能大小。这将使进度报告不那么频繁,但是,它会为您提供更快的导入时间。唯一不适用的情况是导入XDF文件。

相关问题