使用RMallet制作文档主题矩阵时,java.lang.NegativeArraySizeException

时间:2019-03-04 21:04:03

标签: java r lda rjava mallet

我正在尝试编写一些代码,以将Mallet实例列表文件放入R中的文档主题矩阵中。为此,我将实例列表文件读入一个名为“ topic.model”的主题训练器变量中。下面是我要在R中创建文档主题矩阵的函数调用:

theta <- mallet::mallet.doc.topics(topic.model, smoothed = TRUE, normalized = TRUE)

我在较小的实例列表文件(<1gb)上执行此操作,但对于较大的实例列表文件(〜15gb),我收到以下错误:

  

.jcall(包装器,“ [D”,“ flat_double”)中的错误:
    java.lang.NegativeArraySizeException
  调用:myfunc ... .jevalArray-> newArray->结构-> .jcall-> .jcheck
  执行停止

我怀疑整数溢出会超出INT_MAX,并且发生NegativeArraySizeException。有趣的是,使用命令行,Mallet可以使用--output-doc-topics参数(> 150gb)制作文档主题文件。任何建议将不胜感激。

0 个答案:

没有答案