我们如何定制Mahout的FileDataModel delimiterPattern?

时间:2014-01-19 13:29:32

标签: java mahout

我是Mahout的新手,我正在使用FileDataModel,但我发现delimiterPattern不能被覆盖,这是非常有线的,我认为一个设计良好的框架应该考虑不同的用例。 / p>

private final Splitter delimiterPattern;

在我的情况下,我想将其更改为:

private final Splitter delimiterPattern = Splitter.onPattern("\\s+");

我有两个问题:

  1. 为什么Mahout不允许开发人员覆盖其delimiterPattern?
  2. 我们如何改变呢?
  3. ===更新===

    不再重要了,我只是向Mahout提交补丁(https://issues.apache.org/jira/browse/MAHOUT-1398),将整合到0.9版本中。

1 个答案:

答案 0 :(得分:0)

您可以执行一些预处理并替换给定的分隔符,并将其设置为CSV文件或可以与mahout的FileDataModel一起使用的内容。