如何使用内容泵将MarkLogic一个文件导入多个文档

时间:2017-11-09 02:04:02

标签: marklogic mlcp

我有一个格式正确的单个json文件,它是一个文档数组(大约60,000)。我可以使用节点api导入它,但只是想知道如何使用Marklogic内容泵(窗口)导入此文件。

我尝试使用基本选项,它只创建一个名为orders.json的文档

1 个答案:

答案 0 :(得分:2)

对于MLCP,格式正确的JSON聚合(Called Line-delimited JSON)文件不是对象数组。它是一个文件,每行一个字符串化对象。想想CSV,而不是JSON。

想象一下,如果你传递了一个数组--MLCP进程必须将整个文件解析成一个JSON数组来处理。每行一个对象意味着MLCP可以轻松地对文件进行分片并并行处理。事实上,如果您使用自动URI,我认为它甚至不会解析为JSON。

为:

[
  {
    "bar": "baz"
  },
  {
    "bar": "buz"
  }
]

好:

{"bar":"baz"}
{"bar":"buz"}

关于这一切的所有好处都可以在这里找到:
MLCP User Guide

相关部分为: (准确的文件版本:' 9.0-3,2017年9月')

  • 4.10
  • 4.10.1