如何处理MarkLogic中CSV / TSV中数据一部分的逗号/制表符

时间:2014-05-12 19:47:56

标签: csv marklogic nosql

我正在尝试使用RecordLoader将带有逗号作为数据一部分的CSV文件加载到MarkLogic中。数据加载但MarkLogic将逗号作为数据的一部分作为分隔符。我试图通过使用反斜杠来逃避逗号,但是没有工作,并且数据在反斜杠中仍然是脏的。我考虑用其他符号替换数据逗号,以便我可以在加载后将它们更改回逗号,但我不知道在加载后是否有办法修改数据,我将不得不重新定位XML标记行按行。

如何加载CSV / TSV文件并将作为数据一部分的逗号/标签保留为数据的一部分而不是分隔符?

提前致谢。

2 个答案:

答案 0 :(得分:0)

RecordLoader的DelimitedDataLoader今天不支持任何转义。如果您想将其添加为补丁,https://github.com/marklogic/recordloader/blob/master/src/java/com/marklogic/recordloader/xcc/DelimitedDataLoader.java#L102是开始查看代码的地方。

答案 1 :(得分:0)

虽然您询问了RecordLoader,但您也可以使用MarkLogic Content Pump。见Creating Documents from Delimited Text Files

相关问题