如何从Mongo DB集合中提取特定字段

时间:2016-09-26 22:09:01

标签: mongodb mongodb-query mongoexport

我的mongo系列中有2250条记录。

以下是该系列中的一条记录 -

"_id" : bjectId("57e57e3fb04c6373f7000002"),
"message" : "<logentry   revision='15234'><author>447085</author><date>2016-07-19T12:39:19.707782Z</date><paths><path   prop-mods='false'   text-mods='true'   kind='file'   action='M'>/itdp/branches/itdpux/branches/base/itdp2.0/src/com/cts/race/beans/ProgramChronicleBean.java</path></paths><msg>day week month function addition </msg></logentry>",
    "@version" : "1",
    "@timestamp" : ISODate("2015-09-23T19:10:54.824Z"),
    "path" : "C:/DevInsight/svnpredictor/svn/svn.log",
    "host" : "WIN-5BRSCLOQIVN",
    "type" : "XML",
    "author" : "447085",
    "revision" : "15234",
    "date" : "2016-07-19T12:39:19.707782Z",
    "paths" : { "path" : [ 
            {   "action" : "M",
                "kind" : "file",
                "prop-mods" : "false",
                "text-mods" : "true",
                "content" : "/itdp/branches/itdpux/branches/base/itdp2.0/src/com/cts/race/beans/ProgramChronicleBean.java"
            } ] }

我想在特定日期范围内提取记录的修订版,内容字段。 mongoexport应存储为CSV,字段为 revision_id,file_name 。我试过下面的命令

C:\mongodb\bin\mongoexport --db dbname --collection cname -f 'revision,paths.path.content' --query "{'date': { '$lt': {'$date' : ISODate('%1')} , '$gte': {'$date': ISODate('%2') }}}"  --out "C:\test\mongodata.csv"

我使用上面的命令 -

获得低于输出

{“_ id”:{“$ oid”:“57e57e3fb04c6373f7000003”},“路径”:{“路径”:[{///整条路径标记内容///}]}

我的实际输出应如下 -

REVISION_ID,FILE_NAME 15234,/ ITDP /支链/ itdpux /支链/碱/ itdp2.0 /网络/ XHTML / progchronicle_iux.xhtml

该命令的一个好处是我能够提取所有包含我指定的日期范围的记录。

请检查我的代码并帮助我

2 个答案:

答案 0 :(得分:1)

您的paths.path元素是一个数组。如果要正确导出它,则必须使用以下命令:

C:\mongodb\bin\mongoexport --db dbname --collection cname -f 'revision,paths.path.0.content' --query "{'date': { '$lt': {'$date' : ISODate('%1')} , '$gte': {'$date': ISODate('%2') }}}"  --out "C:\test\mongodata.csv"

如果paths.path是一个随机长度的数组,那么就会出现一些问题。在这种情况下,您必须使用循环编写自己的脚本。

答案 1 :(得分:0)

问题是你没有定义类型,因此mongoexport创建了一个json文件,你应该使用

- 型= CSV

关于真正的问题导出数组对象,答案已在

中得到解答

stackoverflow.com Array

serverfault.com Array