从原始xml创建xmls文件的子集,同时保持相同的结构

时间:2019-07-04 09:35:53

标签: c++ c xml libxml2

我的问题是我想从原始xmls创建xmls文件的子集,同时保持相同的结构。您可以说我想过滤一个子集。

处理Medline数据库的最佳方法是什么?最有效的方法是什么!

1 个答案:

答案 0 :(得分:0)

这里是一个广泛的概述。

  1. 完全读取输入的xml文件。

  2. 确定要在哪个级别分割xml文件。 (例如3级)

  3. 确定感兴趣的标签。您可以预先确定标签,或向用户提供一些GUI以选择所需的标签。您还可以将输入文件拆分为多个文件,其中包含输入文件的所有标签。

  4. 创建输出文件。例如直到3级,文件都是相同的。从第4级开始,您将拥有许多不同的文件。

例如如果您有

之类的xml文件
<L1> .... 
    <L2> ...
        <L3> ....
           <L4a> .... </L4a>
           <L4b> .... </L4b>
           <L4c> .... </L4c>
        </L3>
    </L2>
</L1>    

您可以制作3个输出文件

<L1> .... 
    <L2> ...
        <L3> ....
           <L4a> .... </L4a>
        </L3>
    </L2>
</L1>    

<L1> .... 
    <L2> ...
        <L3> ....
           <L4b> .... </L4b>
        </L3>
    </L2>
</L1>