使用R语言从具有相同名称标签的XML提取数据

时间:2019-03-18 05:48:34

标签: r data-manipulation

在此先感谢您, 我正在尝试解析R中的XML文件,但是我被卡住了,我将在下面解释我被卡住的内容。

有多个标签名称,特别是有一个名为ID Segment Tag的标签,其中将有多个ID Name,我必须在其中提取ID段中的第二个ID。 XML1

1 个答案:

答案 0 :(得分:0)

样本数据

没有给出样本数据,所以我创建了自己的样本。

library(xml2)
doc = read_xml('<?xml version="1.0" ?><ID><IDSegment><IDNumber>ABC1234BD</IDNumber><IDNumber>ABCDEFG</IDNumber></IDSegment></ID>')

代码

#get all IDSegment_nodes
IDSegment.nodes <- xml_find_all( doc, ".//IDSegment")
#get the second IDNumber from each IDSegment-node.. NA if missing
xml_text( xml_find_first( IDSegment.nodes, ".//IDNumber[position() = 2]") )

输出

  

[1] "ABCDEFG"