Regexp提取XML属性值

时间:2017-08-18 16:32:44

标签: python regex xml

请建议如何使用regexp python样式获取xml属性值。

以下是示例,提取必须完全匹配(长篇故事)

<method code="ABC">

我获得的最多是(?<=code=\")(.*?)(?=\">),但忽略了方法部分

感谢

1 个答案:

答案 0 :(得分:0)

好吧,要么你学习正则表达式语法的基础知识并使用re,要么你看一下Python的xml.etree.ElementTree模块来直接解析xml。

如果您想使用正则表达式,可以使用在线工具regex101以交互方式测试特定于语言的表达式。

也许<(?P<method>\w*?) (?P<code>\w*?)=\"(?P<value>.*)\">会完成这项工作。 但是,如上所述,再次使用正则表达式从XML中提取数据非常脆弱且非常有限。

编辑:对3

的更清晰的解释

EDIT2:添加正则表达式建议