如何从Xidel输出中排除类

时间:2016-04-28 20:59:13

标签: html web-scraping xidel

我想通过删除包含“AClass”的行来使用xpath: // BODY / DIV 来优化我的Xidel输出,并保留仅使用“MyClass”的行

我可以在Xidel输出文件中添加换行符吗?

pd.concat([df.iloc[[0], :] * 0, df]).reset_index(drop=True)

1 个答案:

答案 0 :(得分:0)

要使用XQuery排除属性,我们可以使用常规的不等式,在您的示例中,它将是return@map ...

这匹配所有//a[@class !="AClass"],无论深度如何,都包含属性类不等于<a>

至于你的另一个问题,关于在xidel的输出文件中添加换行符,确实可以使用AClass--output-footer标志,具体取决于你的意思。

--output-separator在所有输出的末尾添加一个字符串(例如多个换行符)。

--output-footer在每个项目的末尾添加一个字符串。