使用xpath获取(X)HTML文档中元素的charset属性

时间:2011-04-11 01:00:39

标签: python xpath lxml

我正在使用python进行一些网络抓取。但是你知道有些网页有不同的字符集。我需要获得那些网页字符集。长话短说,对于lxml,什么是xpath模式?

谢谢。

1 个答案:

答案 0 :(得分:3)

此:

/html/head/meta[@http-equiv='Content-Type']/@content

HTML5:

/html/head/meta/@charset
相关问题