使用HTMLParser解析URL

时间:2014-02-04 13:25:01

标签: python python-2.7

是否可以使用HTMLParser解析URL的HTML?我已经使用它来解析基本的解析器设置来解析.feed函数中写的HTML

from HTMLParser import HTMLParser

class myParser(HTMLParser):
    def handle_starttag(self, tag, attrs):
        print "Encountered a start tag:", tag
    def handle_endtag(self, tag):
        print "Encountered an end tag :", tag
    def handle_data(self, data):
        print "Encountered some data  :", data

parser = myParser()
parser.feed('')

我想知道我是否可以通过网站进行此操作,以便解析我要求的任何网站的所有标记。这可能是HTMLParser还是我必须使用像BeautifulSoup这样的东西?

1 个答案:

答案 0 :(得分:0)

最好使用BeautifulSoup ...它可以帮助您解决有关HTML的所有问题,最近用它来构建一个完美的网络爬虫!