区分普通网页和XML页面(提要)

时间:2015-09-29 12:38:13

标签: python beautifulsoup

我搜索了这个问题,但没有发现与该主题相关的内容。在python中使用beautifulsoup时,有没有办法区分普通的Web链接和xml链接?

我实际上尝试使用feedfinder2,但它没有帮助。

1 个答案:

答案 0 :(得分:0)

我没有进行过相当广泛的测试,但您可以尝试:

soup = BeautifulSoup(your_file, "xml")
# RSS feeds start with <rss>
if soup.html is None:
    # Do html stuff
else:
    # code that processes the rss