如何从网页下载文件?

时间:2010-07-16 00:56:59

标签: c# python ironpython

有些网页有自己的网址,有“下载”文字,这是超链接。

如何通过python或ironpython从urls / pages获取超链接。

我可以通过python或ironpython下载带有这些超链接的文件吗? 我怎么能这样做?

有没有C#工具?

我不是母语为英语的人,对我的英语很抱歉。

2 个答案:

答案 0 :(得分:2)

您应该能够将BeautifulSoup library与CPython(普通Python)和IronPython一起使用。查看findAll()方法。这应该提取所有链接的列表。

soup.findAll('a')

答案 1 :(得分:1)

最简单的方法是将HTML页面传递给XML / HTML解析器,然后在根节点上调用getElementsByTagName("A")。完成后,遍历列表并提取href参数。