Question

有些网页有自己的网址，有“下载”文字，这是超链接。

如何通过python或ironpython从urls / pages获取超链接。

我可以通过python或ironpython下载带有这些超链接的文件吗？我怎么能这样做？

有没有C＃工具？

我不是母语为英语的人，对我的英语很抱歉。

Answer 1

您应该能够将BeautifulSoup library与CPython（普通Python）和IronPython一起使用。查看findAll()方法。这应该提取所有链接的列表。

soup.findAll('a')

Answer 2

最简单的方法是将HTML页面传递给XML / HTML解析器，然后在根节点上调用getElementsByTagName("A")。完成后，遍历列表并提取href参数。