有些网页有自己的网址,有“下载”文字,这是超链接。
如何通过python或ironpython从urls / pages获取超链接。
我可以通过python或ironpython下载带有这些超链接的文件吗? 我怎么能这样做?
有没有C#工具?
我不是母语为英语的人,对我的英语很抱歉。
答案 0 :(得分:2)
您应该能够将BeautifulSoup library与CPython(普通Python)和IronPython一起使用。查看findAll()方法。这应该提取所有链接的列表。
soup.findAll('a')
答案 1 :(得分:1)
最简单的方法是将HTML页面传递给XML / HTML解析器,然后在根节点上调用getElementsByTagName("A")
。完成后,遍历列表并提取href
参数。