Python中的Mechanize有什么替代品吗?

时间:2010-04-18 15:20:11

标签: python mechanize

我正在使用Python 3.6而我必须填写表格。不幸的是,机械化不适用于Python 3。 你有什么建议作为机械化的替代品?

6 个答案:

答案 0 :(得分:14)

带有selenium.py

SeleniumRC是另一种选择(如果您需要抓取的页面对Javascript操作具有重要的“结构”角色,也是少数可行的选项之一,尤其是AJAX-y的,因为Mechanize没有在它正在抓取的页面上执行Javascript。

答案 1 :(得分:7)

对于抓取和表单处理,您可以使用lxml.html(但它不会自动提取和使用Cookie。)

scrapy是一个专门用于抓取的库。

答案 2 :(得分:4)

我在Splinter上取得了成功,这是一种基于Selenium构建的解决方案 - 同时提供了更多的pythonic API。

答案 3 :(得分:3)

我已经使用twill来满足我的许多测试需求。它可以作为“Web浏览”的独立语言,也可以作为Python的库。它实际上使用了Mechanize,因此我不确定它是否能满足您的需求 - 您是否遇到了Mechanize固有的问题,或者您是否会从高级层中受益?

答案 4 :(得分:1)

答案 5 :(得分:1)

scrapelib是另一种选择:https://github.com/sunlightlabs/scrapelib