一个月前我问了一个关于这个的问题,就在这里:"post" method to communicate directly with a server。
我仍然没有理解为什么有时候我会得到404错误,有时候一切正常,我的意思是我已经尝试了几个不同的wordpress博客的代码。使用firefox或IE,你可以发布评论,没有任何问题,无论wordpress博客是什么,但使用python和“post”方法直接与服务器通信我有几个博客404。我试图欺骗标题,在代码中添加cookie,但结果保持不变。这让我困扰了很长一段时间......有谁知道原因?或者我应该添加什么代码才能使程序像firefox或IE等浏览器一样工作?希望你们能帮助我!
答案 0 :(得分:0)
你应该使用像机械化这样的东西。
答案 1 :(得分:0)
博客可能会针对此类发布提供一些垃圾邮件保护。 (使用javascript保护可以轻松检测使用无需访问/阅读页面的程序化帖子)。 但如果是这样的话,我很惊讶你收到404 ......
无论如何,如果你想模拟一个真正的浏览器,最好的方法是使用由python控制的真实浏览器。
查看WebDriver(http://seleniumhq.org/docs/09_webdriver.html)它有一个python实现,可以运行HtmlUnit,chrome,IE和Firefox浏览器。