如何按顺序打开几页(PhantomJS)?

时间:2015-02-17 18:51:28

标签: javascript phantomjs

正如我所看到的,你不能只用一个phantomjs脚本中的page.open()打开几页。因为他们开始同时工作。我尝试使用seTtimeout()进行变换,但它们不起作用。所以我需要的是打开第一页,做一些动作,然后关闭它。之后我需要打开另一页。我怎样才能实现这一目标?

var url = 'url-address-';
var referrer = '-url-address-/path';
page.customHeaders={'Authorization': 'Basic '+btoa(login+":"+password), 'Referer': referrer};

page.open(url, function(status){
    if(status === 'fail')
    {
        console.log('Status: ' + status);
        phantom.exit();
    }

    console.log('Status: ' + status);
    page.render("1.png");

    page.evaluate(function() {
        var form = document.forms[0];   
        form.data1.value = 'mydata_name';
        form.data2.value = 'mydata_surname';
        form.submit();
    }); 

    setTimeout(function(){
        var url = 'post-url-address';
        var referrer = '-url-address-/refpath';
        page.customHeaders={'Authorization': 'Basic '+btoa(login+":"+password), 'Referer': referrer};   
        body = 'submit-url=mydata_to_submit';
        page.open(url, 'POST', body, function (status) {
            //
            // Here goes the error 
            // unable to load url: "post-url-address"
            //  error code: 5, description: Operation canceled
            //
            //
            //setTimeout(function(){}, 5000)
            console.log('Status: ' + status);
        }); 

        page.render("2.png");
        var fs = require('fs');
        fs.write(result, page.content, 'w');
        console.log('Finished');
        phantom.exit();

    }, timeout);
});

所以这一切都很好,直到我打开页面发布数据。不知道为什么会发生这种情况。试图将超时更改为20-30秒 - 问题仍然存在。这不是为什么会发生这种情况,不是吗?

1 个答案:

答案 0 :(得分:1)

您过早退出。

打开第二页后,您将从控制流中断开。您必须将文件写入和退出移动到page.open()回调中。可能会发生错误,因为PhantomJS当前正在尝试下载页面,同时尝试退出执行。这就是取消第二页加载的原因。

使用:

// second page.open ...
page.open(url, 'POST', body, function (status) {
    console.log('Status: ' + status);
    page.render("2.png");
    var fs = require('fs');
    fs.write(result, page.content, 'w');
    console.log('Finished');
    phantom.exit();
});