节点js和幻影js

时间:2018-01-04 05:53:32

标签: javascript jquery node.js phantomjs phantomjs-node

我正在寻找一个页面作为练习幻影的练习,但我目前遇到了一个问题。图像加载被推迟,所以我试图找出如何让幻像js向下滚动并等待图像加载。滚动到页面底部不起作用,所以我想每3秒滚动100px,直到它到达页面底部。我将如何实现这一目标?

const phantom = require('phantom');

(async function() {

  const instance = await phantom.create();
  const page = await instance.createPage();

  await page.on('onResourceRequested', function(requestData) {
    console.info('Requesting', requestData.url);
  });

  await page.open(<URL>);

  const js = await page.includeJs('http://ajax.googleapis.com/ajax/libs/jquery/1.6.1/jquery.min.js');

  const data = await page.evaluate(function() {
    // Do something
  });

  page.render('test.pdf');  

  await page.close();
  await instance.exit();
})();

3 个答案:

答案 0 :(得分:1)

PhantomJS确实支持&#34;滚动&#34;,有一个页面属性scrollPosition可能会像这样使用:

await page.property('scrollPosition', { top: 300, left: 0 });

您可以动态更改scrollPosition,并在时间内增加let n = document.createElement("button");,这会触发负责图像加载的回调。

这里有an example原始PhantomJS脚本,显示了推断Twitter时间轴的技巧。

答案 1 :(得分:0)

您可以使用基于phantom.js的node-webshot来呈现pdf。它有很多配置。您需要的是 renderDelay 来延迟屏幕截图, shotOffset 可以滚动到您想要的位置。

答案 2 :(得分:0)

const phantom = require('phantom');

// Scrolls the page till new content is available
async function scrollPage(page) {
    const currentContentLength = (await page.property('content')).length;
    await page.evaluate(function () {
        window.document.body.scrollTop = document.body.scrollHeight;
    });
    await wait(Math.max(5000, 10000 * Math.random()));
    const nextContentLength = (await page.property('content')).length;
    if (currentContentLength != nextContentLength) {
        console.log("Scrolling page:", await page.property('url'), "for more content");
        await scrollPage(page);
    }
}

// Scrolls the page and gets the page content using PhantomJS
async function getPageData(pageUrl, shouldScrollPage) {
    const instance = await phantom.create();
    const page = await instance.createPage();
    await page.open(pageUrl);
    if (shouldScrollPage) {
        await scrollPage(page);
    }
    const pageContent = await page.property('content');
    await page.close();
    await instance.exit();
    return pageContent;
};