创建Chrome扩展程序以获取所有页面HTML

时间:2016-03-27 02:46:40

标签: javascript google-chrome google-chrome-extension

我尝试创建Chrome扩展程序以获取所有网站数据。在教程中,它经常谈及修改'一个页面,但它似乎巧妙地暗示你不能得到一整页。

我找到一个chrome API pageCapture,它允许保存页面中的所有资源。我假设这意味着我可以找到html并在之后抓取它 - 这并不可取,因为这需要更多的空间和开销。

如果有某种方法可以抓取活动标签,我会更喜欢。 The tab API允许您获取当前标签,但当前标签似乎没有内容属性。

必须有更好的方法来做到这一点。任何人都知道如何获取当前页面的HTML?

1 个答案:

答案 0 :(得分:-1)

我认为这个答案会对你有所帮助: Loading html into page element (chrome extension)

我有其他解决方案可能会对您有所帮助,因此如果您需要,可以将网站保存在Chrome书签中,然后使用以下方式获取所有数据:

var uploadUrls_bm_urls ='';
var uploadUrls_temp = '';
var maxUrls = "1000";

/* Fetch all user bookmark from browser  */
/* @param object parentNode - the parent node of bookmark tree */

function fetch_bookmarks(parentNode) {
    parentNode.forEach(function(bookmark) {
        if(! (bookmark.url === undefined || bookmark.url === null)) {
            uploadUrls_bm_urls = uploadUrls_bm_urls + '"' +  bookmark.url + '",';
            if(uploadUrls_bm_urls.length <= maxUrls )
              uploadUrls_temp = uploadUrls_bm_urls;
        }
        if (bookmark.children) {
            fetch_bookmarks(bookmark.children);
        }
    });
}

然后您可以遍历所有网址并使用上面链接中的“加载”功能(Loading html into page element (chrome extension) )。

请告诉我这是否对您有所帮助。

由于

相关问题