Scrapy仅返回最后一场比赛

时间:2016-06-02 22:10:16

标签: python parsing web-scraping scrapy scrapy-spider

我有这个简单的代码来提取所有外部链接并遵循内部。 问题是我只获得页脚中的最后几个链接。 有人可以帮忙吗?

<!DOCTYPE html>
<html>
<head>
    <title>Facebook Testing</title>
</head>
<body>
<div id="fb-root"></div>
<script>
  window.fbAsyncInit = function() {
    FB.init({
      appId      : 'your-app-id',
      xfbml      : true,
      version    : 'v2.6'
    });
  };
        (
            function (d, s, id) {
                var js, fjs = d.getElementsByTagName(s)[0];
                if (d.getElementById(id)) return;
                js = d.createElement(s); js.id = id;
                js.src = "//connect.facebook.net/en_US/sdk.js#xfbml=1&appId=304916296240772&version=v2.6";
                fjs.parentNode.insertBefore(js, fjs);
            }
            (document, 'script', 'facebook-jssdk')
        );
    </script>
    <div>Facebook Testing</div>
    <div>&nbsp;</div>
    <div>
        <div class="fb-like" data-href="http://testing.mcgurkin.net/fbTesting.html" data-layout="standard" data-action="like" data-show-faces="true" data-share="true"></div>
    </div>
    <div>
        <div class="fb-comments" data-href="http://testing.mcgurkin.net/fbTesting.html" data-numposts="5"></div>
    </div>
</body>
</html>

0 个答案:

没有答案
相关问题