用于web抓取的php脚本给了我一个空数组

时间:2013-05-07 16:38:20

标签: php web-scraping

我正在尝试使用我的虚拟Web服务器进行网络抓取;我正在寻找项目的名称+页面中创建者的名称,例如Yanira Castro带来的人们来到纽约市

这些信息位于bbcard_name

我的问题是我在脚本末尾收到的数组和csv总是空的......

<?php

set_time_limit(0);

$data = array ()

$listpage = file_get_contents('http://www.kickstarter.com/discover/categories/dance/');

preg_match_all('#<h2> <a href="([A-Z]+)\.html">([a-za-Z ]+)</a></li>#', $listpage, $pagesurl);

    foreach($pageurl[1] AS $pagesurl) {

    $projectPage = file_get_contents('http://www.kickstarter.com/discover/categories/dance/' . $pagesurl . '.html');

    preg_match('#<h2>bbcard_name ([a-zA-Z ]+)</h2>#', $projectPage, $name);
    $name = $name[1];

    preg_match_all('#<h2><a href="https?://.+\.[a-z]{2,5}">([^<]+)</a>#', $projectPage, $namefound);

    foreach($namefound[1] AS $name) {

        if(!isset($data[$name]))

            $data[$name] = array('name' => $name);
        else
            $data[$name]['name'] .= ' - ' . $name;
    }
 }

print_r($data);

$out = fopen('data.csv', 'w'); 
fputcsv($out, array('Titre')); 

foreach ($data as $name => $data) {
    $name = (isset($data['name'])) ? $data['name'] : ''; 
    fputcsv($out, array($data,$name));
}

fclose($out);

echo "FINITO";
 exit;

?>

由于

0 个答案:

没有答案
相关问题