使用DOM抓取网站的标题

时间:2011-05-03 13:08:59

标签: php html dom

  

可能重复:
  Get title of website via link
  How do I extract title of a website?

如何使用PHP DOM抓取网站的标题? (哪种方法是使用PHP获取它?)

2 个答案:

答案 0 :(得分:17)

你可以使用getElementByTagName(),因为你的html技术上只有一个title属性,所以你可以抓住你在DOM中遇到的第一个。

$title = '';
$dom = new DOMDocument();

if($dom->loadHTMLFile($urlpage)) {
    $list = $dom->getElementsByTagName("title");
    if ($list->length > 0) {
        $title = $list->item(0)->textContent;
    }
}

答案 1 :(得分:6)

禁止来自错误HTML或缺少元素的任何解析错误:

<?

$doc = new DOMDocument();
@$doc->loadHTML(@file_get_contents("http://www.washingtonpost.com"));

// find the title
$titlelist = $doc->getElementsByTagName("title");
if($titlelist->length > 0){
  echo $titlelist->item(0)->nodeValue;
 }