使用PHP </title>提取动态<title>标签

时间:2014-11-05 20:32:38

标签: php html

我使用以下(简化的)PHP脚本来提取页面的<title>标记:

function getTitle($Url){
    $contents = file_get_contents($Url);    
    $titlePattern = "/\<title\>(.*)\<\/title\>/";    
       if (preg_match($titlePattern,$contents,$title) && strlen($title[1]) > 0){
            return $title[1];
    } else {
        return "No title found";
    }
}

现在这适用于大多数网站,但我遇到了一些问题。例如,当脚本获取其内容时,this news article会有空白的<title>标记。

在这里它变得很奇怪:当链接在Facebook上共享时,文章标题出现在&#34; Lollygagged:The Insufferable Wait For Android Updates - ReadWrite。&#34; < / em>但是如果我打印file_get_contents(),则无法找到该字符串。

  1. Facebook从哪里拉出上述标题?
  2. 我有另一种获得实际头衔的方式吗? (没有做特定的网站 - 网站脚本)
  3. 谢谢!

1 个答案:

答案 0 :(得分:0)

您提供的链接,视图来源中没有标题。它可能来自javascript。 检查您的网站来源。你会发现<title></title>

Facebook没有获得它的实际头衔。