Question

我使用以下（简化的）PHP脚本来提取页面的<title>标记：

function getTitle($Url){
    $contents = file_get_contents($Url);    
    $titlePattern = "/\<title\>(.*)\<\/title\>/";    
       if (preg_match($titlePattern,$contents,$title) && strlen($title[1]) > 0){
            return $title[1];
    } else {
        return "No title found";
    }
}

现在这适用于大多数网站，但我遇到了一些问题。例如，当脚本获取其内容时，this news article会有空白的<title>标记。

在这里它变得很奇怪：当链接在Facebook上共享时，文章标题出现在＆＃34; Lollygagged：The Insufferable Wait For Android Updates - ReadWrite。＆＃34; < / em>但是如果我打印file_get_contents()，则无法找到该字符串。

Facebook从哪里拉出上述标题？

我有另一种获得实际头衔的方式吗？（没有做特定的网站 - 网站脚本）

谢谢！

Answer 1

您提供的链接，视图来源中没有标题。它可能来自javascript。检查您的网站来源。你会发现<title></title>

Facebook没有获得它的实际头衔。

使用PHP </title>提取动态<title>标签

1 个答案: