我使用以下(简化的)PHP脚本来提取页面的<title>
标记:
function getTitle($Url){
$contents = file_get_contents($Url);
$titlePattern = "/\<title\>(.*)\<\/title\>/";
if (preg_match($titlePattern,$contents,$title) && strlen($title[1]) > 0){
return $title[1];
} else {
return "No title found";
}
}
现在这适用于大多数网站,但我遇到了一些问题。例如,当脚本获取其内容时,this news article会有空白的<title>
标记。
在这里它变得很奇怪:当链接在Facebook上共享时,文章标题出现在&#34; Lollygagged:The Insufferable Wait For Android Updates - ReadWrite。&#34; < / em>但是如果我打印file_get_contents()
,则无法找到该字符串。
谢谢!
答案 0 :(得分:0)
您提供的链接,视图来源中没有标题。它可能来自javascript。
检查您的网站来源。你会发现<title></title>
Facebook没有获得它的实际头衔。