如何从URL查找网页详细信息?

时间:2015-09-06 19:20:14

标签: facebook algorithm parsing url web

我对查找网页数据的方法感兴趣,例如标题,封面图片和一些文字,当你想与墙上的链接分享时,它是如何做到的。

我想到了。是的,我可以向页面发送HTTP请求,获取所有网页并在以后解析。但是Facebook如何成功地为每个网页成功,因为并非所有的网站结构都是相同的。

从输入的网址中找到标题,封面图片和某些文字的最佳算法是什么?

2 个答案:

答案 0 :(得分:1)

查看以下脚本。他们使用meta标签从网站收集数据。 http://www.techumber.com/2012/11/exactly-facebook-like-url-parsing-using.html

答案 1 :(得分:0)

没有完美的解决方案。 Facebook使用元标记(他们的网站管理员)来接收正常结果。 如果标签不存在,结果很差。 如果你担心问题的实际方面,首先你应该检查Facebook和其他社交网络的标签=)