从链接中提取信息,如Facebook墙

时间:2011-03-30 06:51:05

标签: c# html facebook parsing

我一直在开发一个可以发布类似Feed的内容的应用程序。 我想添加内容,如链接(如在Facebook墙上)。

然后我想要一些逻辑来解析链接目的地并提取正确的文本和图像以创建缩略图。

就像Facebook在您的墙上发布链接时那样。

提取/爬行引擎看起来相当复杂,但是最好的方法是什么呢?

我已经考虑过围绕Facebook api,然后从Facebook取回该项目,并以这种方式简单地使用他们的引擎,但我真的想做这个作为一个内部系统。

2 个答案:

答案 0 :(得分:2)

AFAIK Facebook通过使用元标记(开放图谱协议)来做到这一点。您可以在https://developers.facebook.com/docs/opengraph/了解更多信息。

基本上,如果要在内部实施,则应定义约定 希望这会有所帮助。

答案 1 :(得分:0)

我认为facebook基础设施所做的是拉取页面的内容(使用ajax调用),然后获取第一段(如果它是一个网页,描述是否是YouTube视频等),它允许用户选择页面上的一个图像作为缩略图。您可以选择标记中的第一个图像或设计您自己的逻辑。基本上,我会像设计临时缓存引擎一样。你得到页面标记+图像,使用它们然后丢弃。