搜索抓取和共享到社交网站的GWT页面呈现

时间:2015-01-19 02:59:36

标签: java javascript ajax gwt

GWT通常是一个纯粹的Ajax站点。其内容由Javascript动态创建。因此,它在搜索可追溯性和共享到社交网站和其他站点方面带来了很多问题。

在典型的社交网络中共享我的GWT应用程序时,"快照"或"截图"生成的只是一个空白页面(通常是背景颜色)。

尝试使用Google等工具在搜索索引中添加GWT应用程序时也是如此。

主页问题:

场景:该网站为mygwtapp.com

此页面是应用的主页。

有哪些经过验证的方法可以让应用程序(e.g www.mygwtapp.com)被抓取,还有一个呈现的网站快照供SNS共享使用?

对包含要抓取的内容列表的动态页面的问题(如搜索结果):

场景:页面是,mygwtapp.com /#PostsPage

此页面根据Ajax调用(RPC或Restlet)生成帖子列表,然后动态构建列表。

点击特定帖子,将转发到名为#PostPage;id=123的网页,此页面还包含抓取工具需要访问的内容。

对GWT应用程序要做的调整是什么,以便搜索爬虫可以抓取所有列表及其每个页面。

同样,对于主页,页面mygwtapp.com/#PostPage;id=123可以与SNS站点共享并获取正确的呈现页面的方式是什么?

1 个答案:

答案 0 :(得分:0)

This回答了你的所有问题,虽然这个问题是一个骗局。