如何在我自己的页面上显示其他网站的内容?

时间:2010-01-27 19:22:50

标签: language-agnostic screen-scraping

http://www.dogpile.com这样的网站如何在自己的网页上显示来自Google和其他搜索引擎的搜索结果。我可以考虑做这样的事情的唯一方法是使用iframe但当然内容不会真正出现在我的页面上。

5 个答案:

答案 0 :(得分:3)

他们正在使用公共api用于不同的搜索引擎并根据结果构建他们的页面。

见:

  

Google's Search API
  Bing Search API
  Yahoo! Search API

答案 1 :(得分:0)

看看curl。该页面上有很多使用它的例子。

答案 2 :(得分:0)

在服务器端下载他们页面的内容,使所有相关引用绝对,将他们的头条目添加到你的,将你的身体添加到你的,希望你不会被抓到偷别人的内容。

答案 3 :(得分:0)

您可以使用AJAX,并将远程页面视为返回HTML的Web服务。也就是说,只需将innerHTML直接导入到你的DOM中。

答案 4 :(得分:0)

当有人请求搜索时:

  1. 执行搜索服务器上的各种搜索引擎
  2. 使用xpaths,regex等提取内容
  3. 然后在您自己的网页上显示结果