如何通过简单的html dom解析器获取自定义谷歌搜索结果?

时间:2010-10-27 23:19:51

标签: php dom html-parsing

您好我在html页面上包含自定义Google搜索。像

http://www * 的.com / search.htm CX =伙伴-PUB - 00000000000-C77&安培;?COF = FORID%3A10&安培;即= ISO-8ds3-1&安培; q =软件&安培; SA =搜索和; SITEURL = WWW的 * .COM%2#1342

当我在浏览器中使用相同的网址时,我会得到结果。我想通过简单的dom html解析器调用它,然后它返回空白。如果可以,请你帮助我。迫切需要。

或者

如何通过简单的HTML DOM解析器使用Google合作伙伴ID获取Google自定义搜索结果,以便我可以对已完成的搜索进行分析。

感谢。

2 个答案:

答案 0 :(得分:1)

你不能,他们有保护措施,这违反了他们的使用条款。 摘录自Web Search API Terms of Service

  

[...]作为示例而非限制,您同意在使用服务时,您不会,也不会允许用户或其他第三方:

     

[...]使用任何机器人,蜘蛛,网站搜索/检索应用程序或其他设备来检索或索引Google搜索结果的任何部分,或收集有关用户的信息以用于任何未经授权的目的;

答案 1 :(得分:0)

我不知道自定义谷歌搜索,但通过正常的搜索,我得到了所有结果,只需应用

url[?]q=([^&]+)&

所有hrefs的正则表达式。

编辑:取括号中的匹配来获取url,ofc。

(没有注意到这是一个被编辑的旧问题(为了什么?),但也许它对某人仍然有用)