Hubspot等网站如何跟踪入站链接?

时间:2008-12-12 04:50:17

标签: api seo screen-scraping

所有这些类型的网站是否只是非法抓取谷歌或其他搜索引擎? 据我所知,没有“合法”的方式来获取商业网站的这些数据..雅虎! api(http://developer.yahoo.com/search/siteexplorer/V1/inlinkData.html)仅用于非商业用途,Yahoo!老板不允许自动查询等 有什么想法吗?

2 个答案:

答案 0 :(得分:4)

例如,如果您想查找Google主页的所有链接,请搜索

link:http://www.google.com

因此,如果要查找所有入站链接,只需遍历网站的树,并找到它找到的每个项目,即可构建URL。然后向Google查询:

link:URL

您将获得Google从其他网站进入您网站的所有链接的集合。

至于这种收获的合法性,我敢肯定从中获利是不合法的,但是之前从未阻止任何人,是吗?

(所以我不想知道他们是否这样做。只是假设他们这样做。)

答案 1 :(得分:3)

我不知道hubspot会做什么,但是,如果你想知道哪些网站链接到你的网站,而你没有硬件来抓取网页,你可以做的一件事是监控HTTP_REFERER访问您网站的访问者。例如,Google Analytics(据我所知)可以告诉您访问者的来源。这不是100%可靠,因为并非所有浏览器都设置它,特别是在“隐私模式”中,但每个链接只需要一个访问者就知道它存在!

通过在每个网页中嵌入脚本(通常在公共页眉或页脚中)来完成此操作。例如,如果您检查当前正在阅读的页面的来源,您会发现(右下方)一个脚本,该脚本会向Google报告您的访问信息。

现在这不会告诉你是否有人曾经没有人去过你的网站,但让我们面对现实,他们没有人们实际使用的那么有趣。