阻止某些html元素被搜索引擎索引

时间:2009-06-11 14:43:15

标签: html search-engine

出于样式目的,我想在页面上插入一些虚拟文本,但它不应该链接到实际内容。有没有办法阻止搜索引擎,或者我必须使用好的旧图像吗?

或者可以通过javascript动态加载吗?因为我听说谷歌会读取一定数量的JavaScript。

4 个答案:

答案 0 :(得分:1)

您可以在无边界iframe中显示内容,并阻止iframe的src(一个完全独立的“页面”)与搜索引擎相关联吗?

或者,使用javascript添加内容,将javascript存储在您从引擎中阻止的.js文件中?

答案 1 :(得分:1)

如果您通过AJAX加载该文本,它可能不会被编入索引 - 上次我检查时,GoogleBot实际上并没有执行JS(其他蜘蛛也没有(但有些垃圾邮件显然可以这么做))。

警告:AJAX响应应该包含X-Robots-Tag: noindex标头,以防其URL实际链接到某处。

答案 2 :(得分:0)

我猜想在页面加载完成后加载内容(例如,当document.ready事件触发时)将是一种相当安全的方式来做你正在谈论的事情。但不是100%肯定这一点。

答案 3 :(得分:0)

我会非常小心你决定的任何技巧。赔率很可能谷歌会认为你试图向用户展示不同的内容而不是它。

我一直认为Google实际上是通过渲染页面(可能使用Chrome渲染引擎的某些服务器端版本)来工作,然后使用OCR软件读回结果,以确认源中的文本与用户会看到JS和框架启用。谷歌一直公开警告网站管理员不要尝试向用户提供不同内容的机器人,OCR将是找出的最佳方式(特别是如果您的'验证者'使用IE的用户代理字符串并从未经Google注册的IP范围中抓取)。

简短的回答然后,将装饰服务为:

  • 一个iframe
  • 一个对象
  • SVG图片

由于您将文档清晰地链接到您的网页,因此谷歌可以合理地将其视为单独的资源并对其进行相应的评分,尤其是如果每个页面上都显示相同的文字。这让我想到:

您打算在所有/大多数页面上使用相同的文字装饰吗?如果是这样,谷歌几乎肯定会将其视为“橱窗装饰”并忽略它(它显然是通过菜单等来实现的。)