在阻止所有美国IP后,Google能否访问我的网站?

时间:2013-10-07 02:43:08

标签: .htaccess googlebot

我将以这种方式使用.htaccess阻止所有美国IP:

<Limit GET HEAD POST>
order deny,allow
deny from 3.0.0.0/8
deny from 4.0.0.0/25
deny from 4.0.0.128/26
deny from 4.0.0.192/28
deny from 4.0.0.208/29
....
allow from all
</Limit>

在阻止所有美国IP后,Google是否能够访问我的网站并将其编入索引?

编辑:对于歧义感到抱歉,但我希望 Google为我的网站编制索引。

5 个答案:

答案 0 :(得分:13)

虽然谷歌的服务器遍布全球,但很难说搜索引擎的机器人主要来自哪里。我建议阻止IP范围,但添加一个与搜索机器人User-Agent匹配的排除条款,如:

SetEnvIfNoCase User-Agent (googlebot|bingbot|yahoo!\sslurp) is_search_bot

<Directory /docroot>
    Order Deny,Allow

    Deny from 3.0.0.0/8
    Deny from 4.0.0.0/25
    Deny from 4.0.0.128/26
    Deny from 4.0.0.192/28
    Deny from 4.0.0.208/29

    Allow from env=is_search_bot
</Directory>

答案 1 :(得分:1)

我不这么认为,但是如果你真的没有谷歌索引它,那么使用robot.txt文件,所以它不索引它。 robot.txt将是

User-agent: googlebot Disallow: /directory/ 

如果这只是阻止美国IP的问题,那就是你可能很好,因为谷歌在许多不同的地方都有数据中心,而不仅仅是美国。这意味着谷歌仍可能将其编入索引。

答案 2 :(得分:0)

虽然谷歌有很多数据中心,但他们所有的机器人都在美国,所以如果你阻止我们的话,谷歌将无法扫描你的网站

答案 3 :(得分:0)

如果您无法访问域根目录,只需使用此meta tag来阻止google bot索引特定页面:

<meta name="googlebot" content="noindex">

如果您的网站已经由Google抓取工具编入索引,请遵循指南Remove your own content from Google search results

答案 4 :(得分:0)

访问权限:https://www.google.com/webmasters/

您需要所有信息。

在这里,Google教你如何阻止你的网站的Googlebot索引: https://support.google.com/webmasters/answer/93708

关于您的问题,我认为如果您屏蔽所有美国IP地址,“Google其他国家/地区”必须访问并为您的网站编制索引,那么他必须与Google美国同步。

相关问题