如何防止我们的网站被网页报废

时间:2016-04-07 18:07:32

标签: php html curl

昨天我去接受采访,他们问我2个问题我无法回答。有人可以指出我在下面的正确方向吗?

  1. 防止网站被网页废弃的方法。
  2. 如何防止网站中的SQL注入?

4 个答案:

答案 0 :(得分:2)

  1. 通常使用robots.txt文件来避免刮痧。
  2. 他们很可能会问防止SQL注入,而不是添加它。这是通过input sanitization完成的。

答案 1 :(得分:1)

您可以采取以下措施来防止抓取/抓取

  1. 您可以执行一些基本的HTTP标头验证。
  2. 您可以使用一些第三方工具
  3. 您可以使用JS渲染/动态内容,这可能会增加一层难度
  4. 您可以使用登录和限制对某些区域的访问等内容
  5. - 您可以使用robots.txt文件来控制搜索抓取工具
  6. - 您还可以使用rel =“_ nofollow”属性
  7. 装饰您的超链接

    用于SQL注入保护

    1. - 您可以尝试从数据库(n层应用程序)中提取级别,而实际的Web应用程序不会直接与数据库交互。
    2. 正确清理,编码和处理所有用户输入
    3. 不要依赖自己的验证和卫生,使用那些工具 由开发团队组建的
    4. 在您的应用程序中使用单元测试,确保您的应用程序可以 处理所有类型的输入,并且安全失败
    5. 确保您没有直接从中抛出详细的错误消息 数据库

答案 2 :(得分:0)

  1. 为了防止抓取,最好的方法是使网页在某些方面有所不同,每次加载时都无法预测。每个页面都使用标签的唯一标识符等。
  2. 不要将输入包含在动态SQL中。请改用绑定。

答案 3 :(得分:0)

您可以使用htaccess文件/代码来阻止错误的机器人/刮刀并防止SQL注入。

  1. 请参阅此链接:http://www.askapache.com/htaccess/blocking-bad-bots-and-scrapers-with-htaccess.html以获取广泛的错误机器人/抓取工具列表以及要使用的htaccess代码。
  2. 2

        # SQL Injection Protection: Block common SQL commands used in Query Strings
        RewriteCond %{QUERY_STRING} (;|<|>|'|"|\)|%0A|%0D|%22|%27|%3C|%3E|%00).*(/\*|union|select|insert|drop|delete|update|cast|create|char|convert|alter|declare|order|script|set|md5|benchmark|encode) [NC]
        RewriteRule ^(.*)$ - [F]