Canonical标签和UTF8

时间:2010-11-24 11:11:25

标签: html seo character-encoding canonicalization

蜘蛛会将以下2个规范链接标记视为指向同一个网址吗?

<link rel="canonical" href="http://www.example.com/&#375;" /> - 已编码
<link rel="canonical" href="http://www.example.com/ŷ" /> - 未编码

4 个答案:

答案 0 :(得分:3)

&#375;是一个HTML实体,表示带有十进制表示法代码点375的Unicode字符。在十六进制中,它是0x177,所以我们谈论的是U + 0177 ŷ

这意味着如果符合以下条件,两个网址都完全相同:

  1. 它们显示在HTML文档的上下文中。
  2. 该文档声明了一个支持此类符号的正确字符集,而您用于键入它的编辑器插入了正确的代码。
  3. 如果浏览器在两种情况下都显示it,那么字符集可能是正确的,但你应该确定它是。

答案 1 :(得分:1)

不是100%肯定,但我认为他们都会指向相同的网址。但请记住,在考虑W3标准时,他们通常会建议编码链接。

答案 2 :(得分:1)

如果您将HTML作为UTF-8传达,则网址被视为相同。

答案 3 :(得分:1)

即使您可以在现代浏览器中使用它,http://www.example.com/ŷ is an invalid URL

您应始终对unicode字符进行百分比编码。