rchardet gem支持ISO-8859-1和Windows-1252

时间:2014-09-30 07:07:09

标签: ruby chardet

我想知道rchardet是否支持ISO-8859-1和Windows-1252的编码。我已经看过文档但我没有得到关于此的正确信息。

1 个答案:

答案 0 :(得分:2)

我不知道chardet gem,但在https://github.com/jmhodges/rchardet上阅读了5分钟的代码后找到了答案。

  • UTF-8受到各种探测器的支持,包括UniversalDetectorUTF8Prober
  • ASCII是UTF-8,Latin-1和其他的子集。它由UniversalProber直接检测到。
  • ISO-8859-1(也称为Latin-1)受Latin1Prober
  • 支持
  • {-1}}也支持Windows-1252,它与Latin-1非常相似(这取决于数据不可区分)。

至于你的一般问题,你应养成阅读你使用的宝石代码而不是文档的习惯。它不仅有助于理解宝石的作用,还有助于理解它是如何做到这一点以及它做得好和不做什么。此外,阅读代码使您始终成为更好的程序员。