pyenchant识别小写单词,但不是以大写单词开头

时间:2017-03-26 11:39:59

标签: python spell-checking hunspell pyenchant enchant

我正在尝试使用pyenchant拼写检查英语和保加利亚语文本。我有一个问题,在英语中,单词在小写和以大写字母开头时都被识别。例如:

>>> d = Dict('en_GB')
>>> d.check('car')
True
>>> d.check('Car')
True

然而,保加利亚语:

>>> d = Dict('bg_BG')
>>> d.check('кола')
True
>>> d.check('Кола')
False

这是正常行为吗?我想使用SpellChecker类来检查整个段落,这会妨碍我。我真的不想在整个str上使用.lower(),因为这看起来像是一个黑客。 我正在使用pyenchant==1.6.8和Python 3.5.2。 en_US和en_GB词典带有pyenchant,我分别从https://cgit.freedesktop.org/libreoffice/dictionaries/plain/bg_BG/bg_BG.dic和aff下载了bg_BG字典。我不得不将它们从Windows-1251转换为UTF-8,因为否则无法识别任何单词。

0 个答案:

没有答案