如何使用nltk.data.load()从UTF-8编码的文件中读取CFG? ASCII文件工作正常,但UTF-8编码的文件出错

时间:2017-05-09 13:02:46

标签: python encoding utf-8 nltk

我正在尝试使用nltk.data.load()加载无上下文语法。语法由英语以外的文本组成,必须以UTF-8格式编码。 nltk.data.load()适用于ASCII格式的文件,但不适用于UTF-8格式的文件。

1 个答案:

答案 0 :(得分:0)

你检查了帮助吗?

>>> help(nltk.data.load)

会告诉你这个:

  

load(resource_url,format ='auto',cache = True,verbose = False,   logic_parser = None,fstruct_reader = None, encoding = None
      从NLTK数据包加载给定资源。下列       目前支持资源格式:
   ...

因此,在encoding="utf-8"的通话中添加nltk.data.load()。 (我会在检查帮助之前尝试过,因为你还要指定编码吗?)

相关问题