UnicodeEncodeError:'charmap'编解码器无法对字符'\ u2010'进行编码:字符映射到<undefined>

时间:2015-09-03 18:10:42

标签: python-3.x selenium encoding utf-8

我在尝试打印我从python 3.4中使用selenium请求的网站上获得的'Á时,一直收到UnicodeEncodeError。

我已经在.py文件的顶部定义了

# -*- coding: utf-8 -*-

def是这样的:

from selenium import webdriver

b = webdriver.Firefox()
b.get('http://fisica.uniandes.edu.co/personal/profesores-de-planta')
dataProf = b.find_elements_by_css_selector('td[width="508"]')
for dato in dataProf:
        print(datos.text)

和例外:

Traceback (most recent call last):
  File "C:/Users/Andres/Desktop/scrap/scrap.py", line 444, in <module>
    dar_p_fisica()
  File "C:/Users/Andres/Desktop/scrap/scrap.py", line 390, in dar_p_fisica
    print(datos.text) #.encode().decode('ascii', 'ignore')
  File "C:\Python34\lib\encodings\cp1252.py", line 19, in encode
    return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode character '\u2010' in position 173: character maps to <undefined>

提前致谢

1 个答案:

答案 0 :(得分:171)

已经弄清楚了。正如在this回答中所指出的,编码错误不是来自python,而是来自控制台正在使用的编码。所以修复它的方法是运行命令(在windows中):

chcp 65001

将编码设置为UTF-8,然后再次运行程序。或者,如果像我一样处理pycharm,请转到设置&gt;编辑器&gt;文件编码并依次设置IDE和项目编码。

相关问题