使用get_text()时美丽的汤4 UnicodeEncodeError

时间:2016-12-10 20:50:02

标签: python beautifulsoup

我想在this tutorial之后从网页上获取所有文字。但是我似乎无法使用get_text()从网页上获取所有文本,而是收到错误:

  

UnicodeEncodeError:'charmap'编解码器无法编码字符'\ u1d90'   位置2473:字符映射到

以下是我的源代码:

soup = bs.BeautifulSoup(source,'lxml').encode('UTF-8')

关于我哪里出错的任何想法?我已经在Stack Overflow上关注了其他几个答案,并尝试了:

<PropertyGroup>
  <ExcludeFoldersFromDeployment>
    packages
  </ExcludeFoldersFromDeployment>
</PropertyGroup> 

但得到错误:

  

AttributeError:'bytes'对象没有属性'get_text'

0 个答案:

没有答案
相关问题