处理Python和SQLite中的转义字符

时间:2017-04-21 03:43:56

标签: python sqlite web-scraping tuples

我有一个关于SQLite和Python以及BeautifulSoup的问题

我有一些数据是我从网上抓取并存储在SqLite数据库中的。我使用数据库浏览器轻松查看文本,看起来非常干净。但是,当我在选择了我想要的列后使用cursor.fetchall()将文本检索到python中时,它将作为元组输出,其中一个成员的格式为

('文字在这里',

我注意到,只要文本本身有撇号,Python就会自动切换为使用双引号显示文本,如下所示:

("这句话有引用",)

问题在于,当文本同时具有" "在实际文本中还有'在实际的文本中,Python逃脱了所有的'这种方式的人物:

("这句话的撇号将被烦恼地逃脱",)

我希望用文本本身做一些NLP工作,我觉得我的数据很脏,因为我试图输出它,这样只是原始文本,而且文本永久都有转义字符。

我是否应该返回几个步骤并尝试另一种存储数据的方法,或者是否有针对此问题的简单修复。我已经完成了一些挖掘工作,并且无法找到任何相关内容。

我的最终结果是拥有完全干净的数据,我可以做一些NLP研究,而不会破坏数据。

由于

0 个答案:

没有答案
相关问题