制表符分隔csv而不是scrapy分隔的逗号

时间:2014-04-16 15:30:13

标签: web-scraping scrapy

我目前正在使用命令

scrapy crawl myspider -o output.csv -t csv

获取输出csv文件。默认情况下,这些文件以逗号分隔。我如何获得制表符分隔文件?

1 个答案:

答案 0 :(得分:0)

使用此解决方案覆盖Scrapy的默认CSV书写器分隔符。

scraper / exporters.py

from scrapy.exporters import CsvItemExporter


class CsvCustomSeperator(CsvItemExporter):
    def __init__(self, *args, **kwargs):
        kwargs['encoding'] = 'utf-8'
        kwargs['delimiter'] = '\t'
        super(CsvCustomSeperator, self).__init__(*args, **kwargs)

scraper / settings.py

FEED_EXPORTERS = {
    'csv': 'scraper.exporters.CsvCustomSeperator'
}

在终端机中

$ scrapy crawl spider -o file.csv