我正在做一些文本预处理。我有一个包含一组评论的CSV文件,其中每个评论都在新行中提及。我设法对每个评论进行了一些数据过滤(停止单词删除,删除不需要的字符,使每个句子定形)。过滤后的评论被写回到CSV文件,其代码如下所述:
def export(review_list, path_to_csv):
with open(path_to_csv, 'w', newline='', encoding='utf-8') as out_file:
review_writer = csv.writer(out_file, delimiter=',', quotechar='"')
for r in review_list:
review_writer.writerow([r.rating] + r.tokens)
但是,我无法将每一个过滤后的评论的内容写到一栏中,每个句子的单词都占据多列,是否有办法将所有经过过滤的评论的单词都写在一栏中?
答案 0 :(得分:1)
尚不清楚r.rating
是否在A列中(我对csv
模块不熟悉),但是您可以尝试使用类似'|'.join(r.tokens)
的方法...
def export(review_list, path_to_csv):
with open(path_to_csv, 'w', newline='', encoding='utf-8') as out_file:
review_writer = csv.writer(out_file, delimiter=',', quotechar='"')
for r in review_list:
review_writer.writerow([r.rating] + ['|'.join(r.tokens)])
基本上将每个令牌与|作为分隔符。