如何在csv文件中转置数据集?

时间:2011-02-01 23:29:40

标签: python csv transpose

例如,我想改造:

Name,Time,Score
Dan,68,20
Suse,42,40
Tracy,50,38

分为:

Name,Dan,Suse,Tracy
Time,68,42,50
Score,20,40,38

编辑:原始问题错误地使用了“转置”一词。

7 个答案:

答案 0 :(得分:34)

如果整个文件内容适合内存,则可以使用

import csv
from itertools import izip
a = izip(*csv.reader(open("input.csv", "rb")))
csv.writer(open("output.csv", "wb")).writerows(a)

您基本上可以将zip()izip()视为转置操作:

a = [(1, 2, 3),
     (4, 5, 6),
     (7, 8, 9)]
zip(*a)
# [(1, 4, 7),
#  (2, 5, 8),
#  (3, 6, 9)]

izip()避免立即复制数据,但基本上也会这样做。

答案 1 :(得分:9)

input.csv转移到output.csv。熊猫也可以提供帮助。

import pandas as pd
pd.read_csv('input.csv', header=None).T.to_csv('output.csv', header=False, index=False)

答案 2 :(得分:2)

from itertools import izip
from csv import reader, writer

with open('source.csv') as f, open('destination.csv', 'w') as fw:
    writer(fw, delimiter=',').writerows(izip(*reader(f, delimiter=',')))

答案 3 :(得分:0)

如果lines是您原始文本的列表,那么

for i in range(1,len(lines)):
    lines[i] = lines[i].split(',')

new_lines = []
for i in range(len(lines[0])):
    new_lines.append("%s,%s,%s" % (lines[0][i], lines[1][i], lines[2][i]))

或使用csv Python模块 - http://docs.python.org/library/csv.html

答案 4 :(得分:0)

最简单的方法是:

import numpy as np
import pandas as pd

_mat = pd.read_csv("test.csv")
_mat = _mat[_mat.columns[0:3]].values
_t_mat = np.transpose(_mat)

结果:

  
      
  • 输入矩阵为:[[1 2 3] [4 5 6]]
  •   
  • 输出为:[[1 4] [2 5] [3 6]]
  •   

答案 5 :(得分:0)

将CSV读取到pandas数据框中,pandas具有内置的转置功能,可以按以下方式调用。

import pandas as pd

csv = pd.read_csv("test.csv", skiprows=1)
# use skiprows if you want to skip headers
df_csv = pd.DataFrame(data=csv)
transposed_csv = df_csv.T
print(transposed_csv)

答案 6 :(得分:0)

与nosklo的答案相同(所有功劳都归功于他),但对于python3:

from csv import reader, writer 
with open('source.csv') as f, open('destination.csv', 'w') as fw: 
    writer(fw, delimiter=',').writerows(zip(*reader(f, delimiter=',')))