如果第一列值相同,则Python(CSV)求和第二列

时间:2018-02-11 21:11:05

标签: python pandas csv

我有一个如下所示的CSV文件:

25,57
25,60
35,60
35,60
35,60
45,70
45,70
...

我需要的是从这个文件创建一个新的csv文件,它只保留第一列的一个条目,并对第一列的值相同的第二列的所有值求和。

我需要从上面做出的例子:

25, 117
35, 180
45, 140

注意:我尝试过pandas grouby,我的图书馆出现了错误......

尝试过的代码:

IdandScoreArray = np.empty((27,2),dtype = int) 用f作为csvfile:

csvreader = csv.DictReader(csvfile)

for row in csvreader:

        IdScore = (row['user_id'], row['grade_id'])

        IdandScoreArray = np.append(IdandScoreArray, [IdScore], axis = 0)

df = pd.DataFrame(IdandScoreArray,columns = [' First',' Second'])

df.groupbby('首先&#39)。总和

print df

(类似的东西)

1 个答案:

答案 0 :(得分:1)

我在Pandas数据框架上看不到groupby的任何问题。

import pandas as pd

df = pd.read_csv('data/data.csv', header=None)
df = df.groupby([0])[1].sum()
df.to_csv('data/group.csv')

根据data.csv中输入的样本数据,我在group.csv

中获得了以下输出
25,117
35,180
45,140