如何将重复值的新列插入到pandas表中?

时间:2017-06-20 15:28:48

标签: python pandas

我是Python的新手。我已经通过pandas抓取了一个html表,我正在寻找插入具有重复字符串值的新列的方法,并将其设置为表的索引(如下:)。提醒表格很长:)。

原创df:

Age IQ
12  100
15  111
 .   .
 .   .
 .   .
 .   .
13  121

预期df"

Group  Age IQ
 A     12  100
 A     15  111
 .      .   .
 .      .   .
 .      .   .
 .      .   .
 A     13  121

1 个答案:

答案 0 :(得分:2)

使用assign创建数据框的副本,其中包含新列:

df.assign(Group='A')

   Age   IQ Group
0   12  100     A
1   15  111     A
2   13  121     A

您可以在之后重新排列列

df.assign(Group='A')[['Group'] + df.columns.tolist()]

  Group  Age   IQ
0     A   12  100
1     A   15  111
2     A   13  121

但是,您可以使用insert编辑数据框。这有额外的好处,允许您指定新列的去向。

df.insert(0, 'Group', 'A')

df

  Group  Age   IQ
0     A   12  100
1     A   15  111
2     A   13  121