我目前正在处理一个CSV文件,其中包含多个具有相同事件编号的行,后面是另一列,其中包含相同数量的行,并且具有相同事件编号的输入。我的目标是只用一个案例编号和一行包含所有事件行。
为了澄清,有一列有26行用于相同的事件编号,另一列有26行。我想把它归结为一排。如何将所有信息合并为一行?
答案 0 :(得分:0)
玩具示例:
df = pd.read_csv('data.csv')
df_2 = df.groupby('incident_number_column').agg(lambda x: ' '.join(x)).reset_index()
ASSUMING 您只有两列,这将按事件编号对所有文本进行分组,然后将所有行连接在一起,并使用一个分隔空间。结果应该在df_2