Question

我目前正在处理一个CSV文件，其中包含多个具有相同事件编号的行，后面是另一列，其中包含相同数量的行，并且具有相同事件编号的输入。我的目标是只用一个案例编号和一行包含所有事件行。

为了澄清，有一列有26行用于相同的事件编号，另一列有26行。我想把它归结为一排。如何将所有信息合并为一行？

Answer 1

玩具示例：

df = pd.read_csv('data.csv')
df_2 = df.groupby('incident_number_column').agg(lambda x: ' '.join(x)).reset_index()

ASSUMING 您只有两列，这将按事件编号对所有文本进行分组，然后将所有行连接在一起，并使用一个分隔空间。结果应该在df_2

中