如何合并几个子文件夹中的几个CSV,删除重复项并将标题添加到新的CSV中?

时间:2019-05-30 10:16:22

标签: python csv

我有两个数据集A和B。

数据集A:子文件夹中的一堆csv(每次1-2-3)。它们没有任何标题,并且上一个CSV的最后一行与下一个CSV的第一行相同。 CSV的名称是随机的,但是它们是有序的。我想用python编写一个脚本,该脚本可以进入每个子文件夹,合并这些CSV,删除重复项,并将标题的第一行添加到最后一个。列如下:

  

一周中的GPS秒|纬度|长|椭球高|间距卷   标题

数据集B:一堆文本文件,每列之间有一个空格。它们与数据集A具有相同的文件夹结构。在这些文本文件中,各列如下:

  

GPS标准时间| OSTM15 Easting | OSTM15北向|大地水准面高度|   间距卷标题

我也希望将这些文本文件合并为CSV。 之后,我要从中复制大地水准面高度并覆盖数据集A中CSV中的椭圆高度。

示例: 数据集A:  -文件夹结构:20190326_OS1\R0,其中R0为1次运行,而20190326_OS1包含多次运行。在R0中,有3个文件:   -20190326_102847_WGS   -20190326_103117_WGS   -20190326_103321   -有时名称末尾缺少_WGS。  -CSV中的数据如下

https://imgur.com/tUbhQRv

数据集B: -文件夹结构:20190326_OS1\R0。与上一个相同,名称相同。 -文本文件中的数据 : https://imgur.com/dmeM1Fn

最终CSV示例:

https://imgur.com/vOfzBgS

谢谢!

0 个答案:

没有答案