按最接近的时间戳合并2个csv文件

时间:2014-05-09 11:10:48

标签: php csv

我有2个CSV格式的数据集。两者都包含Unix时间戳。一个包含业务相关数据,另一个包含天气数据。

我想要做的是通过最接近的时间戳导入业务相关数据中的天气数据。由于没有任何时间戳完全匹配,我希望每个企业都拥有最接近天气记录的数据。

我需要找到每个记录的两个时间戳之间的最小差异,并插入该案例的数据。

1 个答案:

答案 0 :(得分:1)

据我所知,最好的方法是

  • 将这两个表上传到数据库
  • 创建日期和时间维度,并将date_id和time_id更新到两个表格。
  • 将您的商家数据的主键更新为密切相关的天气数据。示例如下所示

    更新weather_data set weather_data.id = (来自business_data的SELECT id,其中business_data.timestamp_column< = weather_data.timestamp_column ORDER BY business_data.timestamp_column DESC LIMIT 1);

这将为您提供天气数据的业务数据主键,使您可以轻松加入。

祝你好运!