如何计算时间段之间的相关性

时间:2010-12-16 23:08:46

标签: math statistics

如果我有2个时间间隔列表:

清单1:
1. 2010-06-06至2010-12-12
2. 2010-05-04至2010-11-02
3. 2010-02-04至2010-10-08
4. 2010-04-01至2010-08-02
5. 2010-01-03至2010-02-02

和 清单2:
1. 2010-06-08至2010-12-14
2. 2010-04-04至2010-10-10
3. 2010-02-02至2010-12-16

在两个列表之间计算某种相关或相似因子的最佳方法是什么?

谢谢!

2 个答案:

答案 0 :(得分:2)

这是数据的范围还是只是一个样本来了解您的结构?

关于如何看待这个问题的一些想法...我很抱歉,如果你看到这个集合时你的当前状态是多余的。

比较这样的区间时会想到两个基本想法:绝对或相对。相对比较将忽略间隔数据的绝对时间,并查找在两个组中但不一定同时发生的重复结构或签名。绝对版本会认为同时发生的事件是相关的,如果每周发生一些事情,如果它们相隔一年就没关系......你可以通过了解数据的来源来做出这种区分。

如果它是您可用于关联的决定的总数据,那么将归结为关于什么构成“相关性”的一些假设。例如,如果你有一个特定的模型来处理正在发生的事情 - 例如一个开始的时间,停止的时间(失败)模型你可以评估观察另一个序列的可能性。但是,如果没有更多的示例数据,您似乎不太可能做出任何确定的结论。

两组中的第一个区间几乎相同,因此它们对我能想到的两组相关性测量结果有很大贡献。如果这个集合有一个随机模型,我希望很多模型会显示这两个观察结果并且“不太可能”就是因为这个。

评估“相似性”的一种方法是询问时间轴的哪个部分被覆盖(可能推广到多个覆盖范围)并在此基础上比较两个组。

另一种可能性是为这些事件的整个区间中的任何特定日期分配一个为每个序列添加一个的函数。这样,您就可以获得连续的功能,并对同一日期的多个事件进行基本描述。计算两组之间的相关性可能会给你结构相似性的建议,但你需要更多的数据组来做出任何结论。

好的,这有点漫无边际。祝你的项目好运!

答案 1 :(得分:1)

您可以尝试使用Cross-Correlation

但是,您应该知道您有矢量数据(开始,长度),并且算法假设它们之间存在功能依赖关系。这取决于您的数据的语义,这在问题中并不清楚。

HTH!

A more useful link for your current problem here.