多列方差-协方差矩阵

时间:2019-03-02 17:51:27

标签: python-3.x pandas

我有以下数据:

   at_score    atp_1   atp_2   atp_3   g_date  g_id    g_time  ht_diff ht_score    htp_1   htp_2   htp_3
0       0         6      7        8    11/16/18   1      0         0       0          1       2      3
1       13        6      7        9    11/16/18   1      15        2     15           1       2      3
2       20        7      8       10    11/16/18   1      18        2     22           3       4      5
3       40        7      8        6    11/16/18   1      33        5     45           4       1      2
4       65        8      7        6    11/16/18   1      60       -3     62           1       2      3
5        0        6      7        8    11/20/18   2       0        0     0            1       2      3
6       10        9      7        8    11/20/18   2       7       -4     6            4       2      3
7       26        6     10        7    11/20/18   2      24       -1     25           1       5      4
8       40        9      7        8    11/20/18   2      42        5     45           1       2      5
9       65        6      7       10    11/20/18   2      60        5     70           1       5      2

其中at_score,ht_score是客队和主队在特定日期(g_date),特定游戏(g_id)和特定时间(g_time)的得分。 ht_diff代表主队的得分差异(ht_score-at_score)。最后,对于我来说,最重要的是,atp_1,atp_2,atp_3是当时正在比赛的3个客队。 htp_1,htp_2,htp_3是他们的主队对手。

我要计算的是基于ht_diff,ht_score和at_score在比赛中以及与他们一起比赛的球员时的变化情况下的每个主场和客队球员的方差-协方差矩阵。例如,客队6在g_id 1的前13分钟(此期间ht_diff = 2)和后27分钟(ht_diff = -3)中与玩家7和8一起玩。

最后,我有大约250万个观察值(一次有10个玩家在玩),因此找到一个“容易”的方法来进行计算非常有帮助。

0 个答案:

没有答案