KDB滚动总和

时间:2017-09-15 06:07:54

标签: kdb

我有一张桌子

t:flip `date`sym`ts`qty!(`d1`d1`d1`d1`d1`d1`d2;`s1`s1`s2`s1`s1`s2`s1;`t1`t1`t2`t3`t4`t5`t1;-100 -100 200 200 500 -300 -400)

date    sym   ts     qty
d1       s1   t1    -100
d1       s1   t1    -100
d1       s2   t2     200
d1       s1   t3     200
d1       s1   t4     500
d1       s2   t5    -300
d2       s1   t1    -400

我希望得到每个sym的累计总和,直到同一天的那一刻

date    sym   ts     qty   cumsum
d1       s1   t1    -100     -200 // -100 - 100
d1       s2   t2     200      200 //  200
d1       s1   t3     200        0 // -100 -100 + 200
d1       s1   t4     500      500 // -100 -100 + 200 + 500
d1       s2   t5    -300     -100 //  200 - 300
d2       s1   t1    -400     -400 // -400 (date is d2)

我尝试使用

select sums qty by date, ts, sym from t

但是有了这个,我只设法将具有相同键date ts`sym的行折叠到一个列表中,但它并没有给我一个滚动的总和。有什么建议吗?

编辑: 所以,基本上我想附加一个列,显示我将从此查询中获得的值

select sum qty from t where sym =`symbol_of_this_row, ts <= ts_of_this_row, date = _date_of_this_row

4 个答案:

答案 0 :(得分:2)

这应该做你想要的:

//Ascend by date and time to make sure that result sets match
`date`ts xasc 
    //Compute cumulative sums by date, sym, timestamp
    update sums cumul by date,sym from 
        //Make sure that there is a single qty for each timestamp
        select cumul:sum qty by date,sym,ts from t

答案 1 :(得分:1)

我可能会误解你的问题..所以你想要匹配date sym`timestamp的行的累积总和,是吗?

这个怎么样:

    t: update cumsum:sums qty by date, sym, ts from t
    // for the sake of 'pretty view' sort by `date`sym`ts 
    `date`sym`ts xasc t
编辑:我确信你可以通过功能更新(http://www.timestored.com/kdb-guides/functional-queries-dynamic-sql)让它变得更漂亮 我只是自己写了一些函数来向你展示基本的想法。 1.传递桌子和每排桌子。

    temp:{[idx; tbl]
         row: first select from tbl where i = idx;
         : last update cumulative:sums qty from (select from tbl where date=row[`date], sym=row[`sym], ts<=row[`ts]);
         };
  1. 通过右侧(/)

    更新表格
     temp2:{[tbl; idx]
        row: first select from tbl where i = idx;
        :tbl lj (`date`sym`ts xkey enlist last update cumulative:sums qty from  (select from tbl where date=row[`date],sym=row[`sym],ts<=row[`ts]));
        };
    
  2. 对于#1,你可以调用类似的东西:

    tbl: {: temp[y; x] }[; tbl] each til count tbl
    
    对于#2,你可以打电话给:

    tbl: temp2/[tbl; til count tbl]
    

答案 2 :(得分:1)

这可能有用,虽然有点难看;

`date`ts xasc 0! / sort and unkey
    update cumsum:sums qty by date, sym from 
        select sum qty by date, sym, ts from t

哪个产生;

date sym ts qty  cumsum
-----------------------
d1   s1  t1 -200 -200  
d1   s2  t2 200  200   
d1   s1  t3 200  0     
d1   s1  t4 500  500   
d1   s2  t5 -300 -100  
d2   s1  t1 -400 -400  

注意第一行中的数量与您的示例不同。那是因为我必须在运行累积和之前聚合相同ts中的数据。可能有一种方法可以隐含地这样做,但它现在不会来找我。

答案 3 :(得分:0)

如果行按时间顺序排列,则无需对表进行排序: by 子句将执行您想要的操作。

  1. 使用AB(1) + A'C(1) AB + A'C = AB + A'C updatecumsum
  2. 计算date
  3. tslastcumsum
  4. 选择<{> 1 {} {/ strong>值date
  5. 删除密钥
  6. ts

    如果您需要参数化任何一个(即将列名作为参数传递),您将需要enter image description here

    sym

    更多functional forms