从外部选择中选择一个表

时间:2020-10-18 11:07:39

标签: kdb k

我已经看到一种使用update的方法来使用update someFun each t from t(主要是为了增加新列的副作用)。 使用这种技术是好事还是坏事?

一些实验:

t1:([]a:1 2);
t2:([]a:1 2;b:30 40);
update s:{(x`a)+x`b} each t2 from t1

似乎我们可以使用不同的表来执行此操作,所以我猜我们将有2倍的内存过度使用。

但是:

t:([]a:til 1000000;b:-1*til 1000000);
\ts:10 s0: update s:{(x`a)+x`b} each t from t;
4761 32778560

\ts:10 s1: update s:{(x`a)+x`b} each ([]a;b) from t;
4124 32778976

\ts:10 s2: update s:{x+y}'[a;b] from t;
1908 32778512
在所有情况下,

几乎都能得到相同的结果。我想知道为什么内存消耗是相同的

2 个答案:

答案 0 :(得分:2)

在所有示例中,您都是在表的各个行上“遍历”,并且似乎内存消耗是逐步建立向量(多个内存块分配)而不是一次建立的结果。尽可能使用向量运算

q)n:5000000;t:([]a:til n;b:-1*til n)
q)
q)// each row
q)\ts update s:{(x`a)+x`b} each t from t;
1709 214218848
q)v:n#0
q)\ts {x}each v
361 214218256
q)
q)// vector op
q)\ts update s:sum a b from t;
18 67109760
q)\ts til n
5 67109040

答案 1 :(得分:1)

实际上,它已经使用了2倍的内存。 t的大小是-22!t起的16 M 使用的内存为32 M

相关问题