我可以将LIMIT与变量一起使用吗?

时间:2014-02-23 16:44:31

标签: apache-pig

我在文档中看到的LIMIT示例往往是:

B = LIMIT A 3;

我只想使用变量(例如另一种关系中元素数量的计数)。

g_all = GROUP foo all;
count_foo = foreach g_all generate COUNT(foo.bar);
B = LIMIT A count_foo;

我意识到上述情况不起作用,但我正在努力展示我的目标。据我所知,我认为我不能做我想做的事。

如果我将参数传递给脚本,我想我可以这样做:

B = LIMIT A $PASSED_IN_PARAM;

我希望能够在内部创建一个值而不是传入一个值。

1 个答案:

答案 0 :(得分:0)

这是来自版本11的文档,但我不确定为什么会这样:

a = load 'a.txt';
b = group a all;
c = foreach b generate COUNT(a) as sum;
d = order a by $0;
e = limit d c.sum/100;

我仍然有的问题是为什么可以使用c.sum,除非你有一行的关系,它可以被视为变量类型?

相关问题