如何使用pentaho水壶从行集中查找唯一值?

时间:2012-04-17 08:19:52

标签: etl pentaho kettle

我有一张de normalized table。我想从该表的一个特定列中选择所有值,并仅将该列中的唯一值加载到单独的表中。

如何使用Pentaho Spoon做到这一点?请注意,我完全是Spoon的新手。在我的生活中,我只尝试过世界的转变。

我有一个名为'Employees'的表,它有很多列如下(我没有在这里给出不相关的列):

+-------------------------------------------------------+

                           Employees
+-------------------------------------------------------+

employee_number | employee_name | deputed_branch | phone

+-------------------------------------------------------+

现在我想使用Spoon将唯一的分支名称移动到名为branches的新表中。

'branches'表格如下所示:

+-------------------------------------------------------+

                           branches
+-------------------------------------------------------+

| branch_id | branch_name 

+-------------------------------------------------------+

其中branch_id将是唯一的并自动递增。

要连接Employeesbranches表,我将使用Employee_branch表,其中包含employee_numberbranch_id列。

有人可以告诉你怎么做吗?

提前致谢!!

1 个答案:

答案 0 :(得分:3)

你能不能在sql中做到这一点?

从员工中选择不同的deputed_branch

如果没有;然后使用唯一行步骤(不是必须对数据进行排序)或逐步进行分组。 (也已分类)

或;内存组by if行数低(数据不需要排序)