Pentaho DI(Kettle)基于csv文件头选择流的最佳方法是什么?

时间:2016-02-01 16:11:49

标签: kettle pentaho-spoon

我使用Pentaho DI(水壶)并且不确定以下是执行以下操作的最佳方法: 从下载的csv文件中,检查列是否存在,并根据该列选择正确的下一步。 有3种可能的选择。

谢谢, 艾萨克

1 个答案:

答案 0 :(得分:1)

您没有提及可能的选项,因此我只是向您提供一个草图,展示如何检查文件中是否存在列。

为此,您需要一个CSV file input步骤和Metadata structure of stream步骤,该步骤将读取传入流的元数据。

Transformation

对于包含3列col1col2col3的示例csv文件,您可以将每个列放在一个单独的行中,并将其名称作为Fieldname列中的值在元数据步骤。

Metadata results

然后根据您的需要,您可以使用Filter RowsSwitch / Case步骤进行进一步处理。