在Pentaho

时间:2017-05-24 10:46:56

标签: pentaho pentaho-spoon pentaho-data-integration

我有一个get file names步骤,其中一个正则表达式可以获得4个csv文件。 之后我有text file input步骤设置csv的字段,并读取这些文件。

完成此步骤后,将执行Table output步骤。

问题是text file input似乎在一个语句中读取了所有4个文件,因此table output语句会插入4个文件的行。所以我的输出表有20行(每个文件5个)

预期的beahivour读取一个文件,在输出表中插入文件的5行并执行sql脚本,将该表移动到最终表并截断临时表。现在重复第二个,第三个和最后一个文件的过程。

在加载文件的每个步骤中删除临时表,但最终表不是,它是增量的。

我怎么能在pentaho中做到这一点?

1 个答案:

答案 0 :(得分:1)

将当前作业更改为每个传入记录执行一次的子工作。

在你需要的新主要工作中:

  • 运行Get Filenames链接到Copy Rows to Result
  • 的转换
  • 您当前工作的工作条目。将其配置为针对每一行执行。

在subjob中,您必须使用Result中的Get Rows替换Get Filenames并重新配置包含文件名的字段。

相关问题