Pentaho-在CSV文件中的标题前跳过两行

时间:2019-03-14 19:12:57

标签: pentaho pentaho-spoon pentaho-data-integration

我具有以下结构的CSV文件:

*name of the file*
*date & location*
header1   header2    header3
data1,    data2,     data3

我有一个csv输入步骤,该步骤读取文件的内容。如何跳过文件中的前两个文件以从第3行读取标头? CSV input step似乎对此没有选择。

感谢您的帮助!

1 个答案:

答案 0 :(得分:0)

也许这个解决方案可以帮助其他人。要跳过 csv 文件中的行,您必须使用“文本文件输入”步骤读取文件并将所有列视为一列, 使用在您的数据中不可用的分隔符,然后文件将不会拆分。然后使用“添加序列”步骤分配行号。之后,您可以使用“过滤器”步骤跳过起始行。删除顶行后,请使用“拆分文件”步骤拆分字段并指定列名称。this image contains transformation snap