Talend导入,转换原始文件并导出为CSV

时间:2019-02-07 00:44:43

标签: excel schema transformation talend

我的数据包括600万行。没有文件扩展名。想要通过添加“ UPC”列将其导出到csv,该列是4个字段的组合。 输入格式:

the raw file

所需的CSV格式的输出格式

transformed raw file

UPC = SY + GE + VEND + ITEM

使用Excel打开了它,但是因为它有超过600万行,所以它被截断为100万行。 由于没有定界符,我对talend的架构存在疑问。

1 个答案:

答案 0 :(得分:0)

首先,手动创建元数据列(如果导入文件,因为它是一个巨大的文件,挂起时挂掉)。因此,在元数据中创建列名称(验证第一个快照)。完成后,将元数据作为tFileInputDelimited拖动,并确保将定界符作为空格提供(验证第二张快照)。在tmap中,创建新端口,并根据需要对列进行SY + GE + VEND + ITEM,并将其传递到tFileOutputDelimited,在其中应将分隔符提供为,。如果您遇到任何问题,请告诉我。 enter image description here

enter image description here

谢谢