Talend Open Studio:带半冒号和带引号的标头的定界文件

时间:2019-04-27 18:34:32

标签: etl talend

我有一个用半冒号分隔的分隔文件。 该文件的第一行是标题,标题标记用双引号引起:下面是一个示例:

“姓名”,“电话”,“年龄”,“地址”,“ y”

在使用tFileDelimited和tMap并将字段拖入时,它们看起来像这样,并在字段周围带有下划线: _name _,_ telephone _,_ age _,_ address_,Column05

因此,似乎字段中的双引号更改为下划线字符,并且由于某种原因,最后一个字段是不带引号的单个字符,但是Talend似乎忽略了该字段名称并给出了自己的默认值。

只是想知道是否有人遇到过这种行为,是否应该使用正则表达式删除双引号,所以要先对此进行预处理。 任何帮助表示赞赏。

1 个答案:

答案 0 :(得分:1)

确保在标题令牌之间的第一行中删除多余的空格。如果您使用元数据导入文件,则应该显示正确的名称(只需检查以下选项:“将行标题作为列名”和“ \””作为文本附件)