Pentaho Spoon - 验证固定宽度输入文件格式

时间:2011-06-10 00:28:56

标签: pentaho kettle

我正在尝试在pentaho中处理固定宽度的输入文件并验证格式。该文件将是字符串,数字和日期的混合。但是,当尝试处理存在错误字符的数字字段(我预期会抛出错误)时,它只读取数字的第一部分并忽略坏字符。

我可以使用包含单个字段的非常简单的输入文件重新创建此问题:

enter image description here

我指定了预期的数字格式,以及起始位置和长度: enter image description here

在运行转换时,我原本期望'Q'导致错误,而是显示以下结果,只读取前两位“67”并填充其余数字以匹配指定的格式:

enter image description here

如果输入文件格式正确,则运行得非常好,但是否则需要抛出错误。任何建议都会很棒。谢谢!

1 个答案:

答案 0 :(得分:1)

仅仅是一个FYI,以防有人在遇到与我一样的问题后偶然发现这个问题。

我能够通过将“文本文件输入”步骤中的所有值作为字符串读取来构建变通方法,然后使用配备正则表达式评估的“数据验证器”步骤来确保数字在解析为数字类型之前已正确格式化以下“选择值”步骤。

为每个领域执行此操作需要更长的时间,但这是我能提出的最强大的解决方案。

由于