Sqoop导出 - hdfs到rdbms。我可以修改自动创建的java文件来删除特殊字符吗?

时间:2017-04-27 17:32:44

标签: java hadoop hdfs sqoop

美好的一天,

我使用sqoop(1.4.6-cdh5.7.4)将数据从hdfs加载到我的oracle数据库中。我的文件有明确定义的分隔符,但偶尔会有一个特殊字符出现在一列或多列中,并且会导致sqoop作业失败并且无法解析'错误。

在尝试插入rdbms表之前,是否可以修改sqoop作业创建的java程序以包括剥离或甚至将特殊字符括在引号中?

例如字段^是分隔符---> ^ soit 0h16mn,vorous jusqu' au ^

谢谢, Fid获取

1 个答案:

答案 0 :(得分:0)

错误主要是由于数据中的特殊字符。你能改变你的SQL脚本并过滤掉特殊字符吗?