删除spark scala中的前导(左)零

时间:2018-05-03 08:58:30

标签: scala apache-spark

我的文件内容是

0001,02,003
004,0005,06
0007,8,9   

我将文件读作

val file1 = spark.read.textFile("file1").map( x => x.toLowerCase())

file1.collect
    res7: Array[String] = Array(0001,02,003, 004,0005,06, 0007,8,9)

我想删除前导零。 我知道我们使用ltrim但它仅在字符串的情况下用于删除空格。

1 个答案:

答案 0 :(得分:1)

只需将它们投放到Int即可。

val file1 = spark.sparkContext.textFile("file1").map( x => x.split(",").map(_.trim.toInt).mkString(","))
file1.collect
//res0: Array[String] = Array(1,2,3, 4,5,6, 7,8,9)