Scala:如何将Seq [Array [String]]转换为Seq [Double]?

时间:2017-11-27 10:27:55

标签: scala seq

我需要将Seq [Array [String]]类型的数据拆分为两个Seq [Double]类型的项目。

样本数据:([4.0 | 1492168815],[11.0 | 1491916394],[2.0 | 1491812028])。

我用过     var action1, timestamp1 = seq.map(t => (t.split("|"))).flatten.asInstanceOf[Seq[Double]] 但没有像预期的那样得到结果。寻找有价值的建议。

2 个答案:

答案 0 :(得分:1)

假设您的输入格式为"[double1|double2]"

scala> Seq("[4.0|1492168815]","[11.0|1491916394]","[2.0|1491812028]")
res72: Seq[String] = List([4.0|1492168815], [11.0|1491916394], [2.0|1491812028])

删除[],然后按\\|拆分,|是正则表达式中的元字符。

scala> res72.flatMap {_.dropRight(1).drop(1).split("\\|").toList}.map{_.toDouble}
res74: Seq[Double] = List(4.0, 1.492168815E9, 11.0, 1.491916394E9, 2.0, 1.491812028E9)

或者你可以做到

scala> val actTime = seq.flatMap(t => t.map(x => { val temp = x.split("\\|"); (temp(0), temp(1))}))
actTime: Seq[(String, String)] = List((4.0,1492168815), (11.0,1491916394), (2.0,1491812028))

要将它们分成两个Seq[Double],你可以做

scala> val action1 = actTime.map(_._1.toDouble)
action1: Seq[Double] = List(4.0, 11.0, 2.0)

scala> val timestamp1 = actTime.map(_._2.toDouble)
timestamp1: Seq[Double] = List(1.492168815E9, 1.491916394E9, 1.491812028E9)

如果输入中可能存在非双重数据,则应使用Try进行更安全的Double转换,

scala> Seq("[4.0|1492168815]","[11.0|1491916394]","[2.0|1491812028]", "[abc|abc]")
res75: Seq[String] = List([4.0|1492168815], [11.0|1491916394], [2.0|1491812028], [abc|abc])

scala> import scala.util.Success
import scala.util.Success

scala> import scala.util.Try
import scala.util.Try

scala> res75.flatMap {_.dropRight(1).drop(1).split("\\|").toList}
            .map{d => Try(d.toDouble)}
            .collect {case Success(x) => x }
res83: Seq[Double] = List(4.0, 1.492168815E9, 11.0, 1.491916394E9, 2.0, 1.491812028E9) 

答案 1 :(得分:0)

使用由[|]分隔的正则表达式组提取输入列表中的每个项目,

val pat = "\\[(.*)\\|(.*)\\]".r

因此,如果我们假设输入如

val xs = List("[4.0|1492168815]","[11.0|1491916394]","[2.0|1491812028]")

考虑

xs.map { v => val pat(a,b) = v; (a.toDouble, b.toLong) }.unzip

我们将pat中定义的正则表达式应用于列表的每个项目,为每个项目组合每个组,最后unzip,以便我们将元组分成单独的集合;即

(List(4.0, 11.0, 2.0),List(1492168815, 1491916394, 1491812028))