如何使用SCALA中的两个分隔符或字符串解析文本文件的特定部分

时间:2017-11-29 11:03:07

标签: scala csv scala-collections

我有sample.txt文件 该文件包含日期和时间日志。

例如,

2

我只想重温2012年的数据,即2012年12月12日之间:到; 我怎么能在scla或spark scala中做到这一点。 最后我需要用逗号删除=并以csv格式保存。 我怎么能这样做。

1 个答案:

答案 0 :(得分:0)

要提取该特定部分,您可以使用:

def main(args:Array[String]):Unit={
    val text = "10.10.2012:\nerewwetrt=1\nwrtertret=2\nertertert=3\n;\n10.10.2012:\nasdafdfd=1\nadadfadf=2\nadfdafdf=3\n;\n10.12.2013:\nadfsfsdfgg=1\nsdfsdfdfg=2\nsdfsdgsdg=3\n;\n12.12.2012:\nasdasdas=1\nadasfasdf=2\ndfsdfsdf=3\n;"
    val lines = text.split("\n")
    val extracted = lines.dropWhile(_ != "12.12.2012:").drop(1).takeWhile(_ != ";")
    extracted.foreach(println(_))
  }