我正在用Java学习Spark,我发现要添加一列我们可以使用的
dataset.withColumn("name", expr(something))
我想知道expr
的语法是什么?是正则表达式吗?我没有找到相关的手册。
谢谢。
答案 0 :(得分:2)
函数'expr'需要一个字符串,其中包含一些SQL来定义一列。例如:
val df = List("1AB","2XX","3Y").toDF("id")
df.withColumn("first2OfID", expr("substr(id,1,2)")).show
+---+----------+
| id|first2OfID|
+---+----------+
|1AB| 1A|
|2XX| 2X|
| 3Y| 3Y|
+---+----------+