从字符串中提取单词

时间:2020-01-24 14:46:56

标签: apache-spark

我有一个数据框。我有一栏正在声明,例如“在ABC公司工作25天”。我需要提取“ 25天”并将其放在新列中。我正在使用scala与spark。有什么建议?

1 个答案:

答案 0 :(得分:1)

df.withColumn("working_days", regexp_extract(col("statement"), """\d* days?""", 0))
  .where(length(col("working_days")) > 0)
相关问题