有没有办法将Spark的数据集.show()方法的输出作为字符串?

时间:2017-08-17 16:56:48

标签: apache-spark apache-spark-sql

Spark Dataset.show()方法对于查看数据集的内容很有用,特别是对于调试(它打印出格式良好的表)。据我所知,它只打印到控制台,但能够将其作为一个字符串。例如,能够将其写入日志,或者在使用IntelliJ进行调试时将其视为表达式的结果会很好。

有没有办法将Dataset.show()的输出作为字符串?

1 个答案:

答案 0 :(得分:3)

=IF(AND(Here="",OR(LOWER(LEFT(OFFSET(Here,,1),1))="p",LOWER(LEFT(OFFSET(Here,,-1),1))="p")),TRUE,FALSE)包外部看不到show背后的相应方法。我采用了相应的方法并对其进行了更改,以便可以将数据帧作为参数传递(代码取自Dataset.scala):

sql