爆炸二进制值列

时间:2017-12-14 23:20:49

标签: scala azure apache-spark azure-storage apache-zeppelin

我试图爆炸或压平一个二进制数据类型的“Body”列。  将Column Body转换为字符串后,将以以下格式查看数据

{
 "header" :
 {
 "name" : "XYZ", 
 "company" : "ABC"
 }
"payload" :
{
"salary": '"1234"
}
}

我正在查看以下表格格式

姓名,公司,薪水

我试图爆炸,但它抛出了一个错误,因为它是二进制文件,但当我尝试转换为字符串时,它再次抛出错误,如字符串数据类型无法爆炸

val sample = udf((Body: Array[Byte]) => new String(Body))
val df2 = myDF.withColumn("TMP1", sample(myDF("Body"))).drop("Body")

请您为上述问题提出可能的解决方案吗?

0 个答案:

没有答案
相关问题