Spark scala - 在Json对象中更新/添加新列并使用新的dataframe值进行更新

时间:2018-03-14 12:56:39

标签: json scala apache-spark dataframe struct

我想用另一个json对象中的内容更新现有json对象中的对象数组。

初始对象:

{
    "user": "gT35Hhhre9m",
    "date": "2016-01-29",
    "status": "OK",
    "reason": "some reason",
    "content": [
        {
            "foo": 123,
            "bar": "val1"
        }
    ]
}

补充对象:

{
    "id": "gT35Hhhre9m"
}

合并后对象结构:

{
    "user": "gT35Hhhre9m",
    "date": "2016-01-29",
    "status": "OK",
    "reason": "some reason",
    "content": [{
        "foo": 123,
        "bar": "val1"
        "id": "gT35Hhhre9m"
    }]
}

1 个答案:

答案 0 :(得分:0)

  1. 展平"初始对象"并将Spark数据帧视为列式 数据类似于SQL表。
  2. 完成转换
  3. 转换为Spark数据帧为JSON。
  4. 不认为数据框架是JSON的伎俩。

相关问题