有没有办法使用hiveContext获取列名?

时间:2014-12-08 09:14:10

标签: apache-spark

我有一个“iplRDD”,它是一个json,我在下面的步骤中通过hivecontext进行查询。我得到了结果,但没有列标题。有没有办法获取列名称和值?

val teamRDD = hiveContext.jsonRDD(iplRDD) 
teamRDD.registerTempTable("teams") 
hiveContext.cacheTable("teams") 

val result = hiveContext.sql("select * from teams where  team_name = "KKR" ) 
result.collect.foreach(println) 

有什么想法吗?

3 个答案:

答案 0 :(得分:2)

teamRDD.schema.fieldNames应包含标题名称。

答案 1 :(得分:1)

您可以像标题一样将数据框“结果”保存为csv文件:

result.write()。format(“com.databricks.spark.csv”)。option(“header”,“true”)。save(outputPath);

答案 2 :(得分:1)

您可以使用以下方式获取它:

result.schema().fields();