重命名雅典娜中的列

时间:2019-03-06 17:37:09

标签: pyspark apache-spark-sql pyspark-sql parquet amazon-athena

Athena表“ organization”从s3中的实木复合地板文件中读取数据。我需要将列名从“ cost”更改为“ fee”。数据文件可追溯到2018年1月。如果我只是在Athena中重命名列,则表将无法在镶木地板文件中查找新列的数据。请让我知道是否有解决方法。

1 个答案:

答案 0 :(得分:0)

您必须更改架构并指向新列“ fee”

但这取决于您的情况。

  • 如果有两个数据集,则在一个数据集中将其称为“成本”,在另一个数据集中将其称为“费用”。 如果是这样,那就很难了,需要更多的思考。

  • 如果实木复合地板文件将其称为“成本”,但是在雅典娜中,您需要通过“费用”进行查询。 在这种情况下,请添加一个称为“费用”的新列。将架构从成本->成本更改为成本->费用