我在读取羽毛格式的数据文件时遇到问题,该文件有2+列具有重复的名称。是否可以在元数据级别上删除重复名称或以某种方式加载具有重复名称的数据。
假设数据集“ mtcars”保存在磁盘上,并通过
feather_metadata("mtcars")
给予
[32 x 12] @ mtcars
'mpg':double
'mpg':double
'mpg':double
'cyl':double
'disp':double
使用"read_feather("mtcars")
会产生错误
错误:列名mpg
,mpg
不能重复。
使用.name_repair指定修复。
如何解决此问题?
答案 0 :(得分:1)
这是我找到的解决方案-按列索引读取数据:
--porcelain=<version>
这允许传递重复的列。