CSV文件和外部表具有不同的行数

时间:2019-04-24 10:31:50

标签: hadoop hive hdfs

我正在通过Hive中的外部表在表中加载一个csv文件。 csv有1000行。但是,当我在其上创建外部表时,该表显示1219行。除了1000条正确的行外,表还有219条额外的行,所有列中的值均为空。任何人都可以提出任何建议,以避免额外的219行?我从蜂巢select count(*) from table命令获得的计数。该文件位于hdfs中。

我已经从记事本++尝试过EOL功能

这是我的创建声明

Create external table if not exists movie_data_sample(
    movie_rank int,
   title string,
   genre string,
   description string,
   director string,
   actor string,
   year int,
   runtime_in_minutes int,
   rating decimal(2,1),
   votes int,
   revenue_in_millions decimal(10,1),
   metascore int
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
location 'location'
tblproperties ("skip.header.line.count"="1");

0 个答案:

没有答案