如何将“LOAD DATA LOCAL INPATH”加载到远程hiveserver

时间:2016-10-27 06:58:28

标签: hadoop hive beeline

我想使用“LOAD DATA LOCAL INPATH ..”在本地计算机上导入文件。

但是,我无法导入

$ beeline -u jdbc:hive2://example:10000 -e "LOAD DATA LOCAL INPATH 'tmp/file_20161024.dat' OVERWRITE INTO TABLE some_table PARTITION(dt=20161024);"

Connecting to jdbc:hive2://example:10000
Connected to: Apache Hive (version 2.1.0)
Driver: Hive JDBC (version 1.2.1)
Transaction isolation: TRANSACTION_REPEATABLE_READ
Error: Error while compiling statement: FAILED: SemanticException Line 1:23 Invalid path ''tmp/file_20161024.dat'': No files matching path file:/opt/hive/bin/tmp/file_20161024.dat (state=42000,code=40000)
Closing: 0: jdbc:hive2://example:10000

也许,因为文件在本地机器上,我认为它没有被导入。

如何将本地文件用作导入文件

我使用beeline(1.2.1)。

VirtualMachine上有Hiveserver(示例)。

谢谢!

更新

我尝试了以下内容。

beeline -u jdbc:hive2://example:10000 -e "LOAD DATA LOCAL INPATH '/Users/asari/workspace/tmp/file_20161024.dat' OVERWRITE INTO TABLE some_table PARTITION(dt=20161024);" 

Connecting to jdbc:hive2://example:10000
Connected to: Apache Hive (version 2.1.0)
Driver: Hive JDBC (version 1.2.1)
Transaction isolation: TRANSACTION_REPEATABLE_READ
Error: Error while compiling statement: FAILED: SemanticException Line 1:23 Invalid path ''/Users/asari/workspace/tmp/file_20161024.dat'': No files matching path file:/Users/asari/workspace/tmp/file_20161024.dat (state=42000,code=40000)
Closing: 0: jdbc:hive2://example:10000

1 个答案:

答案 0 :(得分:1)

只是一个猜测,但根据你的描述,我会说你指的是错误的位置。

据推测,您将文件放在“普通”本地目录中。在这种情况下,您可能需要像以下两个示例之一那样引用它:

/tmp/file_20161024.dat

/home/asari/tmp/file_20161024.dat

注意起始/

如果您的文件实际位于您现在尝试的位置

/opt/hive/bin/tmp/file_20161024.dat

然后请检查文件是否有任何行,以及访问此文件的权限。 (如果您不确定需要哪些权限,请将权限设置为完全打开并查看是否有帮助,请确保将其设置回来!)