Hive Query转储问题

时间:2015-12-05 12:52:16

标签: hadoop hive hdfs

我在使用twitter在股票市场进行项目情感分析时,在hive中获取查询dump(text file delimited by ^)时遇到了困难。

下面给出了应该在hdfs或本地文件系统中获取输出的查询:

hive> select t.cmpname,t.datecol,t.tweet,st.diff FROM tweet t LEFT OUTER JOIN  stock st ON(t.datecol = st.datecol AND lower(t.cmpname) = lower(st.cmpname));

查询生成正确的输出,但是当我尝试将其转储到hdfs时,它会给我一个错误。

我在stackoverflow中使用了各种其他解决方案进行转储,但我找不到适合我的合适解决方案。

感谢您的帮助。

1 个答案:

答案 0 :(得分:0)

INSERT OVERWRITE DIRECTORY '/path/to/dir'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '^'
SELECT t.cmpname,t.datecol,t.tweet,st.diff FROM tweet t LEFT OUTER JOIN stock st
    ON(t.datecol = st.datecol AND lower(t.cmpname) = lower(st.cmpname));