我在使用twitter在股票市场进行项目情感分析时,在hive中获取查询dump(text file delimited by ^)
时遇到了困难。
下面给出了应该在hdfs或本地文件系统中获取输出的查询:
hive> select t.cmpname,t.datecol,t.tweet,st.diff FROM tweet t LEFT OUTER JOIN stock st ON(t.datecol = st.datecol AND lower(t.cmpname) = lower(st.cmpname));
查询生成正确的输出,但是当我尝试将其转储到hdfs时,它会给我一个错误。
我在stackoverflow中使用了各种其他解决方案进行转储,但我找不到适合我的合适解决方案。
感谢您的帮助。
答案 0 :(得分:0)
INSERT OVERWRITE DIRECTORY '/path/to/dir'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '^'
SELECT t.cmpname,t.datecol,t.tweet,st.diff FROM tweet t LEFT OUTER JOIN stock st
ON(t.datecol = st.datecol AND lower(t.cmpname) = lower(st.cmpname));