我一直在研究R,使用flume将流式传输到hadoop数据库的JSON文件。 现在我的问题是我如何才能从JSON文件中获得推文的内容。
JSON文件位于“/ user / flume / tweets / 2013/07/14/06”中。具体来说,在这个文件夹中有10个文件。
我尝试过:
tweets=from.dfs("/user/flume/tweets/2013/07/14/06")
。
然后执行lenght(tweets)
只显示2。
这是正确的做法吗? 请帮帮我。
我的最终目标是在推文发送到HDFS时对推文进行情感分析。