在Storm中添加外部数据源

时间:2013-10-29 12:58:27

标签: hadoop cloud apache-storm real-time-data

我是Apache Storm的新手。我目前已经完成了字数统计问题。目前我的数据源(包含单词的文件)位于我的本地系统中。但现在我需要这个文件在外部系统中。即如果我告诉ip外部系统和文件路径,那么我的应用程序是否会从该文件(远程位置)获取数据?

1 个答案:

答案 0 :(得分:0)

一种选择是将文件提供给MongoDB,让你的spout从MongoDB中提取文件。看看Storm Mongo。但请记住文件的大小。您不希望将大文件作为“元组”传输。