轻松获取小文件

时间:2011-09-28 10:46:01

标签: hadoop cassandra-0.7 brisk

我是Cassandra和Hadoop的新手。在寻找两种产品的整合时,我遇到了Brisk。从描述中我了解到Brisk替换了CassandraFS的HDFS。那么这个替代是small file problem Hadoop的解决方案吗?如果是这样大文件怎么样?目前,我需要实现一个资源存储,其中包含大型二进制数据文件及其元数据和小文件(如图像)。

1 个答案:

答案 0 :(得分:0)

这两者都是,真的(虽然我认为Brisk现已被纳入商业产品DataStax Enterprise,并且没有自行开发)。

Brisk包含CassandraFS(cfs),它是HDFS的直接替代品,因此支持大文件。在引擎盖下,这些被分成块并存储在Cassandra行/列中。

对于小文件,您可以将数据存储在本机Cassandra行而不是CassandraFS中,而是在行上运行Hadoop作业。