存档传入的小hdfs文件

时间:2016-01-14 00:41:10

标签: hadoop hdfs archive hadoop-archive bigdata

我每天都有小文件进入hdfs。我打算使用hadoop archive(HAR),但是如何归档每天进入hdfs的这些小文件。例如:我今天可能会得到5个文件我需要将它们存档,明天如果我再获得5个文件,我需要将其添加到前几天的存档中。

1 个答案:

答案 0 :(得分:2)

您无法将文件添加到现有的HAR文件中。您需要在几天内取消归档和重新归档或汇集文件,并继续创建归档文件。