hadoop - 运行具有高可用性的Hadoop群集的最低系统要求

对于Hadoop HA - 您至少需要两台可以运行Namenode和Namenode HA的独立机器。因此理论上你可以拥有至少2台机器的Hadoop HA集群。但这在实际中并没有多大用处。

回答你的另一个问题： 1.您可以在运行Namenode服务的计算机上运行DataNode服务。这是PoC集群中的一般情况，其中您有小型集群（大致为3-7个节点）注意：作为最佳实践的一部分，您应该使用专用机器作为生产中的Namenode等主服务。

是的，您可以在运行Datanode或Namenode或两者的计算机上运行YARN服务。事实上，在单节点集群上，所有服务都在一台机器上运行。基本上，所有这些服务，如Namenode，Datanode，YARN都是Java进程，因此它们运行在不同的JVM上。您可以根据需要在同一节点或不同节点上托管所有这些过程。

Namenode主要需要RAM，这取决于您在群集中或预期拥有的群集数据大小和数字块。通常，您的查询（CPU或I / O密集型）不会影响namenode系统要求。