Neo4j - 高可用性和分布式机制之间的区别?

时间:2016-03-14 08:26:45

标签: neo4j distributed-computing high-availability

Neo4j通过名为High Availability的概念解释了聚类。而且,我对使用hadoop知识进行聚类的了解是分布式计算。

这两个概念有什么区别?

由于

1 个答案:

答案 0 :(得分:2)

Neo4j高可用性是指一种扩展Neo4j可以响应的请求数量的方法。 Neo4j HA实现了具有复制群集模型的主从属,以实现高可用性扩展。这意味着所有写入都会转到" master"服务器(或从从服务器代理到主服务器),并且更新在从服务器之间同步。可以将读取发送到群集中的任何服务器,从而扩展数据库可以响应的请求数。

将此与分布式计算进行比较,分布式计算是描述如何在大量计算机上并行完成计算操作的通用术语。一个关键的区别是数据分片的概念。使用Neo4j,群集中的每个服务器都包含图表的完整副本,而使用分布式文件系统(如HDFS)时,数据会被分片,每台计算机只存储整个数据集的一小部分。

Neo4j没有对图表进行分片的部分原因是,由于图形是一种高度连接的数据结构,遍历分布式/分片图形将涉及大量网络延迟,因为遍历"跳跃"从机器到机器。

相关问题