卡桑德拉没有复制

时间:2016-03-23 19:24:13

标签: cassandra distributed database nosql

有没有办法配置带有数据中心拆分/ NetworkTopologyStrategy / ReplicationFactor 1的Cassandra集群?基本上,我想将数据保留在其原始节点中,但仍然能够从任何节点查询所有数据。业务用例是:

我有一组客户,每个客户都是一家不同的公司,他们在自己的数据中心拥有数据。我想做一些跨公司的数据分析而没有可用的数据离开他们的前提,即我无法将它们全部加载到中央服务器上。我正在寻找一个平台,允许我为每个公司部署软件,这样我就可以对他们的数据进行分布式比较,而无需他们批量发送他们的数据(其中大部分是禁止发布的)。只要我不将数据复制到其他客户数据中心,以不可读的有线格式传输的数据作为分布式“连接”的一部分就可以了。

1 个答案:

答案 0 :(得分:0)

是的,您可以将复制因子设置为1.但是,确保每个数据项都位于特定站点的节点上需要额外的工作。您需要将客户ID作为每个表的分区键,并编写一个自定义分区程序,将客户ID映射到该客户的令牌。您必须手动配置每个节点,以便仅为其客户使用一个令牌。

相关问题