Kafka Streams API - 连接两个具有多对多关系的表

时间:2017-08-24 11:38:06

标签: apache-kafka kafka-consumer-api apache-kafka-streams

我有两个流来到卡夫卡:

  • 流A:成对的[userID,country]
  • 流B:成对的[docID,country]

我只需要知道一对的存在,因此值可以是true/null。多个用户和多个文档可以共享多个国家/地区,因此在这两种情况下,关系可以多对多。单个用户可以分配多个国家/地区,单个文档可以分配许多国家/地区。

我在最终主题/ KTable中需要的是具有true/null值的三元组(userID,country,docID)(因此我可以在存储的下游添加或删除它们)。

我无法弄清楚,如何使用Kafka的Stream API来实现这一目标。我尝试了各种连接,但它们只能在精确键上工作(这对于分布式系统来说很有意义),但感觉限制了我实现这一点。

0 个答案:

没有答案