什么是计算 Avro 模式散列的好方法?

时间:2021-03-30 23:00:50

标签: hash schema avro confluent-schema-registry

考虑为每个阶段(如开发、测试和生产)设置单独的架构注册表。

那么相同的架构将在每个注册表中具有不同的架构的全局唯一标识符。

这个想法是在所有阶段(模式注册/进化的地方)都有一个模式的稳定不变标识符——模式内容的计算哈希。

计算这种散列的好方法是什么?选择特定的哈希算法在这里不是问题 - 模式转换可能是问题:是否应该删除文档字符串等?

1 个答案:

答案 0 :(得分:0)

Avro 规范实际上在有关解析规范形式的部分中谈到了这一点:https://avro.apache.org/docs/current/spec.html#Parsing+Canonical+Form+for+Schemas

该表单确实说明应该删除 doc 之类的字段,并指定属性和其他内容的顺序以使所有架构保持一致。

相关问题