Cadence 是一个容错的有状态代码平台。在各种故障情况下,cadence如何处理故障?
答案 0 :(得分:1)
分布式系统中存在各种各样的故障,Cadence 为它们提供了多种选择。
这是我自己的清单。它可能不完整。但如果我能想到,我会尝试添加更多。
通过事件溯源模型的设计,工作流可以从工作人员崩溃时剩下的任何一点恢复。见https://cadenceworkflow.io/docs/concepts/workflows/#state-recovery-and-determinism
工作流还可以有重试策略,如活动自动重试失败https://cadenceworkflow.io/docs/concepts/workflows/#workflow-retries
在某些情况下,失败是由错误的代码更改导致的,从而导致错误的状态。 Cadence 提供了“重置”工具来将工作流程重置到任何时间点。 见https://cadenceworkflow.io/docs/cli/#reset-and-restart
除了重置之外,Cadence 还允许您通过部署进行重置。这对于重置大量工作流(例如数百万)很有用。
活动和工作流工作人员都是无状态的。
Cadence 服务器是一种高度可用且可扩展的服务,可提供持久性。