AKS 版本升级错误:操作失败,状态为:“冲突”。详细信息:当集群处于失败状态时不允许升级

时间:2021-06-03 15:11:14

标签: azure kubernetes azure-aks

我注意到其中一项 AKS 服务处于失败状态。当我去诊断时,我发现不再支持当前版本。因此,我尝试按照此处说明的说明进行操作:https://docs.microsoft.com/en-us/azure/aks/upgrade-cluster

我先运行了命令:

az aks get-upgrades --resource-group myResourceGroup --name myAKSCluster --output table

然后:

az aks upgrade --resource-group myResourceGroup --name myAKSCluster --kubernetes-version new_version

这会产生一个错误:

<块引用>

操作失败,状态为:“冲突”。详情:升级是 当集群处于失败状态时不允许。对于解决步骤 访问 https://aka.ms/aks-cluster-failed 以解决为什么 集群状态可能已失败以及修复集群状态的步骤。

因此,由于旧版本导致状态失败,并且由于状态失败而无法更新版本... 我检查了这个 This container service is in a failed state 但这不是我们的问题,我们有足够的资源来处理(我们用 az aks show --resource-group myResourceGroup --name myAKSCluster --query agentPoolProfiles 检查)

删除和重新创建 AKS 不是一种选择。

1 个答案:

答案 0 :(得分:1)

因此,在尝试不同的解决方案并失败了数小时后,我在以下答案中找到了解决方法:https://github.com/Azure/AKS/issues/542

为了修复由于版本过时而导致的失败状态,我只需执行以下操作:

升级到已经存在的版本。所以我的版本是 1.14.8,我只是跑了:

az aks upgrade  --resource-group myResourceGroup  --name myAKSCluster --kubernetes-version 1.14.8

修复了集群的失败状态!

在此之后,我只是升级到正确的下一个版本(在我的情况下为 1.18.19):

az aks upgrade  --resource-group myResourceGroup  --name myAKSCluster --kubernetes-version 1.18.19

我希望这会为某些人省去几个小时的挫败感 :)