我在GCP上托管了Kubernetes集群(主版本:1.12.7-gke.7
,节点版本:1.12.7-gke.7
)。
最近我注意到创建了太多节点,而对系统没有任何压力。我预期的平均节点数是30,但实际上在不必要的扩展后,它达到了60左右。
我试图通过
来调查此问题kubectl get hpa
看到平均CPU接近0%-此处不应该进行缩放。
也已选中
kubectl get deployments
看到DESIRED
的Pod数量等于AVAILABLE
-因此系统不再要求更多资源。
检查了节点利用率之后,我发现大约25个节点仅使用200 mCPU
,这是非常低的消耗(节点潜力的5%)。
过一会儿,群集恢复正常(大约30个节点),而没有任何重大事件。
这是怎么回事?接下来我应该检查什么?
答案 0 :(得分:0)
水平吊舱自动缩放器会自动缩放吊舱的数量。因此,仅凭它就不能负责缩放节点。但是,如果您启用了cluster autoscaler,则可以这样做。现在,要调试正在发生的情况,您将需要来自主节点的日志,由于它由google维护,因此您无法在GKE中访问它。
在这种情况下,我的建议是与Google Cloud Support联系。