Bluemix可扩展容器组自动恢复选项

时间:2015-09-29 08:47:58

标签: ibm-cloud linux-containers

可伸缩组中容器上的自动恢复选项如何工作?

我已经启用它(通过使用--auto并且它在Web UI中显示Autorecovery:On)但是当它今天早上崩溃时它没有尝试重新启动容器。 该组中的容器于2015-09-29T05:51:27.187Z死亡,并在一小时后手动重启,2015-09-29T07:35:33.561Z 重启容器"解决问题"运行时问题(一个正在修复的错误),直到用户在应用程序中再次尝试同样的事情崩溃它为止。

根据docs

  

要在组中的某个容器崩溃或变为不可用时启动新容器,请启用自动恢复选项。如果不选择此选项,则不会自动启动新实例。

列于known problems

  

不会立即自动恢复

     

对于新系统上线,容器组的自动恢复可能需要15分钟以上。等待自动恢复变为可用,这可能需要15分钟以上。

2 个答案:

答案 0 :(得分:1)

在IBM Containers服务中,自动恢复由服务对您在启动容器组时指定的端口执行http curl工作。如果该端口没有响应http curl,那么该服务假定它需要被恢复并将销毁该容器并重新创建它。

答案 1 :(得分:1)

对于组中的每个容器,服务将针对您在创建组时指定的端口运行curl请求。

如果容器因任何原因没有响应,则该服务假定需要更换容器。因此它会破坏该容器并在其位置创建一个新容器。

小字

  1. 容器需要运行响应特定端口上的http请求的服务。
  2. 创建容器组时公开的端口必须与#1中的端口相同。
  3. #1 /#2中的端口必须响应http请求, https请求。组的路由(例如https://example.mybluemix.net)是安全的,从路径到容器的内部流量也是加密的,因此组中的容器不需要监听https。
  4. 服务每2分钟左右检查一次组中的每个容器。
  5. 粗略如果服务必须在大约10分钟内更换组中的每个实例3次以上,服务将停止拆除并从中恢复组中的实例指出。在Bluemix网站上,您可能会看到自动恢复标签从开启切换到关闭。这是为了防止永无止境的拆卸循环和更换容器,这些容器总是崩溃或始终没有响应。