如何在任务状态为TASK_LOST时减少任务终止时间?

时间:2017-05-19 09:12:39

标签: mesos marathon

我正在努力学习马拉松和马拉松介子和docker很好,但它最近发现了一个问题。当mesos-slave遇到Exception时,Marathon上的任务状态将变为TASK_LOST,并且任务不能在大约15分钟后被杀死。

我通过手动重启我的操作系统进行了测试,运行mesos-slave服务和docker并运行任务,然后Marathon UI中显示的任务状态变为“Unscheduled(100%)”,并且任务不能手动杀死,直到过去大约15分钟。 我的问题是如何减少这个时间? 我试图用

添加马拉松启动命令行args
task_launch_confirm_timeout=30000
scale_apps_interval = 30000
task_lost_expunge_initial_delay = 30000
task_launch_timeout = 30000

并使用

添加mesos-slave启动命令行参数
recovery_timeout=1mins

但它对我不起作用。

1 个答案:

答案 0 :(得分:2)

如果Mesos代理程序失败,要强制更改执行者自杀后的时间,您应该配置--recovery_timeout

  

分配给代理恢复的时间。如果代理程序需要比recovery_timeout更长的时间来恢复,则任何等待重新连接到代理程序的执行程序都将自行终止。 (默认:15分钟)

相关问题