X
XiNoID
Проблема в общем-то достаточно известная.Происходит случайно и на разных агентах и серверах. Где-то реже, где-то чаще.
Раньше мирились с этой проблемой, подумаешь перезапустить сервер раз в 2-5 месяцев, не страшно.
Но теперь проблема стала повторяться чаще и имеется уже определенная причина. Суть дела такова:
Есть агент, который по расписанию работает с ФТП удаленным сервером. Если в момент этой работы происходят неполадки в работе сети (провайдера ддосят например), то этот агент намертво вешает Агент менеджера, и помочь ему может только рестарт + sig term.
Когда менеджер зависает, никакие агенты по расписанию больше выполниться не могут. Убиение агента по таймауту не работает.
Вижу два пути решения проблемы:
1) Либо есть какая-то глубоко зарытая настройка, которая позволит агент менеджеру самовыпилиться в такой ситуации.
2) Либо мониторить его зависание, а потом действовать по ситуации, либо ручками, либо автоматически. Вопрос в том, как же мониторить его зависание?
Раньше мирились с этой проблемой, подумаешь перезапустить сервер раз в 2-5 месяцев, не страшно.
Но теперь проблема стала повторяться чаще и имеется уже определенная причина. Суть дела такова:
Есть агент, который по расписанию работает с ФТП удаленным сервером. Если в момент этой работы происходят неполадки в работе сети (провайдера ддосят например), то этот агент намертво вешает Агент менеджера, и помочь ему может только рестарт + sig term.
Когда менеджер зависает, никакие агенты по расписанию больше выполниться не могут. Убиение агента по таймауту не работает.
Вижу два пути решения проблемы:
1) Либо есть какая-то глубоко зарытая настройка, которая позволит агент менеджеру самовыпилиться в такой ситуации.
2) Либо мониторить его зависание, а потом действовать по ситуации, либо ручками, либо автоматически. Вопрос в том, как же мониторить его зависание?