воскресенье, 6 июля 2008 г.

Virtual Machine Failure Monitoring (VMFM)

Когда вышел ESX 3.5, я читал(и писал сюда), что VMware HA будет уметь мониторить не только хосты, но и отдельные ВМ. "Мониторить" в том смысле, что следить за ними, и в случае сбоя перезагружать.
Наконец то могу внятно рассказать что и как с этой, пока еще, экспериментальной штукой:

Называется она Virtual Machine Failure Monitoring (VMFM).
Работает она следующим образом: система мониторит ежесекундные heartbeat сигналы от VMware tools, и по факту их пропажи перезагружает ВМ.
Таким образом, для включения этой функции нам надо:
ESX 3.5
VC 2.5
HA кластер
Установленные VMware tools

Чтобы включить VMFM, идем в расширенные настройки HA кластера, и указываем следующие опции:
das.vmFailoverEnabled – true (true или false)
das.FailureInterval – 30 (ВМ считается зависшей, если от нее не было heartbeat в течении этого кол-ва секунд)
das.minUptime – 120 (После включения ВМ нужно какое то время - для загрузки ОС, VMware tools и стабилизации heartbeat'ов. Вот тут мы это время и указываем, в секундах.)
das.maxFailures - 2 (Максимальное кол-во сбоев и последующих перезагрузок ВМ в течении времени, указанного в опции das.maxFailureWindow. Если das.maxFailureWindow выставленно ‐1 (no window), das.maxFailures представляет абсолютное количество сбоев, после которого VMFM прекращает автоматические перезапуски ВМ.)
das.maxFailureWindow выставлен не в -1, и число – 86400 (Или -1 или значение в секундах. Если число рестартов превысило указанное в опции das.maxFailures, то VMFM прекращает автоматические рестарты.)Для тестов этой функции можно пользоваться симуляцией BSOD.
Забавно, что никаких статусных сообщений система не генерит. Ужас, конечно. Остается только заглядывать в логи - в hostd.log можно найти что то вроде "([2008-06-26 11:47:22.552 ‘ha-eventmgr’ 3076440992 info] Event 101 : VM1 on Esx1.xyz.com in ha-datacenter is reset)".
К счастью, вскоре VMFM обещают вывести из статуса экспериментальной, глядишь - и статусные сообщения внятные добавят. Так что остается ждать Update 2.



0 коммент.:

Отправить комментарий