воскресенье, 14 декабря 2008 г.

Баг в ESX\ESXi 3.5 Update 3 HA VM failure monitoring

Если у вас есть ESX\ESXi 3.5 Update 3,
то у вас могут быть проблемы, если вы используете VMware HA со включенным мониторингом ВМ - VM failure monitoring.
Есть вероятность, что этот самый мониторинг будет ребутать ваши ВМ на ровном месте.
Происходит это потому, что при включении или VMotion ВМ может сбиться настройка отсылания heartbeat сигналов. Не получая их HA агент думает: "Ага! нет сигналов, надо бы ее ребутнуть". И ребутает.
Метод решения описан в KB - Virtual Machine may unexpectedly reboot when using VMware HA with Virtual Machine Monitoring on ESX 3.5 Update 3.
Суть решения весьма проста:
1.Disconnect the host from VC (Right click on host in VI Client and select "Disconnect" )
2.Login as root to the ESX Server with SSH.
3.Using a text editor such as nano or vi, edit the file /etc/vmware/hostd/config.xml
4.Set the "heartbeatDelayInSecs" tag under "vmsvc" to 0 seconds as shown here:

<vmsvc>
<heartbeatdelayinsecs>0</heartbeatdelayinsecs>
<enabled>true</enabled>
</vmsvc>

5.Restart the management agents for this change to take effect. See Restarting the Management agents on an ESX Server (1003490).
6.Reconnect the host in VC ( Right click on host in VI Client and select "Connect" )

thx Denis Baturin.

2 комментария:

  1. После обновления до 3.5.0. 130756
    vmsvc
    heartbeatdelayinsecs>0 /heartbeatdelayinsecs
    enabled>true /enabled
    /vmsvc

    Изменилось на
    vmsvc
    enabled>true /enabled
    /vmsvc

    Какие мнения добавлять в обратку
    heartbeatdelayinsecs>0 /heartbeatdelayinsecs
    или нет ?
    PS: пока все-таки добавил.

    ОтветитьУдалить