Bis zur Version 4.1 verwendete VMware die Bezeichnung VMware HA für seine "Hochverfügbarkeitslösung" auf Cluster Ebene. Die verwendete Software war dabei eine Dringabe von der Mutter EMC.
Der HA Agent basierte auf dem Legato AAM <-- Advanced Availability Manager. Dieser wurde durch VMware angepasst und dann für die Clusterumgebung eingesetzt. Dabei besteht die Lösung aus einem Agentensystem, bei dem es Primary und secondary Nodes (Agenten) gibt. Nur die primary Nodes sind dabei fähig HA Fälle zu erkennen und VM-Operationen auszulösen (kurz gesagt).
In der Vergangenheit gab es öfter Probleme mit der HA Konfiguration, da die Funktionsweise des AAM Agenten, eigentlich nicht zu dem Einsatzzweck unter VMware vSphere passte.
Beispiel:
Wenn ein Kunde ein HA Cluster mit acht oder zehn Knoten besitzt und dieses Cluster auf zwei Brandabschnitten liegt <-- innerhalb eines LANs, dann kann es dazu kommen, dass alle funktionsbereiten HA Primary Nodes auf einer Seite sind, da die Auswahl der Primary Nodes einem Automatismus unterlag, analog zu der Master-Browser-Election unter Microsoft Windows Systemen. Das heisst die Primäre Ordnung der HA Agenten passt eventuell nie zu der Lokalisierung der physischen Hosts. Ist kein HA Primary Node verfügbar, dann kann HA nicht reagieren!
Somit kann bei Ausfall eines (Brand-)Abschnitts die skurile Situation entstehen, dass KEINE VM neu gestartet wird!
Mit VMware vSphere HA wurde das gesamte Agentensystem umgeschrieben. Nachwievor gibt es Agenten, die auf den ESXi Knoten installiert werden, allerdings gibt es jetzt eine Master-Slave Situation, bei der es immer nur EINEN Master pro Cluster gibt. Ist der Master nicht erreichbar, wird umgehend eine Wahl / Promotion innerhalb des Clusters durchgeführt, so dass ein Master wieder zur Verfügung steht. Die Slave-Hosts tragen in erster Linie zum Cluster bei, indem sie virtuelle Maschinen lokal ausführen, ihren Laufzeitstatus überwachen und Zustand-Updates an den Master-Host melden. Ein Master-Host kann auch virtuelle Maschinen ausführen und überwachen. Sowohl Slave-Hosts als auch Master-Hosts implementieren die VM- und Anwendungsüberwachungsfunktionen.
Eine der vom Master-Host ausgeführten Funktionen ist das Schützen von virtuellen Maschinen. Wenn eine virtuelle Maschine geschützt ist, garantiert vSphere HA, dass versucht wird, sie nach einem Ausfall erneut zu starten. Ein Master-Host verpflichtet sich, eine virtuelle Maschine zu schützen, wenn erkannt wird, dass als Reaktion auf eine Benutzeraktion der Betriebszustand der virtuellen Maschine von „Ausgeschaltet“ in „Eingeschaltet“ geändert wurde. Wenn ein Failover durchgeführt wird, muss der Master-Host die geschützten virtuellen Maschinen, für die er verantwortlich ist, neu starten. Diese Verantwortung wird dem Master-Host auferlegt, der eine vom System definierte Datei auf dem Datenspeicher exklusiv gesperrt hat, auf dem sich die Konfigurationsdatei der virtuellen Maschine befindet.
vCenter Server meldet anhand des vSphere HA-Hostzustands, ob es sich bei einem Host um einen Master-Host oder einen Slave-Host handelt. Dieser wird auf der Registerkarte Übersicht des Hosts im vSphere-Client und in der Ansicht „Hostliste“ für einen Cluster oder ein Datacenter gemeldet, wenn die Spalte „HA-Status“ aktiviert wurde. Der HA-Status „Wird ausgeführt (Master)“ gibt an, dass der Host als vSphere HA Master-Host dient. Der Zustand „Verbunden (Slave)“ gibt an, dass der Host als vSphere HA-Slave-Host dient. Es gibt weitere Statuszustände, um anzugeben, wann eine Wahl stattfindet oder ein Fehler aufgetreten ist. Die Registerkarte Übersicht des Hosts bietet einen Link neben dem vSphere HA-Zustand des Hosts, der den aktuellen Zustand erläutert