Das Neunundneunzig Prozent Dogma

Monday, 06 July 2009 11:24:50 (W. Europe Daylight Time, UTC+02:00)
Was es bedeuten kann, wenn man als Zuverlässigkeitskoeffizient mit den magischen Zahlen wie 99,9 Prozent von Anbietern "bombardiert" wird kann man sich hier einmal noch etwas genauer durchlesen und dann bestimmen, welche Ausfallzeit für eine Plattform, Anwendung oder Dienst akzeptabel ist, oder eben gerade nicht:

99% - Die Anwendung ist 3 Tage, 15 Stunden, 36 Minuten nicht verfügbar
99.9% - Die Anwendung ist 8 Stunden, 45 Minuten, 36 Sekunden nicht verfügbar
99.99% - Die Anwendung ist 52 Minuten und 33 Sekunden nicht verfügbar
99.999% - Die Anwendung ist 5 Minuten und 15 Sekunden nicht verfügbar
99.9999% - Die Anwendung ist 31 Sekunden nicht verfügbar

Dabei ist der Maßstab immer das Kalenderjahr!

Aus meiner Sicht sind Zahlen die eine Verfügbarkeit von mehr als 98,5% suggerieren komplett am Thema vorbei, denn wann immer auch ein Hersteller seine Verfügbarkeit als five-nine bezeichnet (99,999% Verfügbarkeit), so kann das immer nur isoliert für sein einzelnes Gerät gemessen sein. Werden also mehrere von diesen Systemen mit anderen Komponenten, Anwendungen Systemen und Verbindungsmitteln zu einer "Anwendung" verschaltet, so ergeben sich auf einmal ganz andere Verfügbarkeiten, da man die Verfügbarkeiten in Relation zueinander setzen muss um eine Verfügbarkeit zu ermitteln.

Microsoft selber gibt für zum Beispiel Exchange 2007 "In the Enterprise" eine Gesamtverfügbarkeit von maximal 98,5% an, gemessen am Client, denn Verfügbarkeit einer Anwendung kann man objektiv nur dann ermitteln, wenn man das Ganze aus Anwendersicht betrachtet, oder eben als Kunde! Denn der Anwender ruft beim Helpdesk an wenn seine Anwendung nicht funktioniert und eben nicht wenn ein SAN Switch ausgefallen ist.

Zusätzlich gebe ich zu bedenken, dass es in etwa zwölf geplante Ausfallzeitfenster im Jahr pro System gibt (Windows, VMware) oder sogar öfter (Linux Distributionen (Ja in Abhängigkeit zu den Paketen; nicht gleich hauen...), Anwendungen). Dann denken wir mal an SAN Systeme, schon mal ein Firmwareupdate auf einer SAN(-Farm) durchgeführt, man wird sehen die erwarteten Ausfallzeiten schmelzen einem dahin wie Eis in der Frühjahrssonne.

Fault Tolerance Checkliste für den Einsatz

Thursday, 11 June 2009 08:10:08 (W. Europe Daylight Time, UTC+02:00)

VMware Fault Tolerance bietet kontinuierliche Verfügbarkeit bei Hardwareausfällen – ohne Datenverlust oder Ausfallzeit für alle Anwendungen. Folgende Punkte müssen erfüllt sein damit eine VM im Fault-Tolerance Modus betrieben werden kann:

Allgemein:

  • Shared Storage (NFS, iSCSI, FC)

ESX Host:

  • Minimal drei ESX 4.0 Server mit gleichen Prozessorfunktionen
  • Der Build-Stand des VMware Kernels muss auf den ESX Servern installiert sein
  • Hyperthreading im BIOS der physischen Server muss deaktiviert sein
  • Eine Netzschnittstelle für FT (aktivierte VMkernel Port Group) muss auf jedem ESX Host konfigueriert sein. Die Bandbreite muss zwei Gigabit-Ethernet betragen!
  • Eine Netzschnittstelle für vMotion (aktivierte VMkernel Port Group) muss vorhanden sein
  • Power Management (Power-Capping) im BIOS der Server sollte deaktiviert sein
  • Hardware Virtualisierung muss im BIOS des ESX Server aktiviert sein

Cluster:

  • Der HA Modus muss aktiviert sein
  • Server Zertifikate müssen verwendet werden
  • Der Anwender, der den FT Modus einstellen will, muss die Berechtigung / Benutzerrolle "Cluster Administrator" konfiguriert haben

VM:

  • Die einzelne VM darf maximal 1 vCPU konfiguriert haben
  • Die Port Group der VM braucht einen Uplink analog zu vMotion
  • Die VMDK Dateien (alle!!!) müssen im Eagerzeroedthick Modus angelegt worden sein
  • Es können keine RDMs im Modus "Physical RDM" genutzt werden
  • Die VM muss nicht ausgeschaltet sein, wenn man den FT-Modus aktivieren möchte
Beim Anlegen einer VM über den vSphere Client wird direkt abgefragt, ob die VM im Kompatibilitätsmodus für FT erstellt werden soll. Diese Option verhindert allerdings, dass die Option Thin Provisioned genutzt werden kann. Ist man sich nicht hundertprozent sicher, ob man die neue VM im FT Modus nutzen möchte, so sollte man den FT Kompatibilitätsmodus immer auswählen. Dabei sollte man immer bedenken, dass es neben FT und geclusterten VMs auch die Option zur redundanten Vorhaltung von Diensten und Anwendungen gibt, der die Hostkonfiguration erheblich erleichtert, denn realistisch betrachtet bindet man mit FT immer gleich zwei Hosts! Wichtig ist, dass FT eine Clusterfunktion ist und so nicht über Clustergrenzen funktioniert. Ferner ist ein Spiegeln von VMs über eine Weitverkehrsstrecke weder von VMware unterstützt noch ratsam.