
Haute Disponibilité (HA) : architectures et bonnes pratiques 2025
La règle des 9 (SLA)
La haute disponibilité se mesure en temps d'arrêt tolérable. 99.9% = 8h d'arrêt/an. 99.99% = 52 min/an. Chaque "9" supplémentaire coûte exponentiellement plus cher.
Identifier les SPOF
Un Single Point of Failure est un élément dont la panne arrête tout le système. Exemple classique : vous avez 2 serveurs en cluster, mais ils sont branchés sur le même switch ou le même onduleur. Si le switch lâche, le cluster ne sert à rien.
Architectures HA courantes en PME
1. Virtualisation (Cluster à 2 ou 3 nœuds) : Si un serveur physique tombe, les VM redémarrent automatiquement sur l'autre (HA VMware/Proxmox). Nécessite un stockage partagé (SAN/NAS) qui devient lui-même un SPOF s'il n'est pas redondé.
2. Réseau (Stacking et LACP) : Utiliser deux switchs en "stack" (vus comme un seul). Relier les serveurs avec 2 câbles (LACP), un vers chaque switch. Si un câble ou un switch casse, le lien tient.
3. Firewall (Actif/Passif) : Deux firewalls. Le premier gère le trafic. S'il ne répond plus (heartbeat perdu), le second prend le relais instantanément et récupère l'adresse IP virtuelle (VIP).
Le facteur humain
Attention : 60% des pannes sont dues à des erreurs humaines ou des mises à jour ratées. La redondance matérielle ne protège pas contre une mauvaise configuration poussée sur les deux équipements simultanément.