Explications sur la panne prolongée
Bonjour tout le monde!
Nous avons vécu une panne prolongée, du 18 au 20 juillet dernier, dont la source était un entretien par Hydro-Québec du réseau électrique. Hydro-Québec a coupé l'électricité pendant environ 3 heures, ce qui était trop long pour mes UPS. Malheureusement, celui des serveurs n'est pas revenu en ligne de lui-même.
J'ai demandé à un ami habitant la même ville de venir les allumer, mais d'autres pépins ont été découverts. Continuez la lecture pour plus de détails.
Problème 1 : Courriels en panne
Cause :
La configuration de mon commutateur Cisco SG200 causait problème avec la configuration de mes serveurs de virtualisation. À chaque fois que ce commutateur était éteint et rallumé, un réseau virtuel (VLAN) était perdu dans une partie de la configuration. Ce réseau est celui des serveurs internes, servant à l'authentification entre autre pour les serveurs de courrier électronique.
Solution :
J'ai trouvé une autre façon de faire cette configuration. Je l'ai testée plusieurs fois hier soir pour arriver à une configuration fonctionnel au démarrage du commutateur. Ce problème devrait donc être définitivement résolu.
Problème 2 : Site web en panne
Cause :
Un fichier journal de la base de données du site web s'est corrompu sur le serveur Web1. Le serveur Web2 a démarré dans un état incomplet à cause d'un problème de synchronicité. Le site web a donc été hors ligne, alors que les serveurs étaient opérationnels.
Solution :
J'ai restauré les bases de données de Web2 sur Web1, ramenant un état fonctionnel. J'ai aussi modifié l'ordre de démarrage des machines virtuelles, en espérant régler le problème de synchronicité.
Conclusion :
Les tests d'extinction complète sont, par nature, des tests qui sont rarement faits. Cette fois-ci, nous avons définitivement échoué ce test. J'ai aussi tenté de modifier la configuration de l'UPS pour qu'il mette plus de temps à s'éteindre, ce qui devrait permettre aux machines virtuelles une extinction correcte.
En espérant que ces problèmes ne se présentent pas la prochaine fois!