Serveur NUT (UPS)
Mise en place d’un mécanisme d’arrêt propre des VMs vSphere lors d’une coupure électrique critique.
Contexte & objectifs
- Éviter les arrêts brutaux et les corruptions de données en cas de perte secteur.
- Superviser l’état de l’onduleur (charge, autonomie, événements) en continu.
- Déclencher un arrêt ordonné des VMs selon des règles de criticité.
- Valider le dispositif par des tests de coupure et de reprise.
Architecture retenue
- Serveur Linux avec NUT et passthrough USB de l’UPS depuis ESXi.
- Script Bash déclenché sur condition critique (OB + LB) avec verrouillage.
- Pilotage de vSphere via l’API govc pour cibler les VMs par tags.
- Ordre d’arrêt maîtrisé : services applicatifs puis composants d’infrastructure.
Réalisation technique
Orchestration
Script avec modes TEST/PROD, logs détaillés et prévention des doubles exécutions.
Intégration vSphere
Appels API govc avec compte de service et filtrage dynamique des VMs par balises.
Supervision & sauvegarde
Zabbix + Grafana pour UPS/NUT, sauvegarde des configs et scripts via rsync vers TrueNAS.
Illustrations
Serveur NUT
Scripts d’orchestration
Tests de coupure
Balises vCenter
Résultats
- Arrêt conditionnel fiable et ordonné des VMs en situation critique.
- Réduction du risque de corruption et meilleure continuité de service.
- Processus reproductible, journalisé et facilement auditable.