Microsoft a identifié plus précisément dans un rapport préliminaire les raisons de la panne qui le 25 janvier a affecté plusieurs de ses services Azure pendant plus de 5 heures au niveau mondial. Comme la firme de Redmond en avait avancé l’hypothèse, c’est bien une mise à jour WAN sur un routeur qui est la source de la panne.

« Dans le cadre d’un changement prévu pour mettre à jour l’adresse IP sur un routeur WAN, une commande donnée au routeur l’a amené à envoyer des messages à tous les autres routeurs du WAN, ce qui les a tous amenés à recalculer leur contiguïté et à transférer les tables. Au cours de ce processus de recalcul, les routeurs n’ont pas été en mesure de transférer correctement les paquets qui les traversaient », explique l‘éditeur.

Le problème a eu un impact sur le service par vagues, se traduisant pour les clients par des problèmes de connectivité réseau lorsqu’ils tentaient de se connecter aux ressources hébergées dans les régions Azure, ainsi qu’à d’autres services Microsoft, notamment Microsoft 365 et Power Platform. L’incident a même affecté les services cloud Azure Government qui dépendaient du cloud public Azure.

Microsoft a commencé à enquêter sur la panne à 7h05 UTC et constatait à 8h10 UTC que le réseau commençait à se rétablir de lui-même. Mais ce sont alors les systèmes automatisés responsables du maintien de la santé du réseau WAN qui se sont alors mis en pause, du fait de l’impact de la panne sur le réseau. D’où de nouveaux problèmes réseaux (pertes de paquets) qui ont eu lieu à partir de 9h35 UTC et ce jusqu’à ce que ces systèmes soient redémarrés manuellement. Ce n’est finalement qu’à 12h43 UTC que le WAN a retrouvé un fonctionnement normal.

Suite à cet incident Microsoft a déclaré bloquer désormais l’exécution automatique de commandes à fort impact. Toutes les commandes devront par ailleurs suivre les directives pour des modifications de configurations sûres, ce qui de toute évidence n’a pas été le cas pour ce routeur WAN. Un rapport final d’enquête doit être mis en ligne dans les prochains jours.