La panne qui a débuté tôt lundi matin chez Amazon Web Services (AWS) a massivement affecté les sites et services internet mondiaux, apparaissant comme la plus perturbatrice depuis la panne géante de Crowdstrike l’an dernier. L’incident est survenu dans la région US-EAST-1 en Virginie du Nord et bien que localisé a entrainé des conséquences en cascade.

Le site Downdetector a rapporté à CNN avoir reçu 6,5 millions de signalements mondiaux sur la panne dont 1,4 million aux Etats-Unis, 800.000 au Royaume-Uni et 350.000 en France.

La panne a touché des compagnie aériennes (United, Delta), des banques (Halifax, Lloyds et Bank of Scotland), la plateforme d’échange de cryptomonnaies Coinbase, la société d’IA Perplexity, des réseaux sociaux (Snapchat, Facebook) sans oublier Amazon.com et de nombreux services comme Slack, Zoom, Alexa, Duolingo, Flickr et tant d’autres.

La source de la panne est liée un problème avec le système de noms de domaine (DNS). Ce dernier a empêché les applications de trouver l’adresse correcte pour l’API DynamoDB, un service de base de données indispensable au fonctionnement de nombreux sites.

Une fois la cause identifiée, les équipes d’AWS ont dû intervenir tout au long de la journée sur plus d’une centaine de services internes impactés. La défaillance d’un sous-système chargé de surveiller l’état des équilibreurs de charge réseau a notamment contraint l’hyperscaler à limiter les demandes de de nouvelles instances EC2 afin de faciliter la reprise.

24h après le début de la panne, un retour à la normal s’esquissait mais les équipes continuaient de travailler sur la résolution des derniers problèmes. AWS communiquera ultérieurement un bilan plus détaillé sur son enquête. L’impact financier devrait lui se compter en milliards de dollars selon de premières estimations d’experts.

Cette panne vient rappeler une nouvelle fois la vulnérabilité des systèmes interconnectés à l’échelle mondiale et l’impact d’une défaillance dans une infrastructure aussi centrale qu’AWS.