Près de 15 heures, c’est le temps qu’il aura fallu à Amazon pour réparer la panne gante qui a affecté le service de stockage S3 dans l’Est des Etats-Unis mardi dernier. En cause :  les défaillances de certains datacenters d’Amazon en Virginie. Résultat : de nombreux sites web (certains confrères parlent d’une centaine de milliers en tout) ont été soit paralysés, soit fortement ralentis. Dans la liste figurent notamment Adobe, Airbnb, Autodesk, Citrix, Docker, Expedia, Fabric (Google), Lonely Planet, HockeyApp (Microsoft) MIT Technology Review, Pinterest, Razer, Signal, la SEC (le gendarme de la bourse), Time, The Verge, sans oublier de nombreux autres services d’Amazon (43 en tout dont CloudWatch, EC2, Elastic File System, Redshift, RDS…).

Les premiers problèmes sont apparus vers 7h30 du matin, heure du Pacifique (le siège d’Amazon se situe dans ce fuseau horaire), explique VentureBeat, qui raconte le déroulement exact de la journée.

A 10h30, le géant de Seattle publiait un premier message sur sa page Status. « Nous avons identifié le problème générant un taux élevé d’erreurs affectant S3 dans (la zone) US-East 1, qui impacte également des applications et des services dépendants de S3. Nous travaillons activement afin de résoudre le problème », pouvait-on lire.

A 14h08, Amazon indiquait que S3 était opérationnel, ce qui n’était pas encore le cas de tous les autres services d’AWS. A 18h30, la page Status annonçait que tous les services étaient désormais opérationnels à l’exception toutefois de CloudTrail, Config et Lambda. A 22h16, soit près de 15 heures après le début de la panne, un dernier message indiquait que tout était rentré dans l’ordre.

En septembre 2015, une première panne attribuée à un logiciel défaillant avait déjà affecté pendant 5 heures les datacenters de la zone US-East 1 d’Amazon, interrompant l’accès à de nombreux sites web. Comme il s’agissait d’un dimanche, l’impact avait été moins catastrophique.