Dimanche, les Etats-Unis et certaines autres régions du monde ont subi pendant plus de quatre heures des ralentissements, voire des interruptions, des services Google (Google Cloud Platform, YouTube, Gmail, Google Drive) ainsi que d’autres services comme Uber, Buffer ou Snapchat qui s’appuient sur les technologies du géant de Mountain View. La panne, qui a semble-t-il impacté en partie la France dimanche soir, est due selon le vice-président en charge de la division 24×7, Benjamin Treynor Sloss, à une erreur de configuration de certains serveurs, provoquant une réduction de la bande passante. « La principale cause de la perturbation de dimanche était un changement de configuration destiné à un petit nombre de serveurs dans une même région. La configuration a été appliquée de manière incorrecte à un plus grand nombre de serveurs dans plusieurs régions voisines, ce qui a obligé ces régions à utiliser plus de la moitié de leur capacité réseau disponible », explique-t-il. « Le trafic réseau en provenance ou à destination de ces régions a ensuite tenté sans succès de s’intégrer à la capacité restante du réseau. Le réseau s’est encombré et nos systèmes de réseau ont correctement trié la surcharge de trafic et laissé tomber un trafic plus important mais moins sensible au temps de latence afin de préserver des flux de trafic plus sensibles au temps de latence, de la même manière que les colis urgents peuvent être acheminés à vélo même dans les pires embouteillages. »
Les ingénieurs de Google ont rapidement identifié la cause de l’encombrement du réseau, mais celui-ci a également ralenti leur capacité à restaurer les configurations appropriées, prolongeant ainsi la panne.
Globalement, Google a constaté une baisse de 2,5% du nombre d’accès à Youtube, Google Cloud Storage enregistrant de son côté une réduction de 30% du trafic. Enfin, environ 1% des utilisateurs Gmail actifs ont connu des problèmes avec leur compte.
Cette panne en dit long sur la dépendance de nombreuses entreprises à un seul fournisseur d’hébergement. « Cela nous motive à apprendre le plus possible et à rendre les services de Google encore meilleurs, encore plus rapides et encore plus fiables », promet Benjamin Treynor Sloss.