Un incident dans un centre de données à Boston a mis à l’arrêt une partie des serveurs hébergeant l’ERP cloud Netsuite d’Oracle. La panne a été signalée par Oracle mardi 14 février à 18h13 CET et sa résolution a été annoncée le lendemain à 17h34 CET. L’incident n’a pas impacté les centres de données des six autres régions cloud d’Oracle aux États-Unis. Mais il a privé d’accès des clients américains dans plus d’une dizaine d’états selon les témoignages partagés sur Reddit.

Oracle a été peu disert sur les causes de l’incident. « À 12 h 13 (heure de la cote Est), un événement s’est produit aux États-Unis à Boston, ce qui a forcé l’équipe locale à couper l’alimentation jusqu’à ce que le problème soit résolu. Cela a eu un impact sur le service pour ces clients. L’équipe locale du centre de données et les ingénieurs NetSuite continuent de travailler à la restauration du service », s’est-il contenté d’indiquer dans un message mis en ligne mercredi à 1h11 CET.

Selon des informations recueillies par nos confrères de The Register, il résulte d’une alerte incendie. « Hier, vers midi, de la fumée a été signalée à l’intérieur de l’un de nos deux centres de données à Waltham, dans le Massachusetts, provenant d’équipements électriques dans la salle d’alimentation. Les responsables du service d’incendie qui sont intervenus ont imposé une coupure de courant sur le site et évacué le bâtiment pour assurer la sécurité de tous », a expliqué un porte parole de Cyxtera, le gestionnaire des espaces de co-location du centre de données de Boston.

Alors que la panne se prolongeait, Oracle a indiqué à 2h24 CET qu’il commençait à faire basculer certains comptes sur un site de reprise après sinistre. Selon des témoignages de clients, une partie des données pourrait avoir été perdue dans l’opération sur une période de temps de 30 minutes correspondant au dernier point de restauration. Oracle travaillerait avec les clients concernés pour éluder ce point. Quoi qu’il en soit, la durée de la panne pour une application aussi critique qu’un ERP met à mal le discours du géant du cloud sur la fiabilité de son infrastructure.

La dernière panne importante du cloud d’Oracle remonte à l’été dernier quand des températures caniculaires l’avaient contraint à mettre en pause ses services au Royaume-Uni. Malgré ces incidents, la page de Netsuite fait état d’une disponibilité moyenne de 99,96% sur les douze derniers mois. Elle était de 99,97% avant la panne.