Depuis le 5 avril, une partie des services cloud d’Atlassian sont perturbés ou suspendus. L’éditeur d’outils de développement et collaboratifs a expliqué la panne par une opération de maintenance qui a mal tournée : « Lors de l’exécution d’un script de maintenance, un petit nombre de sites ont été désactivés involontairement. Nous sommes désolés pour la frustration causée par cet incident et nous continuons à passer par les différentes étapes de restauration ». L’incident avait démarré à un bien mauvais moment alors qu’Atlassian organisait son événement Team’22 à Las Vegas. L’éditeur espérait alors une résolution rapide du problème.

Une semaine après la situation ne s’est guère arrangée. La page d’état des services signale encore une longue liste de services affectés : Jira Software, Jira Work Management et Jira Service Management (suivi du développement et des problèmes logiciels), Confluence (wiki d’entreprise), Opsgenie Cloud (service d’alerte), Statuspage (communication des incidents) et Atlassian Access (gestion des accès).

Plus grave, Atlassian a indiqué à nos confrères de The Register que le script erroné avait supprimé des données ou des sites chez environ 400 clients. L’éditeur s’efforce de restaurer l’ensemble à partir de sauvegardes mais l’opération prend du temps. Elle pourrait nécessiter encore deux semaines supplémentaires selon l’éditeur.

Dans un message d’information Atlassian détaille :

« Un petit nombre de clients Atlassian continuent de subir des interruptions de service et ne peuvent pas accéder à leurs sites. Nos équipes mondiales d’ingénieurs travaillent 24h/24 et 7j/7 pour progresser sur la résolution de cet incident. À l’heure actuelle, nous avons reconstruit les fonctionnalités de plus de 35% des utilisateurs touchés par la panne de service, sans aucune perte de données signalée. L’étape de reconstruction est particulièrement complexe en raison de plusieurs étapes nécessaires pour valider les sites et vérifier les données. Ces étapes nécessitent plus de temps, mais sont essentielles pour assurer l’intégrité des sites reconstruits. Nous nous excusons pour la durée et la gravité de cet incident et avons pris des mesures pour éviter qu’il ne se reproduise à l’avenir ».

Même si Atlassian parvient à tout remettre en ordre, l’affaire laissera des traces et devrait alimenter le débat sur les risques inhérents à la migration de toutes les données dans le cloud. A plus forte raison chez Atlassian, qui a mis fin à ses ventes de licences de serveur en 2021 et programmé la fin du support en 2024, pour inciter tous ses clients à passer à ses offres cloud.