Databricks annonce avoir finalisé un accord pour acquérir MosaicML pour 1,3 milliard de dollars. Fondée en 2020 à San Francisco, la startup d’IA a levé 64 millions depuis sa création portant sa valorisation à environ 220 M$ selon Tech Crunch.  Avec l’effervescence autour de l’IA générative, le spécialiste des lacs de données accepte de payer un prix plus de six fois supérieur pour s’offrir son expertise dans l’entrainement et le déploiement des grands modèles de langage (LLM).

Pour Databricks, l’objectif est de proposer aux entreprises une plateforme unifiée pour gérer leurs actifs de données et créer des modèles d’IA génératifs sécurisés.

« Databricks et MosaicML ont une opportunité incroyable de démocratiser l’IA et de faire de Lakehouse le meilleur endroit pour développer une IA générative et des LLM », commente dans un communiqué Ali Ghodsi, le PDG de Databricks.

Databricks avait déjà ouvert la voie en développant son LMM open source Dolly. MosaicML va lui permettre d’accélérer et d’enrichir son offre, en apportant notamment ses deux modèles phares, MPT-7B et  MPT-30B, également open source et déjà téléchargés plus de 3,3 millions de fois.

Avec un nombre de paramètres relativement limités (respectivement 7 et 30 milliards), ils sont conçus pour que les entreprises puissent former leurs modèles plus rapidement et avec une consommation de ressources moins exigeante. MPT-30B serait toutefois capable de surpasser GPT-3 malgré son nombre bien plus élevé de paramètres (175 milliards). L’accent est mis surtout sur le contrôle accru qu’auront les entreprises sur la manière dont leurs données sont utilisées.

Après la finalisation de la transaction, l’ensemble de l’équipe de MosaicML rejoindra Databricks. « La plate-forme de MosaicML sera prise en charge, mise à l’échelle et intégrée au fil du temps pour offrir aux clients une plate-forme unifiée transparente où ils pourront créer, posséder et sécuriser leurs modèles d’IA génératifs », ajoute le communiqué.

MosaicML est la sixième acquisition de Databricks depuis sa création et la seconde en 2023. En mai dernier, il avait déjà investi dans l’IA avec Okera. L’entreprise fournit une plateforme de gouvernance des données qui utilise l’IA pour classifier automatiquement les données sensibles.

Databricks a levé 3,5 Md$ en 12 cycle de financement, le dernier de 1,6 Md$ en 2021 portant sa valorisation à 38 Md$. L’entreprise a indiqué avoir franchi le milliard de dollars de chiffres sur son dernier exercice clos fin janvier, en hausse de plus de 60% par rapport à l’exercice précédent.