Après avoir poussé l’IA partout dans ses offres, Microsoft en vient à son tour à la conception de puces maison pour faire face à l’explosion de la demande et du coût des infrastructures. A l’occasion de son événement Ignite 2023 à Seattle, le géant informatique a présenté deux nouveaux processeurs visant à optimiser ses infrastructures Azure, en particulier pour les charges de travail liées à l’IA.

La première de ces puces est Azure Maia, la première puce d’accélération IA de Microsoft dédiée à ses centres de données. En technologie 5 nm et comptant 105 milliards de transistors, elle n’a pas la prétention de supplanter les surpuissants GPU de Nvidia mais d’apporter une alternative mieux maitrisée et à moindre coût, pour l’entrainement et l’inférence de grands modèles comme ChatGPT et l’exécution de services d’IA tels que Bing ou GitHub Copilot.

Microsoft affiche aussi sa volonté de maitriser et d’optimiser chaque couche de la pile matérielle. « L’objectif final est un système matériel Azure offrant une flexibilité maximale et pouvant également être optimisé en termes de puissance, de performances, de durabilité ou de coût », commente dans un billet de blog Rani Borkar, vice-président pour les systèmes et infrastructures matériels Azure.

« L’architecture d’IA de bout en bout d’Azure, désormais optimisée jusqu’au silicium avec Maia, ouvre la voie à la formation de modèles plus performants et rend ces modèles moins chers pour nos clients », souligne Sam Altman, PDG d’OpenAI, qui a collaboré étroitement au développement de la nouvelle puce.

En plus de Maia, Microsoft a aussi dévoilé Azure Cobalt, un CPU à architecture Arm conçu pour exécuter des charges de travail de calcul à usage général sur le Cloud Microsoft et dont l’objectif est d’offrir un niveau de performance par watt optimal. Sa première génération, le Cobalt 100, embarque 128 cœurs et Microsoft le présente comme « 40% plus efficient que les actuelles machines ARM d’Azure ». Avec cette seconde puce, Microsoft espère réduire ses coûts internes mais aussi concurrencer frontalement AWS et ses puces Arm Graviton.

Les deux puces commenceront à être déployées au début de l’année 2024 dans les centres de données Azure.