Le marché du cloud public a poursuivi sa solide progression au premier trimestre 2025. Selon Canalys, les dépenses mondiales en services d’infrastructure ont progressé de 21% en glissement annuel pour atteindre 90,9 milliards de dollars. Le marché profite de l’essor de l’IA générative avec toutefois une inquiétude croissante des clients concernant les coûts de l’inférence.
« Alors que l’IA passe de la recherche à un déploiement à grande échelle, les entreprises se concentrent de plus en plus sur la rentabilité de l’inférence, en comparant les modèles, les plateformes cloud et les architectures matérielles telles que les GPU et les accélérateurs personnalisés », relève Rachel Brindley, directrice principale chez Canalys. « Contrairement à la formation, qui représente un investissement ponctuel, l’inférence représente un coût opérationnel récurrent, ce qui en fait un obstacle majeur à la commercialisation de l’IA », ajoute-t-elle.
Yi Zhang, analyste chez Canalys, rappelle que de nombreux services d’IA suivent des modèles de tarification à l’usage, facturés par jeton ou par appel d’API. Ce qui complique la prévision des coûts à mesure que l’utilisation des services augmente.
« Lorsque les coûts d’inférence sont volatils ou excessivement élevés, les entreprises sont contraintes de restreindre l’utilisation, de réduire la complexité des modèles ou de limiter le déploiement à des scénarios à forte valeur ajoutée. Par conséquent, le potentiel global de l’IA reste sous-exploité », explique-t-il.
Face à ce constat, les principaux fournisseurs de cloud continuent d’intensifier leurs efforts d’optimisation de l’infrastructure, notamment par le développement de puces propriétaires, afin de réduire le coût d’utilisation de l’IA. À l’instar d’AWS qui en mars a lancé une stratégie de baisse des prix afin de promouvoir l’adoption de ses puces IA Trainium.
Selon Canalys, les trois principaux fournisseurs de cloud – AWS, Microsoft Azure et Google Cloud – ont collectivement progressé de 24 %, représentant 65 % des dépenses totales contre 66% un an plus tôt. AWS a enregistré une hausse de 17%, freiné selon le cabinet d’études par des contraintes d’offre, alors que ses deux rivaux ont progressé de plus de 30%. Leur classement reste inchangé, AWS s’arrogeant 32% des dépenses, Microsoft Azure 23% et Google Cloud 10%.