IBM va se concentrer sur des modèles d’intelligence artificielle (IA) plus petits, intégrés à des capacités de réseau en périphérie, annonce son PDG Arvind Krishna (cf. photo). A l’occasion de la conférence annuelle Think à Boston la semaine dernière, il a déclaré vouloir ainsi diminuer les taux d’erreur et les coûts tout en améliorant la vitesse et la sécurité.

« Les petits modèles sont incroyablement précis », affirme Arvind Krishna. « Ils sont plus rapides et jusqu’à 30 fois moins coûteux. Vous pouvez les utiliser là où vous le souhaitez ». A titre d’exemple, les modèles d’IA ouverts de la gamme Granite d’IBM comprennent entre 3 et 20 milliards de paramètres. Par comparaison, GPT-4 comporte plus de 1.000 milliards de paramètres.

« L’ère de l’expérimentation de l’IA est révolue », a ajouté Arvind Krishna. « Avec WatsonX Orchestrate, vous pouvez créer votre propre agent en moins de cinq minutes », assure-t-il. Le géant d’Armonk penche donc nettement en faveur de l’IA agentique. Les derniers modèles Granite 3.0 sont intégrés dans la plateforme WatsonX d’IBM et l’outil WatsonX Orchestrate est livré avec 150 modèles d’IA préconstruits.

Pour rappel, un agent IA est un programme logiciel capable d’agir de manière autonome pour planifier et exécuter des tâches. Les agents IA sont alimentés par des grands modèles de langage (LLM) et peuvent s’interfacer avec des outils, d’autres modèles et d’autres aspects d’un système ou d’un réseau, en fonction des objectifs à atteindre.