IBM continue tenacement de jouer sa partition dans le domaine de l’IA générative. Le géant informatique lance la troisième génération de sa famille de modèles Granite et reste fidèle à son approche open source en publiant tous ses nouveaux modèles sous licence permissive Apache 2.0.

Si ses modèles initiaux introduits en 2023, s’échelonnaient jusqu’à des grands modèles à 34 milliards de paramètres (34B), ce renouvellement se concentre sur des modèles plus légers de 1B à 8B. Plutôt que de participer à la course au plus puissant modèle, IBM semble vouloir privilégier des modèles plus efficaces et plus rentables.

Les nouveaux modèles Granite 3.0 8B et 2B sont déclinés en version Base pouvant être personnalisés et en version Instruct, affinés pour le suivi d’instruction et prêts à l’emploi. La famille comprend aussi des modèles efficaces de type MoE (mélange d’experts). Ces modèle 1B et 3B encore plus légers, avec respectivement 400 et 800 millions de paramètres actifs, visent l’équilibre entre performances et coût d’inférence et se destinent en priorité à des systèmes dénués de GPU.

Enfin, IBM introduit un nouveau type de modèles avec les Granite Guardian. Ils sont conçus pour servir de garde-fous lors des déploiements en aidant à filtrer les entrées ou sorties potentiellement nocives. Ils apportent en outre des contrôles spécifiques au modèle RAG pour améliorer la pertinence des résultats. Les Granite Guardian 2B et 8B sont des modèles « compagnons », qui peuvent être utilisés avec les autres modèles Granite ou avec tout modèle d’IA ouvert ou propriétaire.

Les modèles Granite 3.0 ont été entrainé sur 12.000 milliards de tokens sur des données en douze langues et 116 langages de programmation différents. Ils prennent en charge des fenêtres contextuelles de 4.000 tokens mais devant être portées à 128.000 tokens d’ici la fin de l’année et avec l’intégration de capacités multimodales.

La suite complète de modèles est disponible en téléchargement sur la plate-forme open source de HuggingFace et Red Hat Enterprise Linux. Les variantes Instruct et Guardian des modèles Granite 8B et 2B sont également disponibles pour une utilisation commerciale sur la plate-forme Watsonx d’IBM. Une sélection de modèles Granite 3.0 sera accessible sur les plateformes partenaires telles que la pile NIM de Nvidia Corp. et Vertex de Google. Ils sont enfin déjà disponibles pour être exécutés localement sur Ollama et Replicate.