IBM s’engage dans le développement de grands modèles de langage (LLM) open source, avec la volonté de démocratiser leur accès pour les développeurs et de simplifier leur travail de codage. Le géant informatique a publié en open source une partie de sa famille de modèles de code IBM Granite. Ces modèles seront maintenus avec InstructLab, une nouvelle plateforme conçue pour faire évoluer les LMM en intégrant les apports de la communauté.

Les modèles Granite sont optimisés pour différentes tâches de codage comme la génération, la correction et l’explication de code. Ils ont été formés avec du code écrit dans 116 langages de programmation et sont déclinés en 4 variantes de 3 à 34 milliards de paramètres (3b, 8b, 20b et 34b). Selon IBM, leur évaluation sur un ensemble complet de tâches a montré qu’ils correspondent systématiquement à l’état de l’art parmi les LLM de code open-source actuellement disponibles.

Les modèles de code Granite ont été introduits en septembre 2023 mais étaient disponibles uniquement pour les abonnés de la plateforme d’IA d’entreprise IBM Watsonx. Désormais publiés sous la licence Apache 2.0, ils sont accessibles sur Hugging Face, GitHub, Watsonx et Red Hat Enterprise Linux AI (RHEL AI).

Créé par IBM et Red Hat, InstructLab est un projet open source qui vise à fournir un espace indépendant du modèle et ouvrir la porte à la contribution d’experts non techniques. Il est basé sur la méthodologie d’alignement à grande échelle pour les chatBots (Lab).

« InstructLab peut fournir des compétences et des connaissances supplémentaires pour affiner le LLM de votre choix. Cet « arbre de compétences et de connaissances » s’améliore continuellement grâce aux contributions de la communauté et peut être appliqué pour soutenir la construction régulière d’un LLM amélioré », détaille IBM.

En plus d’une version améliorée de Granite, InstructLab propose deux autres modèles : Labradorite, dérivé de Llama 2, et Merlinite, dérivé de Mistral. Les outils d’alignement de modèles InstructLab peuvent également être utilisés par les entreprises pour former leurs propres LLM privés avec leurs propres compétences et connaissances.

En mettant à disposition de la communauté open-source ses modèles et l’infrastructure nécessaire à leur évolution, IBM espère abaisser la barrière à l’entrée pour les développeurs intéressés par l’utilisation des LLM.

« Nous transformons le paysage de l’IA générative pour les logiciels en publiant les LLM de code les plus performants et les plus rentables, permettant ainsi à la communauté ouverte d’innover dans de nombreux cas d’utilisation », déclare Ruchir Puri, scientifique en chef chez IBM Research.

Red Hat Enterprise Linux AI (RHEL AI) rassemble la solution complète pour les entreprises, avec une image RHEL optimisée et amorçable pour les déploiements de serveurs individuels dans le cloud hybride.

« RHEL AI et InstructLab, combinés à la famille de modèles open source Granite d’IBM, offriront une nouvelle valeur et un nouveau choix aux clients qui cherchent à créer des modèles adaptés à leurs besoins, qui répondent à leurs cas d’utilisation avec leurs propres données, tout en minimisant les coûts dans un environnement de cloud hybride diversifié », commente Darío Gil, directeur d’IBM Research.