Pas de trêve estivale pour OpenAI. Le 5 août, la startup a dévoilé gpt-oss-120b et gpt-oss-20b, deux modèles de raisonnement « open weight » marquant son retour sur le terrain des modèles ouverts. Une annonce importante mais vite éclipsée par le lancement le 7 août de GPT-5, la dernière version tant attendue de son modèle de fondation. Son prédécesseur GPT-4 avait vu le jour en en mars 2023.

Comparé à ce dernier, GPT-5 ne représente pas un bond technologique. OpenAI a toutefois capitalisé sur les progrès engrangés ces dernières années en matière de raisonnement, de multimodalité et de sécurité pour améliorer son modèle phare sur tous les plans. Sans surprise, la startup présente GPT-5 comme son « modèle le plus intelligent, le plus rapide et le plus utile à ce jour ».

Un autre tournant plus fondamental est l’évolution vers un système unifié. Les utilisateurs n’ont plus désormais à faire un choix parmi une longue liste de modèles. GPT-5 devient le modèle par défaut et vient remplacer tous les précédents. C’est la plateforme d’OpenAI qui se charge de diriger automatiquement les requêtes vers le bon sous-modèle.

« GPT-5 est un système unifié comprenant un modèle intelligent et efficace qui répond à la plupart des questions, un modèle de raisonnement approfondi (GPT-5 thinking) pour les problèmes plus complexes, et un routeur en temps réel qui décide rapidement lequel utiliser en fonction du type de conversation, de la complexité, des besoins en outils et de votre intention explicite », détaille l’entreprise.

GPT-5 est rendu immédiatement accessible pour les utilisateurs Plus, Pro, Team et Free. Les offres Enterprise et Edu suivront prochainement. Les utilisateurs gratuits ont accès pour la première fois à un modèle à raisonnement. Ils seront toutefois limités à 10 messages toutes les 5 heures, avant de basculer sur un sous-modèle plus léger (mini). Les abonnés Plus bénéficient d’une utilisation plus étendue, tandis que les abonnés Pro ont accès à GPT‑5 Pro, une version avec raisonnement étendu.

GPT‑5 est également accessible via la plateforme API pour les développeurs. Il est décliné en trois versions, toutes avec des capacités de raisonnement mais de différentes tailles : gpt-5, gpt-5-mini, et gpt-5-nano.

C’est là encore le modèle plus performant d’OpenAI pour le codage et les tâches agentiques, avec un score de 74,9 % sur SWE-bench Verified et de 88 % sur Aider Polyglot. Il est optimisé pour la génération de front-end complexes, la modification de code et le débogage de dépôts volumineux.  Même des non-développeurs pourront l’utiliser pour créer de petites applications ou sites fonctionnels à partir d’une simple invite.

GPT-5 gagne aussi du terrain en matière de précision. Avec la recherche Web activée, il est environ 45 % moins susceptibles de fournir une erreur factuelle que GPT‑4o. GPT-5 Thinking est pour sa part nettement moins sujet aux hallucinations avec un taux autour de 1% contre 6% pour le précédent modèle à raisonnement 03.

OpenAI promet également des avancées sensibles dans les trois principaux cas d’utilisation de ChatGPT que sont l’écriture, le code et les requêtes liées à la santé.

Au niveau tarifaire via l’API, les prix sont de 1,25 dollar par million de tokens en entrée et 10 dollars par million en sortie pour GPT-5. Ils sont en baisse par rapport à GPT-4 et équivalent à ceux facturés par Google Gemini 2.5 Pro. Anthropic, de plus en plus prisé dans les entreprises, facture bien davantage avec des tarifs de 15 dollars en entrée et 75 dollars en sortie pour son modèle le plus performant Claude Opus 4.1.