Amazon a investi en 2024 près de 8 milliards de dollars dans la startup Anthropic. L’effort ne l’empeche pas néanmoins d’investir également dans sa propre R&D en IA et de développer ses propres IA génératives. AWS a ainsi présenté sa nouvelle famille de modèles multimodaux « Nova » disponibles dès aujourd’hui sur son Cloud.

On s’y attendait, l’édition 2024 du show « AWS Re:Invent » s’annonce riche en annonces, notamment autour de l’IA. L’hyperscaler a prévu 5 keynotes d’annonces en 5 jours de conférence.

Et ça a commencé dès hier soir sur les chapeaux de roue. Avec une première annonce majeure qui marque très ouvertement l’entrée d’Amazon dans la course aux modèles de fondation propriétaires « frontières », un domaine où l’entreprise accusait un certain retard. AWS lance sa famille de modèles génératifs « Nova ».

La famille Nova s’articule autour de quatre modèles de génération de texte et deux modèles génératifs d’images et vidéos. Chacun modèle cherche à répondre à des besoins spécifiques.
Nova Micro se concentre sur les performances en termes de latence pour le traitement textuel, avec une fenêtre de contexte de 128 000 tokens.
Nova Lite propose une approche multimodale économique,
Nova Pro recherche l’équilibre entre précision, vitesse et coût avec une fenêtre de contexte étendue à 300 000 tokens.
Nova Premier, prévu pour début 2025, représentera la version la plus sophistiquée, orientée vers les tâches de raisonnement complexe.
Nova Canvas se concentre sur la génération et l’édition d’images à partir de prompts, permettant un contrôle précis des schémas de couleurs.
Nova Reel innove dans la génération vidéo avec des séquences de 6 secondes, et promet une évolution vers des vidéos de 2 minutes en 2025.

Sur le plan technique, les modèles Nova se distinguent par leur support étendu de plus de 200 langues, avec une optimisation particulière pour 15 langues majeures (dont le Français !).

Des modèles personnalisables aux besoins des entreprises

L’intégration native avec la plateforme AWS Bedrock facilite leur déploiement, tandis que les capacités de fine-tuning (réntraînement partiel du modèle sur les données propres à l’entreprise) et de distillation (qui permet de transférer les connaissances d’un modèle plus grand et plus performant à un modèle plus petit et plus efficace) permettent d’optimiser les performances selon les besoins spécifiques des entreprises.
L’intégration de fonctionnalités RAG (Retrieval Augmented Generation) renforce encore un peu plus la précision des réponses générées pour les entreprises qui sauront les mettre en oeuvre.
Des fonctionnalités de personnalisation avancées qui auraient déjà séduites des partenaires et clients d’AWS tels que SAP, Deloitte, Dentsu Digital Inc., Musixmatch, 123RF, Caylent, Palantir Technologies et Shutterstock, afin d’améliorer leurs services et produits basés sur l’IA.

Amazon a, par ailleurs, accordé une attention particulière aux aspects « sécurité et éthique » en intégrant un système de filigrane pour le contenu visuel généré, des contrôles de modération et des protections contre la désinformation. Des mesures qui répondent aux préoccupations croissantes concernant l’utilisation responsable de l’IA et que les entreprises exigent désormais avant de passer leurs projets IA à l’échelle.

Cette initiative s’inscrit dans une stratégie plus large d’AWS visant à renforcer sa position dans le domaine de l’IA générative. L’entreprise prévoit déjà d’étendre la gamme avec des modèles speech-to-speech et « any-to-any » en 2025.

Pour l’instant, difficile d’évaluer la pertinence de ces nouveaux modèles Nova face à la concurrence d’autant que l’éditeur n’a pas réellement publié de benchmarks (pour autant que ces derniers soient de toutes façons significatifs). Il va falloir les mettre à l’épreuve sur des cas d’usage concrets pour se faire une idée.

Néanmoins, AWS sort un argument choc qui doit faire mouche : l’hyperscaler adopte avec Nova une stratégie de tarification agressive et revendique des coûts inférieurs de 75% aux modèles concurrents comparables.

Une chose est sûre, il va désormais falloir compter sur AWS pour dynamiser encore un peu plus un marché de l’IA assez survolté. Google, Microsoft, OpenAI, Anthropic et Mistral AI sont prévenus !