On connait le marché du HPC (High Performance Computing) caractérisé par des supercalculateurs très puissants. Voici venu le temps du marché hyperscale qui caractérise les ressources utilisées dans les data centers des géants du Web.

Entre les data centers de Google ou d’Amazon et ceux d’une entreprise traditionnelle, il y a sans doute autant de différence qu’entre une Formule 1 et une berline classique. Les dix plus importants géants du Web dépensent globalement environ 20 milliards de dollars par an en infrastructure IT. C’est évidemment considérable. C’est en 2007 que le cabinet INtersect360 Research a identifié ce nouveau segment en le baptisant d’ « Ultrascale Internet » pour le renommer ensuite de High Performance Busines Computing, un segment du HPC pour les applications non scientifiques.

Quelque dix ans plus tard, le même cabinet d’études redéfinit complètement cette approche dans son rapport « The Hyperscale Market : Definition, Scope and Market Dynamics ».

Une des caractéristiques majeures de ces architectures hyperscale est qu’elles concernent des applications Web capable de répondre à l’évolution aléatoire et rapide d’Internet. Ces infrastructures doivent gérer des processus commerciaux basés sur l’accès, le traitement et la diffusion de données disponibles sur Internet. Parmi les tâches qui entrent dans cette catégorie on peut citer la recherche sur Internet, le commerce en ligne, la gestion de contenu et les réseaux sociaux, les services de communication, les services cloud, l’intelligence artificielle et les jeux en ligne.

De fait les architectures hyperscales partagent beaucoup avec le HPC. Parmi celles-ci :

– Haut niveau de performance et scalabilité : les deux types d’applications sont conduits par le besoin d’avoir accès à des niveaux de performance élevé aux évolutions imprévisibles.
– Les architectures pour l’hyperscale et le HPC sont différentes de celles conçues pour l’IT traditionnelle avec deux caractéristiques majeures : la fiabilité et la reproductibilité des résultats.
– Large utilisation des logiciels open source dont la maintenance et le support nécessaires sont amortis sur des coûts importants en matériel ;
– Les entreprises de l’hyperscale sont les géants du Web et du commerce en ligne alors que les utilisateurs du HPC sont les labos de recherche nationaux ou des grandes entreprises.
– L’innovation provient le plus souvent de ces quelques grands acteurs.

A l’inverse, les architectures présentent des spécificités qui les distinguent des architectures HPC :

– Des performances spécialisées : les supercalculateurs HPC mettent toute leur puissance au traitement d’une tâche particulière avec comme objectif de réduire les temps de calcul. Les infrastructures hyperscale doivent supporter de très nombreuses tâches indépendantes avec comme objectif de collecter, traiter et diffusion une information à travers Internet ;
– Type d’applications : alors que les premières visent à fournir un résultat, les architectures hyperscale tournent en permanence pour traiter des flots permanents de données ;
– Dépendance de l’Internet : les résultats des traitements effectués par les architectures hyperscale dépendent de la connectivité Internet, dans les deux sens.
– Architecture des microprocesseurs : les supercalculateurs utilisent principalement des processeurs haut de gamme pour assurer un maximum de performances de process mono thread ; De leur côté, les applications hyperscale peuvent être décomposées en de nombreuses micro-tâches qui  peuvent être prises en charge par des infrastructures distribuées.
– Différences de prix : alors que les coûts des supercalculateurs HPC se mesurent en centaines de millions de dollars, les architectures hyperscale sont de l’ordre du milliard de dollars.

Parmi les domaines de recherche et de développement les plus actif dans l’hyperscale, on trouve l’intelligence artificielle. Google (dont le programme AlphaGo a récemment battu le champion du monde du jeu de Go : Jeu de Go : AlphaGo : 4, Lee Sedol : 1), Facebook, Microsoft, Amazon, Baidu et IBM (dont le système Watson a battu les champions du jeu Jeopardy : Elémentaire mon cher Watson !) avec des applications de type reconnaissance de formes, d’images, de la parole… et à terme des aides au diagnostic médical ou les véhicules autonomes.

Egalement sur InformatiqueNews :

Cloudera et Microsoft partenaires pour simplifier l’utilisation de Spark

MapR lance une distribution Spark

Orange inaugure un campus dédié à l’innovation