La vision de Michael Olson sur Cloudera et Hadoop…

Cloudera a apporté au marché une solution de Big Data basée sur Hadoop. Basée, car notre distribution est la solution la plus complète construite sur Hadoop et les produits l’entourant. Vous pouvez considérer un tel assemblage comme Linux. Ce que Red Hat produit est un logiciel que vous pouvez installer sur votre ordinateur, basé sur le noyau Linux. Vous pourriez assembler les modules vous-mêmes, mais ce que Linux (au sens kernel.com) est vraiment, est un composant compact qui permet de stocker des fichiers et faire tourner des programmes. Ce que Red Hat a fait est packager toutes les applications et outils, éditeurs de texte et fournit l’infrastructure de support qui rend cette plate-forme utilisable. Red Hat l’a ensuite livré avec un support 24/24 ainsi qu’avec un service de mise à jour. Ce service ressemble à ce que nous faisons pour Hadoop.

Nous pensons que nous avons l’opportunité de remplacer une variété de systèmes de stockage, bases de données, systèmes de gestion de contenus spécifiques, propriétaires et vieillissants par une seule solution cohérente, à même de stocker une grande variété de données et de faire tourner un grand nombre de workload.

Soyons clairs : nous ne pensons pas remplacer les bases de données relationnelles. Les grands datawarehouses font un boulot excellent pour l’OLTP et l’OLAP depuis longtemps. Ces marchés resteront durablement l’apanage des vendeurs qui les dominent. Mais nous avons des clients qui dépensent bien trop d’argent sur certains de leurs workloads. Si par exemple vous avez un grand datawarehouse et que vous utilisez ce système grand et cher pour vos applications d’ETL, vous dépensez sans doute bien trop. Vous pourriez libérer de la capacité analytique sur ce système si vous pouviez transférer les workloads de data processing sur une infrastructure moins coûteuse. Notre plate-forme permet à nos clients de faire exactement cela.

Notre désir est de délivrer une seule et unique plate-forme à même de permettre à nos clients d’ingérer des données depuis n’importe quelle source, de la soumettre à une variété de processus de traitement de données et en plus, de l’analyser avec des outils et algorithmes puissants jusqu’alors inaccessibles. Comme je l’ai dit, nous délivrons une nouvelle plate-forme critique et nous pensons qu’elle deviendra aussi prévalente que les SGBD le sont aujourd’hui. Elle ne remplacera pas les systèmes existants, mais viendra les compléter pour permettre à nos clients d’optimiser leurs déploiements. Ils pourront faire tourner les workloads sur la plate-forme la plus adaptée et au meilleur coût.

Ce que l’on a fait est packager le projet open source avec des outils d’administration et de monitoring. Tout ce que nous savons sur la gestion des clusters Hadoop a été mis dans le logiciel et nous délivrons le tout avec un support 24/7. Nous rendons Hadoop manageable. Notre go-to-market est le même que celui de Sybase, Ingres ou Oracle dans le milieu des années quatre-vingt-dix. Hadoop, comme les bases SGBD à l’époque, est nouveau. Il faut des compétences pointues pour l’opérer et elles sont encore assez rares sur le terrain. Les applications, les outils qui tournent sur Hadoop, sont eux aussi encore rares, mêmes si nous en voyons apparaître de plus en plus.

Comme Oracle, Sybase, IBM ou Microsoft, Cloudera se concentre non pas sur le développement d’applications mais sur la livraison d’une infrastructure fiable, simple à administrer et à exploiter. Nous laissons intentionnellement le marché des applications et des outils à nos partenaires. Notre désir est de créer un écosystème riche de vendeurs qui s’appuient sur notre plate-forme. Si nous y parvenons, chacun de ces outils et applications accélérera l’adoption de notre plate-forme. Cette stratégie devrait nous permettre de nous développer de façon solide à long terme.

Il se pourrait qu’un jour viendra où nous aurons saturé le marché pour les plates-formes Big Data, mais nous avons aujourd’hui un large espace ouvert devant nous pour délivrer cette plate-forme et encourager l’innovation dans l’écosystème. Nous avons aujourd’hui 400 partenaires dans notre programme Connect. Ce sont des éditeurs, des intégrateurs systèmes, ou des constructeurs comme Dell ou HP ainsi que des éditeurs d’outils comme Microstrategy.