Produite par des modèles biface ou serviciels (voir encadré ci-dessous), la donnée est au cœur des priorités stratégiques des entreprises qui peuvent être les pionnières d’une nouvelle économie symétrique, dans laquelle les clients/consommateurs deviendront délibérément co-créateurs de valeur. Telle est une des idées force du rapport L’économie des données personnelles, les enjeux d’un business éthique que vient de publier le Cigref. L’économie des données fait d’ailleurs partie des 9 Solutions industrielles pour 9 marchés prioritaires de la phase 2 de la Nouvelle France Industrielle qui s’est donné des objectifs ambitieux.
L’augmentation exponentielle est désormais identifiée avec des chiffres qui donnent le vertige. Le rapport rappelle que toutes les minutes, l’humanité produit 350 000 Tweets, 15 millions de SMS ; 200 millions de mails ; 250 Go d’informations sont archivés sur Facebook et 1 740 000 Go d’informations sont publiés dans le monde. Tous les jours, Google traite plus de 24 Po de données, soit 24 millions de milliards d’octets. Et les objets qui vont bientôt peupler l’Internet avec des chiffres qui évoluent selon les oracles mais qui se chiffrent en milliards de dollars.
Les modèles d’affaires autour des données personnelles
– Les modèles bifaces : Google et Facebook sont typiquement des entreprises bifaces, c’est-à-dire qu’elles d’une face qui représente une valeur pour l’autre face. »14 Ce modèle économique n’est pas propre au numérique, il existait déjà dans l’économie des médias et dans la banque de détail.
– Les modèles serviciels : les données participent grandement au mouvement de servicialisation, c’est-à-dire le fait de « vendre un produit sous la forme d’un service »15. L’exemple des assurances est instructif : plutôt que de spéculer sur l’accidentologie pour établir leurs tarifs, les sociétés se basent désormais sur l’analyse des usages réels des dispositifs, grâce aux capteurs et objets connectés qui transmettent les données de conduite, de kilométrage etc. Le temps réel est une vraie révolution dans la conduite des business models autour des données.
« On a commencé à ouvrir nos données à partir de 2010, expliquait Barbara Dalibard, Directrice générale voyageurs de la SNCF, aux 2e Rencontres de la DGE qui se sont tenues cette semaine à Paris. On a d’abord ouvert l’information sur les localisations des gares, les itinéraires de train… On a ouvert des API permettant aux développeurs d’accéder aux grilles horaires et de concevoir des services avec nos données. Aujourd’hui on a 1000 comptes utilisateurs qui appellent nos données quotidiennement. La question est de savoir quelles données et jusqu’où aller ? On parle par exemple du temps réel mais construire de telles données nécessite beaucoup d’efforts et a donc un coût sachant qu’une donnée fiable à 100 % dans ces conditions est quasiment impossible ».
Dans cet univers en plein expansion, les données personnelles[1] constituent la matière première essentielle au service du développement de l’économie numérique que les utilisateurs donnent volontiers en échange d’un service.
Les grandes entreprises ont progressivement pris conscience du potentiel de création de valeur que leur apportait l’usage des données ciblées, notamment via les technologies qui sous-tendent le big data, appliquées en particulier à la masse croissante de données qu’elles peuvent mobiliser sur leurs clients, note le rapport. Mais cette valorisation des données est loin d’être réalisée. Selon le rapport « Databerg 2015 » que vient de publier le spécialiste des solutions de sauvegarde et de restauration Veritas Technologies, 57 % des données détenues par les entreprises françaises sont inexploitées.
Le rapport présente un nouveau concept appelé « databerg » (iceberg de données), qui modélise 3 grands types de données stockées par les entreprises aujourd’hui :
– Données actionnables ou données stratégiques de l’entreprise (« clean data ») : il s’agit de données indispensables au bon fonctionnement et à la réussite de l’entreprise.
– Données redondantes, obsolètes, inutiles (en anglais « ROT », Redundant, Obsolete, Trivial): il s’agit de données identifiées comme redondantes, obsolètes ou personnelles, qu’il est nécessaire de limiter au maximum en amont et de supprimer régulièrement.
– Données obscures (« dark data ») : il s’agit de données dont la pertinence n’a pas été identifiée. On y retrouve des données stratégiques, des données redondantes, obsolètes, inutiles et surtout des données illégales ou non-conformes, représentant une source de risque au cœur même des réseaux informatiques.
L’entreprise française typique possède 57 % de données obscures (moyenne EMEA de 54 %), 21 % de données ROT (moyenne EMEA de 32 %) et 22 % de données stratégiques identifiables. D’où l’importance pour les entreprises de trier le bon grain de l’ivraie avant d’opérer des traitements sur la première catégorie des données stratégiques.
Les objectifs de l’économie des données du Plan Nouvelle France industrielle
– Maîtriser les technologies critiques permettant d’exploiter les prochaines générations de supercalculateurs atteignant la puissance dite « exascale » (un milliard de milliards d’opérations par seconde) d’ici 2020
– Informer plus de 600 éditeurs de logiciel sur le SaaS (software as a service) d’ici fin 2017 via la SaaS Academy et permettre la transformation de 20 % d’entre eux
– Créer ou consolider près de 137 000 emplois grâce au Big Data d’ici 2020
[1] La définition de la loi Informatique et Libertés couvre un périmètre très large car comme le précise son article 2 : « Constitue une donnée à caractère personnel toute information relative à une personne physique identifiée ou qui peut être identifiée, directement ou indirectement, par référence à un numéro d’identification ou à un ou plusieurs éléments qui lui sont propres. Pour déterminer si une personne est identifiable, il convient de considérer l’ensemble des moyens en vue de permettre son identification dont dispose ou auxquels peut avoir accès le responsable du traitement ou toute autre personne ».
Egalement sur InformatiqueNews :