Parmi les principaux sujets de management, il est celui d’une bonne valorisation de la data.
On observe, en particulier dans les revues spécialisées mais aussi dans la presse, une très forte recrudescence du nombre d’articles consacrés à la data et la manière de faire des données un avantage comparatif spécifique à l’entreprise. Quelle est l’ampleur de l’augmentation du volume de données ? Peut-on la comparer au pétrole, en clair, la data est-elle » le pétrole des entreprises » ? Ensuite nous verrons que pour valoriser la donnée il faut en réalité trois choses que l’on ne retrouve pas dans l’image du pétrole : (1) des bases de données de qualité, (2) des principes de bonnes conduites, et (3) surtout des innovations qui permettent de les exploiter comme l’intelligence artificielle.
1. La data est souvent désignée comme le pétrole des entreprises mais pourtant revêt des aspects très différents
Aujourd’hui selon IDC (Intelligence Data Corporation), la quantité de données générées chaque année dans le monde devrait passer à 175 ZO en 2025 via le développement du multi connecté et donc des capteurs. C’est l’internet des objets qui est responsable de cela. Pour donner une idée (itpro.fr) un seul zettaoctet représente plus de 40 000 milliards de DVD récoltées sur des supports variés d’objets connectés. Chaque jour, nous interagissons 4800 fois avec un objet connecté soit une fois toutes les 18 secondes avec l’essor de l’IoT. La data n’est donc pas le pétrole des entreprises pour une raison simple : depuis la fin des années 1980 en variation, la consommation de pétrole est supérieure aux découvertes alors que l’utilisation elle-même par des outils de la data (sa consommation) est toujours inférieure aujourd’hui aux tétras données de datas dont le potentiel est encore infini aujourd’hui.
Comment alors tirer un avantage comparatif de la data face aux tetra données[1] ?
2. Des principes de bonnes conduites ex ante
*Le premier est le fait de comprendre que les données doivent servir un use case cible, une fonctionnalité cible qui correspond à un réel besoin sur le marché ou dans les organisations. C’est la connaissance de la valeur de la donnée. Mobileye, fournisseur de systèmes avancés d’aide à la conduite automatique, propose des systèmes anticollision et des alertes de franchissement de ligne blanche pour véhicules. Ici, ses clients sont des constructeurs automobiles qui réalisent eux-mêmes des tests. Mais en amont du système, c’est-à-dire en intrant du système, ce sont les données de ces tests qui ont de la valeur et qui permettent d’atteindre des niveaux de fiabilité de 99,9% grâce à l’outil ex post.
*Le second est cette idée qu’il n’est pas toujours nécessaire d’accumuler une quantité délirante de données. Là aussi, qualité n’est pas quantité, il y a un moment donné où la valeur marginale de la donnée risque de décroître. Il faut donc une quantité optimale de données constamment renouvelée et de telle sorte que sa valeur marginale ne décroisse pas. Le succès de Zynga par exemple, qui a lancé « Farmville », vient précisément du fait que les données dont disposait Zynga ne sont pas devenues obsolètes d’une semaine sur l’autre. Mais malheureusement la belle histoire se termine mal. Zynga a lancé quelques autres jeux à succès dont « Farmville 2 » et « Cityville » puis plus rien jusqu’à même perdre plus de la moitié de sa base utilisateurs. Elle a ensuite été supplantée par Supercell (Clash of Clans et Epic Games (Fortnite)). Après avoir atteint un pic en 2012 à 10,4 milliards de dollars, la valorisation de Zynga a ensuite été divisée par plus de deux les 6 années suivantes. Un bel exemple d’obsolescence des données en intrant des jeux produits.
*Le troisième est que les données doivent être exclusives à l’entreprise et ne doivent pas être imitables. Adaviv, une start up de la région de Boston, propose un système de gestion des récoltes pour surveiller chaque plan en continu. On utilise l’IA avec des logiques de vision, et l’on suit des indicateurs de plants invisibles à l’œil nu par la biométrie. Ceci est un signe avant-coureur de maladies, carences en nutriments qui amènent à des rendements décroissants. Mais en intrant, ce sont ces données non imitables et exclusives à l’entreprise des utilisateurs. Plus le nombre d’utilisateurs Adaviv augmentait, plus l’outil pouvait recueillir des informations sur les variations de données et plus les informations étaient fiables pour les clients. Le point de départ est donc la donnée. Un autre exemple est Pandora. Pandora est une radio en streaming. Son offre est basée sur son « music génome project » (MPG) un système breveté de catégorisation de chansons sur la base de 450 attributs et l’analyse de millions de titres permettant de définir des stratégies de radio calquées sur les GOÜTS. Pandora permet de proposer des sélections musicales sur-mesure et le Music Génome Project est sans possibilité d’imitation car les données sont totalement exclusives à l’entreprise et les concurrents peuvent difficilement les répliquer. Ces données permettent le déploiement des systèmes intelligents comme le MGP. Et à ce titre, plus les données évoluent en elles-mêmes et plus la capacité à produire des connaissances grâce aux outils sera elle aussi meilleure.
*Le 4ème point est l’amélioration des utilisateurs en exploitant la qualité des données, puis la rapidité avec lesquelles les connaissances peuvent être intégrées aux produits, ce qui revient pratiquement au même. Spotify, Apple music ont supplanté Pandora mais uniquement aux EU. Mais Spotify a connu un succès mondial car a progressé en exploitant une excellente base de données et en proposant ainsi des playlists avec un effet de réseau attractif, celui de pouvoir rechercher et écouter les stations de radio des autres utilisateurs. Ici des cycles d’apprentissage rapide font qu’il est difficile pour les concurrents de rattraper leur retard surtout sur les produits bénéficiant de plusieurs objectifs d’amélioration au cours du contrat type d’un client.
3. L’intelligence artificielle pour les exploiter au mieux ex post
L’intelligence artificielle, grâce au machine Learning ou au deep learnin,g va permettre un second tour d’amélioration, le premier, comme démontré, concernait l’utilisation ex ante de la donnée, avant l’exploitation de celle-ci par un outil innovant. L’interprétation des résultats ex post lui confère un avantage indéniable dans le dessin de projets futurs et dans l’amélioration continue des exploitations ex ante des données et dans l’amélioration des premiers produits ou services délivrés. Au-delà de ces points managériaux, il ne faut jamais oublier les aspects humains. Cela vaut pour la technologie comme pour la data. L’art de la persuasion : face à l’essor de l’analyse des données les entreprises ont engagé les meilleurs data scientists qu’elles pouvaient trouver mais la plupart du temps n’ont pas réussi à retirer la valeur exemptée de leurs initiatives en sciences de données. Pour qu’un projet crée de la valeur, l’équipe doit poser les bonnes questions, traiter les données pertinentes et en tirer les résultats, comprendre et communiquer ce que les résultats signifient pour l’entreprise. Il est très rare qu’une seule personne maîtrise ces deux domaines. La plupart des data scientists sont formés au premier mais pas au second.
[1] https://www.hbrfrance.fr/chroniques-experts/2021/06/36272-comment-utiliser-les-data-pour-booster-la-performance-de-lentreprise/ et l’excellent numéro « Digital & Data, Mars-Avril 2021.
Vous avez aimé cet article ? Likez Forbes sur Facebook
Newsletter quotidienne Forbes
Recevez chaque matin l’essentiel de l’actualité business et entrepreneuriat.
Abonnez-vous au magazine papier
et découvrez chaque trimestre :
- Des dossiers et analyses exclusifs sur des stratégies d'entreprises
- Des témoignages et interviews de stars de l'entrepreneuriat
- Nos classements de femmes et hommes d'affaires
- Notre sélection lifestyle
- Et de nombreux autres contenus inédits