Qu’est-ce que les dark data ?

D’après une étude mondiale conduite par True Global Intelligence et commandée par Splunk, 55 % des données d’une entreprise sont « dans l’obscurité » : ce sont des Dark Data, générées par les systèmes, les appareils et les interactions, mais qui ne sont ni quantifiées ni exploitées.

Elles peuvent être enfermées dans un silo, quelque part, ou difficiles à manier à cause d’un format ou de métadonnées atypiques. « On ne sait pas qu’elles existent, ni comment les trouver, les préparer, les analyser ou les utiliser », précise Stéphane Estevez, directeur marketing produit chez Splunk, qui suggère « qu’afin d’encourager et de construire une culture des données, les dirigeants doivent être formés sur la valeur des données et sur les perspectives qu’elles peuvent apporter. Souvent, ils comprennent leur valeur, mais laissent leur gestion et leur analyse à leurs collaborateurs, ce qui signifie qu’ils ont peu d’influence sur la manière dont elles sont optimisées. »

Selon l’étude True Global, un tiers des entreprises indiquent que plus de 75 % des données de leur entreprise sont « dans l’obscurité ». Elles ne sont que 11 % à affirmer que les Dark Data représentent moins d’un quart de leurs données.

Ce phénomène ne va pas s’arranger : une étude d’Oracle Netsuite nous apprend que 99 % des cadres dirigeants français sont submergés de données lorsqu’ils doivent prendre des décisions. « La surcharge d’informations, les contraintes de temps et le manque de confiance dans la hiérarchie étranglent le processus de prise de décision et poussent les dirigeants à privilégier leur ressenti pour élaborer leurs décisions », souligne l’étude. Ainsi, 69 % reconnaissent prendre des décisions sans s’appuyer fortement sur des données, ce qui signifie qu’ils n’utilisent que partiellement les données ou se fient plutôt à leur ressenti.

Rappelons que, selon IDC, la taille globale de la « Data Sphère » mondiale (il s’agit de toutes les données qui sont créées, collectées ou dupliquées à travers le monde) a représenté 33 zettabytes en 2018, contre moins de 10 en 2012. Elle atteindra 175 zettabytes en 2025, dont 80 % seront générés par les entreprises. La barre des 100 zettabytes de données créées (soit l’équivalent de 22 milliards de films en 4K) sera franchie dès 2023. En 2020, 1,7 mégaoctet de données seront produits par personne et par seconde. Dont une bonne partie se déversera dans le trou noir des Dark Data…


Chief Data Officer : combien de divisions ?

Selon le baromètre de l’EBG, mené avec Informatica et Fifty-Five, 86 % des entreprises françaises ont mis en place une stratégie data ou envisagent de le faire. Un chiffre en nette augmentation de 93 % en 2 ans, en 2017 ils n’étaient que 45 % à le déclarer. Par ailleurs, la donnée est considérée, par 85 % des professionnels interrogés, comme un levier de croissance déterminant pour les entreprises. Résultat : près de 60 % des entreprises disposent d’un Chief Data Officer (à ne pas confondre avec le Chief Digital Officer), contre 23 % en 2017 et seulement 18 % en 2016. Les CDO ont cinq missions principales : mettre en place une gouvernance des données, éliminer les silos entre les différents métiers, diffuser la culture de la donnée dans l’organisation, s’assurer que les traitements des données sont conformes à la réglementation et travailler sur l’omnicanalité. Reste à trouver les bons profils : 72 % des entreprises rencontrent des difficultés pour recruter, à la fois parce qu’elles subissent la concurrence des éditeurs et des start-up, et parce que les formations sont encore très récentes. Le manque de ressources humaines est l’un des trois challenges pour les entreprises, avec la difficulté de conduire le changement et d’établir une bonne gouvernance.

Source : Chief Data Officer, de l’inspiration à l’action, EBG, Informatica, Fift-Five, 2020. www.ebg.net


Les bonnes pratiques pour gérer les Dark Data

  • Former plus de collaborateurs en science des données et en analyse.
  • Employer de nouveaux logiciels pour permettre aux collaborateurs moins techniques d’effectuer des analyses sans l’aide d’un expert.
  • Intégrer la collecte des données dans le développement des terminaux et des applications.
  • Utiliserser l’intelligence artificielle pour collecter et analyser les données.
  • Organiser des séances d’information internes pour sensibiliser à la valeur des données.
  • Augmenter les budgets dédiés au traitement des données.
  • Recruter davantage d’experts en données.
Les obstacles à l’extraction des dark data Global
Volumes des dark data 39 %
Manque des compétences nécessaires 34 %
Manque de ressources 32 %
Difficulté de coordination entre les départements 28 %
Personnes n’a pour mission de découvrir les données que l’entreprise détient 26 %
Difficulté de coordination avec les tiers générant des données 23 %
Manque de contrôle sur les appareils et les applications qui génèrent des données 22 %
Manque d’intérêt de la part des dirigeants de
l’entreprise
21 %
Manque de créativité 19 %