Les prévisions de croissance des volumes de données ne font même plus peur. On parle désormais en zettaoctets : la barre des 100 zettaoctets de données créées sera franchie en 2023, selon une étude IDC-Hitachi.
C’est l’équivalent de 22 milliards de films en 4K. Vu comme ça, c’est évidemment énorme, mais on perçoit mal ce que cela représente vraiment, le cerveau peinant à percevoir les évolutions exponentielles. En fait, les flux d’information ont quatre caractéristiques : ils augmentent de façon exponentielle, sont de plus en plus dépendants les uns des autres, ils circulent selon des modes multi-canal et multi-formats et le poids des informations non structurées devient dominant.
On pourrait retenir une analogie avec une cave : on ne perçoit pas d’emblée les volumes d’objets qui y sont entassés, on a tendance à en stocker de plus en plus, il devient difficile d’en bouger un sans devoir en déplacer d’autres, on trouve de tout, et surtout des objets dont l’utilité est discutable, « mais on ne sait jamais, ça peut toujours servir », et une majorité du contenu n’est pas rangé dans des cartons étiquetés pour s’y retrouver.
Le comportement des entreprises en matière de maîtrise des données est très similaire à celui de n’importe quel individu possesseur d’une cave : il y entasse beaucoup d’objets hétéroclites, les stocke là où il y a de la place, continue tant qu’il y a de l’espace disponible. Il sait qu’il faudra ranger, mais verra plus tard…