L’expression « Big Data » est devenue en quelques mois l’une des plus usitées parmi les professionnels du management des systèmes d’information et les médias spécialisés… Pourquoi parle-ton de « Big Data » ? En réalité, la croissance des volumes d’informations numériques est telle que les bases de données qui permettent de les gérer ne suffisent plus, il faut donc imaginer de nouvelles architectures (logicielles et matérielles) pour traiter ces masses considérables de données.
Plusieurs études ont mis en évidence cette croissance des volumes d’informations numériques. Selon le cabinet d’études américain IDC (Etude 2011 « Extracting Value from Chaos »), 1,8 zettaoctets, soit 1 800 milliards de gigaoctets, ont été créés et répliqués en 2011, neuf fois plus qu’en 2005, soit une croissance dépassant les prédictions de la célèbre Loi de Moore !
En outre, d’ici la prochaine décennie, la quantité de données gérée par les entreprises pourrait être multipliée par cinquante et la taille des fichiers par 75.
Concrètement, un volume de 1,8 zettaoctet de données équivaut au volume d’informations créé si chaque habitant de la planète subissait chaque jour plus de 215 millions d’IRM à haute résolution, ou au volume contenu dans plus de 200 milliards de film HD (d’une durée moyenne de deux heures).
Il faudrait à un individu pas moins de 47 millions d’années pour en visionner l’intégralité, si tant est qu’il s’y consacre 24 heures sur 24 et sept jours sur sept. Cela correspond également au volume nécessaire pour remplir 57,5 milliards d’iPad d’une capacité de 32 Go.
Gestion des données : des investissements en forte croissance
Une telle situation résulte de deux tendances lourdes : d’une part, une évolution technologique qui se traduit par une diminution drastique des coûts de stockage des données. Par exemple, chacun peut acquérir une capacité de stockage d’un teraoctet pour seulement quelques centaines d’euros.
Selon IDC, le coût d’un gigabit de stockage s’élevait à environ 20 dollars en 2005 mais à nettement moins d’un dollar aujourd’hui. A cet aspect purement matériel s’ajoute la diminution du coût de création/capture/duplication des données.
D’autre part, les entreprises investissent massivement dans les données : toujours selon le cabinet IDC, les investissements consentis par les entreprises dans l’« univers numérique » (cloud computing, équipement informatique, logiciels, services et personnel dédié à la création, la gestion, le stockage et l’exploitation des informations) ont augmenté de 50 % entre 2005 et 2011, pour atteindre les 4 000 milliards de dollars au niveau mondial.
Selon le cabinet de conseil Deloitte, dans son étude « Technology, Media & Telecommunications Predictions, poubliée début 2012, cette année, 90% des sociétés du classement Fortune 500 auront lancé un grand chantier de gestion des données. D’après McKinsey, les entreprises américaines de plus de mille salariés stockent d’ores et déjà, en moyenne, l’équivalent de 235 terabytes de données.
« Ces projets n’en sont encore qu’à leur tout début, souvent gérés par les départements IT, mais suscitent un intérêt grandissant, car le besoin d’analyses stratégiques en temps réel pèse lourdement sur les outils traditionnels de gestion des données. Les sociétés Internet ont ouvert la voie de l’exploration des « Big Data ». Elles seront suivies de près par le secteur bancaire et financier, public, la grande distribution, les loisirs et les médias », souligne l’étude de Deloitte.