Données stockées ou données managées ? That is the question !

Les spécialistes des biais cognitifs pourraient trouver un nouveau terrain d’études en s’intéressant à la manière dont les entreprises gèrent leurs données. Un biais se définit comme une logique de raisonnement faussée qui conduit à une erreur de jugement ou à une mauvaise décision. C’est un phénomène dont celui qui en est victime a peu ou pas conscience, tout le monde peut en être victime, même les managers les plus talentueux et les plus diplômés. Il est toutefois possible d’en limiter les effets, notamment en les identifiant suffisamment tôt.

Pour Matthias Nijs, vice-président des ventes Europe pour Datadobi, éditeur d’une solution de migration de données, le fait que les données soient éparpillées rend très difficile de répondre à plusieurs questions pourtant simples : qui sont les propriétaires des données ? Sont-elles stockées au bon endroit ? Quelles sont les plus anciennes ? Comment le cycle de vie est-il pris en compte ? Qu’en est-il de la sécurité et de l’impact environnemental ? « Il n’est pas rare de trouver dans les grandes organisations plusieurs milliards de fichiers, il est quasiment impossible de s’y retrouver et c’est un véritable casse-tête dès lors qu’il faut les migrer, d’autant que 80 à 90 % des données sont non-structurées », poursuit Matthias Nijs, pour qui les entreprises ont tendance à confondre stockage et données et management de données.

A cela s’ajoutent les effets des biais. Pourquoi ceux-ci s’activent-ils dans les entreprises et dans les projets data ? La logique de diffusion et de persistance des biais est la suivante :

– Tout projet data comporte au moins un biais qui peut conduire à son échec (effet de prédisposition de l’organisation).

– Dès que le projet data est lancé, ce biais est susceptible de s’activer (effet de déclenchement).

– Moins la conscience de ce biais existe, plus celui-ci est susceptible de s’activer (on ne le voit pas arriver).

– Un biais qui s’active est susceptible d’en activer d’autres (effet d’interdépendance).

– Plus le nombre de parties prenantes est élevé dans un projet data et le périmètre étendu, plus les dégâts potentiels seront élevés (effet multiplicateur).

On s’en doute, le nombre de biais croit de façon proportionnelle au nombre de parties prenantes dans le projet data, de technologies mises en œuvre, de la taille de l’organisation…

On peut les classer en cinq groupes, alignés sur les caractéristiques génériques des entreprises et des organisations. Une entreprise a toujours au moins cinq composantes : des individus (collaborateurs / managers / dirigeants) s’intègrent dans une organisation, qui fonctionne grâce à des pratiques managériales, un ensemble de technologies et un environnement (règlementaire, concurrentiel, géopolitique…) dans lequel elle évolue.

Les biais liés à l’individu

Le biais culturel : la mauvaise compréhension des enjeux des projets data entraîne un déficit de maturité dans l’organisation.

Les biais cognitifs : ils sont nombreux, il en existe plus de 250, et ils sont de mieux en mieux connus. Ils se traduisent par une altération du jugement, d’où des prises de décision faussées, selon un schéma de pensée qui se révèle trompeur et faussement logique.

Le biais informationnel, avec la prolifération de données (contradictoires ou biaisées) et de sources différentes. Le risque est donc de se tromper en implémentant des technologies non adaptées ou à obsolescence trop rapides pour gérer les données.

Le biais décisionnel : la multiplicité de décisions contradictoires (effet du « dernier qui a parlé ») conduit à la démotivation des équipes, des retards dans les projets et des surcoûts. Dans leur ouvrage sur le bruit informationnel, Daniel Kahneman, Cass Sunstein et Olivier Sibony rappellent que « dans toutes les organisations, la conjonction des cascades informationnelles et des cascades de pression sociale peut produire une grande confiance, et un soutien unanime, sur un jugement totalement erroné (…). Certaines personnes sont plus réceptives au bullshit et être impressionnées par des affirmations apparemment puissantes, présentées comme vraies mais en réalité totalement creuses. »  Hélas, le domaine des data est particulièrement propice à l’apparition de ces cascades informationnelles.

 Les biais liés à l’organisation

 Le biais des processus. Une organisation complexe, en silos qui manque d’agilité, une communication morcelée peuvent entraîner des gaspillages de données. C’est un phénomène ancien et beaucoup d’entreprises se contentent de plaquer des technologies (Big Data, Data Lake, IA…) sur des organisations anciennes en simplement automatisant la gestion des données sans repenser les processus.

Le biais de l’hétérogénéité. Il se traduit par un manque de cohérence dans la gestion des compétences sur les données (trop de stratèges, trop de consultants, pas assez d’opérationnels…), des processus (chevauchement, lourdeur…) et des technologies (incompatibilités…).

Le biais du « Do It Yourself ». Une partie des budgets technologiques n’est plus contrôlée directement par les directions des systèmes d’information, entre un cinquième et un quart des budgets, voire plus pour les investissements dans la transformation digitale.  C’est le phénomène du Shadow IT, ou du Data Shadow IT, qui se manifeste par des investissements directs des métiers, donc des relations avec de multiples fournisseurs.

Le biais de la complexité des données. Le fait de confondre un système complexe et un système compliqué aboutit à des erreurs dans le diagnostic, le choix des technologies. Rappelons qu’un système complexe est un ensemble constitué d’un grand nombre d’entités en interaction, qui empêchent de prévoir son comportement ou son évolution. Ainsi, un système est dit complexe si le résultat final n’est pas prédictible par la logique ou le calcul. Il faut donc observer leur comportement par l’expérience et la simulation, afin de tester différentes options pour identifier celle qui convient. Un système compliqué, qui s’oppose à la simplicité, est difficile à appréhender, comprendre ou analyser. Il est déterministe, dans la mesure où il répond à des principes de causalité. Ainsi, un système compliqué est plus facile à gérer qu’un système complexe. Il demande de l’analyse et de l’expertise pour obtenir le résultat souhaité.

Il peut donc y avoir une confusion entre les deux, avec une erreur de diagnostic (croire qu’un système complexe de données n’est que compliqué) et, de fait, y associer des technologies qui ne résolvent pas les problématiques que l’entreprise souhaite résoudre.

Les biais liés aux pratiques managériales

Le biais du leadership. La multiplicité des centres de décision et de pouvoirs ne facilite pas le management des données, surtout si les considérations « politiques » et les conflits de territoire apparaissent, par exemple pour contrôler les données stratégiques. Surtout dans un contexte où la plupart des entreprises ont entrepris leur transformation digitale, domaine où plusieurs métiers peuvent revendiquer le leadership sur les data (DSI, marketing, directions financières, des ressources humaines, Chief Digital Officer, direction générale…). Pour ne rien arranger, chacun peut élaborer et promouvoir sa propre stratégie, multiplier les projets data en doublon (par métiers, par fonction, par produits…), sans vision consolidée. D’où d’inévitables désillusions dès lors que les conflits internes rejaillissent sur les fournisseurs, eux aussi en doublon…

Le biais économico-financier. La rareté des ressources budgétaires conduit à sacrifier quatre éléments fondamentaux dans le management des données : la sanctuarisation des investissements (pour éviter les volte-face stratégiques, par exemple pour promouvoir l’IA), les expérimentations sous forme de projets pilotes (Proof of Concept), l’effort de priorisation des projets/sous-projets et la réflexion sur le retour sur investissement de la valorisation des data.

Les biais liés aux technologies

Le biais technologique. Il se traduit par une surestimation ou une sous-estimation de l’apport des technologies pour transformer les données (le Big Data, l’intelligence artificielle, la Blockchain…). L’entreprise va donc commettre des erreurs dans le choix des solutions.

Le biais d’intégration/convergence. Dans beaucoup de projets data, les entreprises sous-estiment les efforts nécessaires à l’intégration des données dans ou à partir de l’existant. Il est donc souvent nécessaire de réinvestir en consulting ou en solutions supplémentaires pour faire converger l’ensemble.

 Les biais liés à l’environnement

 Le biais de dépendance. Il qui conduit à sous-estimer la proportion de données stratégiques/critiques. Avec une dépendance financière, fonctionnelle et contractuelle.

Le biais concurrentiel. Une entreprise qui surestime ou, au contraire, sous-estime ses concurrents, ou les risques de désintermédiation sur ses marchés, peut être amenée à investir trop, trop vite, dans des technologies data « à la mode »… ou trop tard.


Les sept péchés capitaux du data management

– La gourmandise : trop de data = trop de solutions = trop de fournisseurs.

L’avarice : privilégier systématiquement les solutions les moins chères pour gérer les data.

– La luxure : vouloir faire plaisir à tout le monde et gérer toutes les données, même celles qui ne servent jamais.

L’orgueil : ne pas reconnaître l’échec d’un projet data.

– La paresse : lancer un projet data sana penser au pilotage associé.

L’envie : vouloir investir dans les dernières technologies data, quel qu’en soit le prix.

– La colère : s’apercevoir que l’absence de contrôle et de pilotage (des métiers, de la DSI, de la DG…) a conduit à des catastrophes.