À quoi ça sert, un référentiel du système d’information ? C’est vrai que le terme référentiel est galvaudé, les auteurs de cet ouvrage le reconnaissent : « Tout est référentiel, mais ils recouvrent des objets radicalement différents. » La définition suggérée est la suivante : un référentiel de système d’information est « un ensemble cohérent et outillé de données du système d’information de l’entreprise, partagé par une communauté d’acteurs. » Un référentiel possède au moins cinq propriétés :
- il est centralisé, donc reconnu comme une référence pour le sujet qu’il traite,
- il est stable, les données ne changent guère avec le temps,
- il est de qualité, de manière à assurer la fiabilité des données,
- il a une unité de sens, les données étant homogènes sur le plan sémantique,
- il est interopérable, puisqu’il est nécessairement coordonné avec le système d’information.
« Il est frappant de constater que ces cinq critères sont liés les uns aux autres tout en étant, dans le même temps, assez différents », notent les auteurs, pour qui « on constate à quel point le caractère évolutif et dynamique du référentiel apparaît de façon récurrente, c’est un aspect central, constitutif du concept même de référentiel. » Les auteurs abordent quatre grandes problématiques de référentiels. D’abord, il s’agit de cerner la notion de référentiel, en particulier les deux grandes catégories que l’on trouve dans les entreprises : les répertoires et les nomenclatures. « Il s’agit d’expliciter leur structure, leur contenu, en s’appuyant sur la notion d’objet métier et en mettant en évidence les situations intermédiaires. » Plus précisément, les répertoires requièrent des algorithmes spécifiques et une attention particulière aux identifiants ; les nomenclatures, pour leur part, « renvoient à la notion de classement et soulèvent des questions de sémantique », précisent les auteurs.
Les référentiels du système d’information, données de référence et architecture d’entreprise, par Joël Bizingre, Joseph Paumier et Pascal Rivière, Dunod, 2013, 300 pages.
Seconde problématique abordée par les auteurs : comment éviter qu’un référentiel ne soit de mauvaise qualité ? Plusieurs facteurs sont à l’origine de dysfonctionnements : l’unité de sens est difficile à capter, le périmètre est ambigu, la mise à jour s’avère trop difficile, il n’y a pas de propriétaire clairement identifié, l’alimentation en données est trop complexe, les tableaux de bord sont erronés, les indicateurs ne sont pas pertinents…
C’est en partie dû à « la fausse simplicité des référentiels », pointent les auteurs, avec une mauvaise intégration de l’agilité, pourtant indispensable dès lors que des changements organisationnels et structurels imposent une évolution des référentiels en un temps raisonnable. Pour les auteurs, les référentiels sont des « pompes aspirantes-refoulantes au cœur du système d’information et c’est tout le système associé au référentiel qui va conditionner sa qualité : structuration, maîtrise de ses flux d’alimentation, outils d’audit automatique, gouvernance organisée. »
La troisième grande problématique concerne l’ingénierie des référentiels, avec les architectures métier et fonctionnelles : « Un référentiel n’a pas de sens pris isolément, il ne prend sa signification que vis-à-vis du système qu’il irrigue. » La gestion d’un projet de mise en œuvre d’un référentiel reste classique, avec des coûts d’investissement, de fonctionnement et de maintenance à prendre en compte. « Les coûts existent de toute façon, même si les données de référence sont gérées dans un fichier Excel », assurent les auteurs. Ces derniers rappellent qu’investir dans un système référentiel « est une opération sur le long terme, d’autant plus rentable que le temps passe.
C’est une des raisons pour lesquelles les systèmes référentiels dédiés doivent être utilisés prioritairement pour gérer des données de référence largement universelles dans l’entreprise, stables et non polluées de nombreuses données qu’il vaut mieux, elles, gérer dans des bases des données des applications métier. Il y a fort à parier que son coût final sera plus que raisonnable. » L’un des pièges dans lequel il faut éviter de tomber est la complexité : « Un projet référentiel doit chasser la complexité. »
La quatrième problématique abordée par les auteurs est de nature prospective. Ils mettent en exergue deux aspects. D’une part, avec le big data, les solutions de « data as a service », l’open data et la croissance des volumes d’informations, « les référentiels sont des phares dans un océan de données », résument les auteurs. Dans le domaine du big data, les référentiels sont indispensables pour déterminer les identités (de qui ou de quoi parle-t-on ?) et la pertinence des données, pour leur donner du sens.
« Imaginons que le big data contienne des millions de mots en séquence, sans aucune ponctuation. Imaginons que nous voulions exploiter cette mine en reconstituant et en classant les phrases, les paragraphes, puis les ouvrages qui se cachent derrière cette matière première. Nous avons besoin de plusieurs référentiels pour déterminer la langue de chacun des mots, comprendre la fonction grammaticale de chaque mot, trancher sur le sens du mot et donner sa cohérence et son sens à la phrase », illustrent les auteurs.
D’autre part, ces derniers évoquent les pistes vers « un référentiel universel des personnes », tant la masse de nos « ombres numériques » est étendue, avec tous les risques et les dérives que cela comporte. L’une des solutions, suggèrent les auteurs, serait de « reproduire, à l’échelle de l’enjeu, ce qui se fait pour les réferentiels de données dans les systèmes d’information des entreprises. » Pour eux, « l’asymétrie entre l’individu et l’ensemble des systèmes numériques qui manipulent nos données n’est pas forcément inéluctable… »