Reinoud Reynders, DSI du CHU de Louvain : « Archivage des e-mails : les utilisateurs veulent tout conserver ! »

Face à la prolifération anarchique des e-mails, une réponse s’impose : celle-ci est technologique, pour les solutions de stockage et d’automatisation, mais également organisationnelle. Le retour sur investissement est en principe au rendez-vous.

Pourquoi avez-vous mené un projet d’optimisation et d’archivage des e-mails ?

Reinoud Reynders Avec plus de 2 000 lits, le Centre hospitalier universitaire de Louvain est l’un des plus grands centres hospitaliers d’Europe et le premier de Belgique. Les 9 000 salariés de l’hôpital possèdent tous un compte de messagerie sous Microsoft Exchange. Pour eux, l’e-mail est un moyen de communication aussi important que le téléphone.

Il est utilisé à peu près pour tous les besoins métiers sauf l’information médicale propre à chaque patient. Afin d’améliorer les communications entre les médecins, les infirmiers et les personnels administratifs, nous avons souhaité remplacer ses anciens systèmes internes de messagerie et de gestion d’agendas. L’un des problèmes majeurs de l’ancien système provenait de l’instabilité globale de la messagerie.

En moyenne, chaque utilisateur appelait le service support deux fois par an pour des problèmes de messagerie. Cette situation entraînait une lourde charge sur les équipes informatiques, qui devaient faire face à des milliers d’appels d’utilisateurs mécontents et à des tâches de maintenance permanentes.

L’inefficacité du stockage était l’une de nos autres préoccupations : la réplication des fichiers joints aux e-mails en est un excellent exemple. Dans ce cas, des fichiers joints volumineux (comme des présentations de type PowerPoint de plusieurs Mo, notamment) devaient être stockés sur un serveur fichiers pour trois ou quatre boîtes aux lettres.

De même, la mauvaise optimisation des archivages de mails conduisait à une dégradation des performances, puisque l’on estimait que 90 % de la charge des serveurs y étaient consacrés.

Ces carences avaient également pour conséquence de focaliser les équipes informatiques sur des tâches réactives, plutôt que sur des développements productifs et valorisants pour les personnels de santé. Dans le prolongement d’une migration opérée en 2002 d’Unix à Windows NT, nous avons constaté des premiers problèmes de performances, en même temps qu’une augmentation des appels au help-desk.

Nous utilisons l’e-mail depuis le début des années 1990, mais jusqu’en 2003, nous avons utilisé la même technologie : Sendmail en tant que serveur de mails et Eudora comme client mail. Nous utilisions également Outlook, mais uniquement pour la fonctionnalité de calendrier.

Ce n’était pas une bonne idée : l’utilisateur disposait de deux logiciels clients différents et ne pouvait pas profiter des autres fonctions intéressantes de Outlook. Ce fut également la raison la plus importante pour changer : nous souhaitions que l’utilisateur ne dispose que d’un seul logiciel client. Et dans la mesure où nous avions déjà déployé Outlook/Exchange, le choix était simple.

Aujourd’hui, nous gérons 12 000 boîtes e-mails, sur quatre serveurs Exchange version 2003. Nous migrons vers seulement deux serveurs Exchange 2007. Au total, en volume de stockage, cela représente environ 2 térabits, la base de données Exchange représente moins de un térabit.

Nous recevons environ un million de mails par jour, dont seulement 2 à 4 % sont utiles, le reste étant du spam, que nous éliminons. Avant d’implémenter une solution spécifique et automatisée (Brightmail de Symantec), nous utilisions plusieurs outils open source. Mais le coût de revient total de ces outils était élevé et nous avions beaucoup de fausses alertes.

Pourquoi l’archivage des e-mails est-il un problème, voire un cauchemar pour le DSI ? Quelles difficultés rencontrez-vous ?

Reinoud Reynders L’un des problèmes de l’e-mail en général est que c’est très peu coûteux à utiliser. Envoyer un e-mail ne coûte pratiquement rien, quel que soit le nombre de destinataires. La difficulté principale est qu’un quart des appels au help-desk étaient liés à des difficultés de l’utilisateur avec ses e-mails.

La plupart des appels concernaient le manque d’espace de stockage pour conserver davantage de mails et de pièces jointes. Parallèlement, pour leur part, les équipes informatiques désiraient conserver une « petite base » Exchange afin de garantir les performances, la disponibilité, et restaurer rapidement le système en cas d’incident.

La seule solution était dont d’instaurer des quotas aux utilisateurs, avec, comme inconvénient, d’accroître les appels au help-desk. Les utilisateurs veulent tout conserver mais éprouvent des difficultés pour retrouver leurs informations, ce qui conduit à des pertes de productivité. L’archivage des e-mails est selon moi la seule solution pour résoudre ce problème.

Le serveur Exchange reste le même avec un volume d’archivage qui augmente sur des disques de moins en moins coûteux. Dans le même temps, l’utilisateur a une taille de boîte mail plus importante et, avec une fonction de recherche plein texte, il retrouve toujours ses e-mails.

En outre, la sauvegarde et la restauration du serveur Exchange ne posent pas de problème dans la mesure où la taille de la base de données de mails n’est pas démesurée.

Imposer un quota de stockage pour les utilisateurs n’est donc pas une bonne solution ?

Reinoud Reynders Non, le système de quotas est inadapté pour les e-mails. Simplement parce que les utilisateurs veulent tout conserver ! Avec un système de quotas, non seulement vous augmentez le nombre d’appels au help-desk mais, surtout, vous vous apercevez que les utilisateurs sont très créatifs pour contourner le système !

Ils conservent leurs e-mails en local, au format PST, dans tous les espaces de stockage disponibles (répertoires divers, clés USB, espaces de travail partagés, disques durs externes…), pour les équipes informatiques, c’est un cauchemar à administrer !

Par conséquent, nous ne limitons pas la taille des boîtes mails des utilisateurs : certes, la taille est limitée sur Exchange mais elle ne l’est pas pour les archives. Avec les technologies de compression, on peut réduire de plus de 50 % la taille des archives, que nous stockons sur des disques STA, qui sont moins coûteux.

Sur quelles solutions technologiques vous appuyez-vous ?

Reinoud Reynders Nous utilisons Microsoft Exchange 2003 pour la gestion des boites aux lettres, sur du matériel Dell. Pour le stockage, nous utilisons des baies NetApp Metrocluster et iSCSI comme protocole de stockage. Pour la sauvegarde, nous disposons de NetApp Snapmanager for Exchange.

Pour l’archivage des e-mails, nous avons implémenté Enterprise Vault de Symantec, et NetApp Snapmirror pour les sauvegardes. Chaque heure, nous créons une image (snapshot) du serveur Exchange, répliquée sur un stockage secondaire dans un second centre de données, pour assurer une reprise rapide en cas de nécessité et répondre ainsi au besoin de disponibilité.

Les copies snapshots ne consomment qu’un espace disque minimum. Ainsi, malgré l’important volume de copies créées, la sauvegarde ne consomme que 6 % de l’espace disque total.

Comment sensibiliser et former les utilisateurs ?

Reinoud Reynders Dans notre cas, ce fut relativement facile : nous avons migré de Eudora à Outlook en même temps qu’a été installé Enterprise Vault de Symantec. De fait, nous avons organisé des réunions de formation pour les utilisateurs afin de leur expliquer les différences entre Eudora et Outlook.

Nous n’avons pas insisté sur l’archivage des mails car pour les utilisateurs, il s’agit d’une fonction de Outlook : la différence entre les deux environnements étant très significative, cela n’a pas été un problème de changer les comportements. Nous formons également les utilisateurs pour leur expliquer comment et quand ils peuvent/doivent utiliser l’e-mail.

Quelles règles avez-vous définies ?

Reinoud Reynders Nous archivons tous les mails au bout de sept jours, avec deux exceptions : d’une part, les boîtes de réception après trente jours, ce qui laisse aux utilisateurs le temps d’effacer ou de classer leurs mails, par exemple dans des dossiers spécifiques par projet. D’autre part, nous n’archivons pas le contenu des corbeilles.

Nous archivons rapidement, de sorte que l’utilisateur puisse utiliser toutes les fonctions de recherche dans les archives. Ainsi, lorsque nous archivons un mail, nous le remplaçons par un raccourci, qui contient toutes les caractéristiques principales et essentielles du mail (expéditeur, destinataire, objet…), ainsi que les cent premiers caractères du mail original et la liste des pièces jointes.

Dans la fenêtre de visualisation de Outlook, l’utilisateur voit seulement une petite partie de l’e-mail. Lorsqu’il clique sur un mail, il peut en visualiser la totalité du contenu.

Quel est l’impact pour les équipes informatiques ?

Reinoud Reynders L’impact est très significatif. D’abord, le volume des appels au help-desk liés aux problèmes de mails est passé de 25 % à 5 %.

Le doublement du nombre des utilisateurs de la messagerie n’a généré qu’une surcharge de 25 % au niveau des équipes en charge du système. Avec l’ancien système, il aurait fallu environ 150 % de personnel supplémentaire : rien que l’effet positif de l’archivage sur ce poste a généré une économie de 90 000 euros. Ensuite, bien que nous proposions des tailles de boîtes mails illimitées, nous avons réduit notre espace de stockage de 49 %.

Enfin, nous avons obtenu un retour sur investissement significatif, pour l’ensemble du projet (incluant le stockage Netapp, les solutions Symantec et Exchange) au bout de vingt-quatre mois. Et au bout de cinq ans, le ROI atteint 189 %. Autre indicateur : nous estimons que la réduction des pannes et arrêts par rapport à l’ancien système se traduit par une économie estimée à 500 000 euros sur cinq ans.

Auparavant, il fallait environ 24 heures pour restaurer le système après un arrêt total. Désormais, nous réalisons la même opération en à peine une heure.

Quelle est l’étape suivante ?

Reinoud Reynders Nous considérons que, sur les trois prochaines années, le système Microsoft Exchange Server/NetApp sera capable de passer à 12 000 utilisateurs, sachant que l’archivage des e-mails progressera en volume de 50 % par an, tout ceci sans personnel supplémentaire en help-desk ou en administration de messagerie.

Par ailleurs, nous allons engager un projet d’archivage des bases Sharepoint. La législation européenne n’impose pas aux hôpitaux d’archiver les e-mails en mode WORM. Cependant, si cela s’avérait nécessaire et compte tenu de l’architecture actuelle, il serait facile d’activer la journalisation ainsi que le mode WORM optionnel embarqué dans nos outils.


Les best practices de Reinoud Reynders

  • Utiliser une solution anti-spam, afin de réduire les flux de mails.
  • Pour le serveur de mails, utiliser un système de sauvegarde basé sur des snapshots (images instantanées)
  • Arrêter les quotas et proposez des capacités illimitées de boites e-mails aux utilisateurs
  • Maîtriser la taille du stockage primaire permet de reporter la croissance sur le stockage dédié à l’hébergement des archives, plus économique que le disque primaire.
  • Instaurer des durées limites de conservation des e-mails sur le poste de l’utilisateur, avant archivage, par exemple 7 jours
  • N’archiver jamais les spams, les fichiers PST et le contenu des corbeilles.
  • Anticiper de fortes croissances de volumes dans le choix et le dimensionnement des solutions logicielles et matérielles.

« Un vrai cauchemar pour les DSI »

Jean-Marc Rietsch, président de FedISA (Fédération ILM, Stockage et Archivage) : « Le phénomène du mail est à la fois très particulier et très représentatif de l’évolution technologique et de ses conséquences, bonnes ou mauvaises. Chacun réagit en fonction de ses propres ressentis quant à la façon de rédiger un mail, de l’utilisation ou non de pièces jointes et des personnes à mettre en copie, simple ou cachée.

Le résultat en est une totale anarchie de fonctionnement et une augmentation gigantesque du volume à archiver que l’on nous prédit à plus de 7 000 petaoctets dès 2010, selon Gartner. Face à cette augmentation du volume, le réflexe a souvent été de l’équilibrer avec la baisse rapide des prix du stockage, même si au final le budget stockage augmentait.

Or nous atteignons actuellement de tels niveaux que cette baisse n’est plus suffisante pour garantir une certaine stabilité du budget alors même que la grande majorité des entreprises imposent sa diminution. Il est triste de constater que, malheureusement, la majorité des services informatiques brident leurs utilisateurs en leurs imposant une taille limitée de boîte aux lettres alors même que des solutions beaucoup plus efficaces et surtout rationnelles existent.

La mise en place d’un système d’archivage des e-mails doit simplifier la gestion des ces derniers au quotidien et leur conservation dans le temps, tant du point de vue de l’utilisateur, que du directeur informatique ou du chef d’entreprise et ce tout en respectant les aspects légaux et réglementaires. Côté utilisateur, il y a l’exigence d’un confort maximum à pouvoir retrouver ses e-mails facilement sans pour autant être systématiquement obligé de les organiser par dossier et autres sous-dossiers.

Cette classification montre d’ailleurs très vite ses limites lorsqu’un mail peut être rattaché à deux dossiers différents. Pour le DSI, les e-mails représentent vite un véritable cauchemar compte tenu de l’évolution à la fois de leur nombre et de leur volume moyen. La solution la plus souvent mise en place consiste à limiter radicalement la taille des boîtes de chaque utilisateur.

Mais la solution mise en place doit permettre de maîtriser le volume sans contraintes pour l’utilisateur. Il faut si possible être capable d’éliminer les e-mails qui ne justifient pas d’être conservés mais toutefois avec la certitude de ne pas éliminer des e-mails potentiellement utiles.

Pour la direction générale, il s’agit d’avoir la garantie de ne pas perdre d’information, stratégique ou non, qu’il s’agisse d’un aspect commercial, technique, comptable ou financier, voire patrimonial. »


Best practices pour l’archivage des e-mails

CLASSIFIER. Les e-mails à archiver représentent en général une minorité de l’ensemble de ceux qui sont produits et reçus. Il faut donc parvenir à classifier les e-mails afin de pouvoir décider de ceux qui entreront dans le processus de conservation et si possible élaborer des priorités (valeur de l’information, caractère légal et réglementaire, données à caractère personnel).

ASSURER LA MAINTENANCE. Le système d’archivage doit assurer la maintenance des données jusqu’à la fin du cycle de vie de l’information (de quelques mois à plusieurs décennies).

DIFFÉRENTIER. Effectuez la distinction entre le nombre d’e-mails et le volume en termes d’espace de stockage ; distinguez entre l’archivage probatoire et patrimonial.

INTÉGRER DANS LA CHARTE. Les règles de gestion des courriers électroniques doivent être intégrées dans la charte d’utilisation du SI, en renvoyant à une charte de l’archivage, tout en organisant le tri des e-mails (professionnels, privés).

RESPECTER LE DROIT. Vérifiez que les procédures sont décrites et répondent aux critères technico-juridiques d’intégrité, d’identification, d’intelligibilité, de pérennité.

AUDITER. Le système d’archivage doit être régulièrement audité en ce qui concerne tant sa mise en œuvre que sa conformité afin de prendre en compte les évolutions réglementaires.

FORMATER. Prévoyez deux formats différents en fonction de la durée de conservation, par exemple un format quasi natif pour des durées relativement courtes et sa transformation en HTML ou autre pour de plus longues périodes.

MIGRER. Compte tenu de l’obsolescence rapide de la grande majorité des supports, leur migration est inéluctable. Il peut en être de même au niveau des formats logiques. Evaluez les implications en matière de coûts, de temps nécessaire et d’indisponibilité éventuelle du système.

GÉRER LES DROITS D’ACCES. Le système d’accès doit être conçu dans le respect des droits dont dispose chaque utilisateur. Veillez à la confidentialité des données archivées, et à leur intégrité qui impose la mise en place d’un système de traçabilité

ÉVOLUER. Prévoyez dès la mise en place d’un système d’archivage son évolution afin d’anticiper les augmentations de capacité des différents matériels et plates-formes, voire d’envisager dès l’origine certaines migrations de supports.

SÉCURISER. Le système doit protéger le transfert et la conservation des données lors de la chaîne d’acquisition et dans la durée. Exemples de mécanismes de protection : des caches en écritures redondants et sécurisés sur batterie, des checksums (totaux de contrôle) disques, une protection RAID contre les pannes disques multiples, une solution de réplication…

ANTICIPER LES VOLUMES. Le système retenu doit pouvoir héberger les volumes en termes de capacité (en téraoctets, voire en petaoctets) et de nombre d’objets (en millions ou milliards) envisagés pour la durée de conservation des e-mails archivés, mais aussi pouvoir répondre à l’imprévu. Attention au tout numérique : sons, conversations, images, photos, vidéos…

S’ASSURER. La responsabilité vis-à-vis des tiers, enjeu particulièrement important dans le cadre de l’archivage, doit être couverte par une police d’assurance spéciale. L’entreprise reste seule responsable de la non-production de ses données en cas de dysfonctionnement.

TRACER. L’accès à la base d’e-mails archivés par les utilisateurs doit être contrôlé et évolutif. Le système doit également être capable de garder la trace des modifications intervenues quant à la définition de ces droits.

RECHERCHER. La facilité de retrouver un e-mail est fonction de la façon dont il aura été indexé, entre système classique par rapport à l’entête, système par mots-clés et moteur de recherche, appliqué au corps de l’e-mail mais également aux pièces jointes. Il sera important de vérifier que l’outil permet de hiérarchiser les résultats de recherche et autorise des recherches en cascade.

BUDGETER. Simulez les coûts d’exploitation totaux du système d’archivage, sur au moins trois ans, afin de prendre en compte l’amortissement du matériel et comparer une solution d’acquisition interne à une solution externalisée.

MESURER LA PERFORMANCE. Même s’il n’existe pas à ce jour d’indicateurs spécifiques destinés à l’évaluation de la performance d’un système d’archivage d’e-mails, il est néanmoins recommandé de la mesurer en calculant par exemple le coût annuel incluant l’identification, la capture, la gestion, la maintenance, l’accès et la destruction des e-mails, ainsi que l’évolution de ce coût au fil des ans.

GÉRER LE PROJET. Même si l’archivage des e-mails ne représente qu’une partie d’un projet global d’archivage, il doit être géré comme un projet à part entière. Il est important de prévoir d’autres coûts comme la communication sur les conséquences du non-archivage pour l’entreprise, la prise en compte des exigences d’archivage par l’ensemble des métiers et fonctions, l’accompagnement du changement par des actions de sensibilisation et de formation de l’ensemble des utilisateurs concernés.

PÉRENNISER. Même si rien ne peut véritablement garantir la pérennité des fournisseurs, il est important de la prendre en compte. Ainsi la reprise ou le transfert des données, ou au niveau logiciel la récupération des codes sources, doivent être précisément envisagés en détaillant les modalités et les coûts correspondants.

Source : « Conserver les courriers électroniques ? Ou comment résoudre la problématique de l’archivage des e-mails », document publié par FedISA (Fédération ILM Stockage et Archivage). www.fedisa.eu.