Si la messagerie s’arrête, la moitié de l’encadrement ne peut plus travailler

Rencontre avec Thierry Danckaert, DSI d’Armor-Lux. Le fabricant breton de vêtements Armor-Lux a redimensionné son système d’information avec la virtualisation et une salle machines de secours. Une solution qui a démontré son efficacité lorsque une panne de climatisation a stoppé les serveurs.

Vous êtes DSI d’Armor-Lux depuis dix-huit mois : quelle situation avez-vous trouvée à votre arrivée ?

Thierry Danckaert Pendant trois ans, l’entreprise n’a pas eu de DSI à part entière. La direction générale m’avait prévenu que la situation était quelque peu délicate. La première chose que j’ai faite, c’est un recensement de tout ce qui existait, en termes d’applicatifs, de matériels et d’infrastructures.

Cet audit m’a permis de découvrir, d’une part, qu’il y avait un certain nombre d’applications qui n’avaient pas été modernisées depuis de nombreuses années et que, d’autre part, certaines applications n’avaient plus de contrats de maintenance. Par ailleurs, côté matériels, certaines machines n’étaient plus couvertes par les garanties et/ou mal dimensionnées en termes de performances.

Quels étaient les risques pour l’entreprise ?

Thierry Danckaert L’analyse du risque a porté sur les problématiques de pannes, notamment pour les systèmes d’échanges de données. Ceux-ci reposaient en effet sur des environnements vétustes et obsolètes. Et l’entreprise ne disposait plus de sauvegardes opérationnelles.

En fait, si le système de gestion de production s’arrête pendant une demi-heure, ce n’est pas considéré comme critique mais, en revanche, si le système d’échanges de données et de messagerie devient indisponible, ne serait-ce que pendant un quart d’heure, la direction générale se manifeste rapidement. Les systèmes de messagerie et d’échanges d’informations avec les clients, même si l’architecture est moins structurée qu’avec un système EDI, deviennent primordiaux pour un groupe comme Armor-Lux.

Si la messagerie s’arrête, la moitié de l’encadrement ne travaille plus ! Dans le domaine de la production, avec un risque de panne, ce n’est pas tant la partie production elle-même qui est impactée que la partie logistique et les flux d’expéditions, qui sont stoppés. En outre, notre système d’information se révélait incapable d’accompagner la croissance de l’entreprise.

C’est un risque majeur, dans la mesure où l’entreprise doit assumer ses contrats existants et se trouve freinée dans son développement commercial dans la mesure où l’on ne pourrait gérer des volumes de production supplémentaires.

Quels éléments avez-vous pris en compte pour mener votre analyse de risques ?

Thierry Danckaert Dans mon analyse de risques, j’ai établi plusieurs niveaux d’exposition, en explicitant pour chacun la nature des risques encourus, les conséquences pour le chiffre d’affaires actuel et futur, ainsi que les problèmes sociaux potentiels. Toutefois, nous n’avons pas quantifié toutes les conséquences.

Cette décision était volontaire dans la mesure où, pour une PME comme Armor-Lux, nous n’éprouvons pas le besoin de tout justifier. Dans mon précédent poste, dans une entreprise beaucoup plus grande, il fallait tout justifier et c’est l’une des raisons pour lesquelles je l’ai quitté. Chez Armor-Lux, il existe des relations de confiance entre la direction générale et les directions métiers, et nous fonctionnons énormément sur des principes de bon sens !

Comment avez-vous orienté votre stratégie pour diminuer les risques ?

Thierry Danckaert La première question à laquelle je me suis efforcé de répondre est la suivante : « Sur quels domaines puis-je agir rapidement afin de mieux dormir la nuit ? » J’ai identifié des applications qui devaient être sécurisées le plus vite possible.

Comment faire ? Deux approches sont possibles. La première consiste à changer les matériels, mais cela risque de créer des incompatibilités avec les applicatifs dans la mesure où nos logiciels n’avaient pas évolué. La probabilité d’échec est donc significative, d’autant qu’une telle approche doit nécessairement s’étaler dans le temps, du fait de nos contraintes budgétaires. Seconde approche possible : une refonte de l’architecture globale, avec une stratégie de virtualisation, approche que nous avons retenue.

En fait, virtualiser s’effectue relativement rapidement, avec la possibilité d’atteindre un niveau de sécurité et de reprise d’activité que l’on n’aurait jamais atteint aussi rapidement sans virtualisation. Côté serveurs, nous avons utilisé VMware et Citrix. Il me manquait la brique de virtualisation des données et du stockage.

Nous souhaitions mutualiser le stockage avec deux SAN, car nous avons créé une deuxième salle machines dans un autre bâtiment. Nous avions le choix entre sélectionner des baies de disques propriétaires, avec des contrôleurs propriétaires. Or, les produits des grands constructeurs tels que HP, IBM ou EMC ont un défaut : ils sont propriétaires !

De fait, acquérir un contrôleur de stockage de ces marques oblige à acquérir les baies de stockage de la même marque. Nous avons opté pour une solution ouverte. Je me suis appuyé sur un intégrateur (Kappa) et sur l’outil de Datacore (SANmelody).

Cet outil s’installe sur un serveur du marché et il est indépendant des ressources de stockage, quels que soient la typologie (NAS, SAN) ou le fournisseur. Il est donc possible d’acquérir des serveurs et des disques du marché à moindre coût : à niveau de performances équivalent, cela représente une économie de 20 % à 30 %…

Quel bilan tirez-vous ?

Thierry Danckaert Tout d’abord, j’observe qu’une solution logicielle est souvent moins rapide qu’une solution matérielle, fondée par exemple sur des commutateurs. Le total de l’opération virtualisation, « matériels et logiciels », s’est monté à 110 000 euros. Une solution classique à base de matériel propriétaire aurait coûté plus du double.

Ensuite, nous avons réussi a sécuriser l’ensemble de l’exploitation des anciens applicatifs sans pour autant avoir eu besoin de les changer. Enfin, nous avons mis en place un plan de reprise d’activités, élaboré en interne. Ce plan a d’ailleurs été testé malgré nous. Nous avons installé une seconde salle serveurs, avec la réplication des matériels, des applications et des données.

Concrètement, ce sont les contrôleurs de stockage Datacore qui équilibrent les charges (Load Balancing), tandis que les serveurs VMware sont pilotés par un algorithme de type « Round Robin ». Globalement, tout s’est bien passé, la phase la plus délicate ayant été la mise en place du mirroring et la virtualisation de certaines « vieilles machines ». Nous avons en effet créé un VLAN IP pour canaliser le trafic entre les deux salles. C’est son paramétrage qui a posé quelques difficultés pour une parfaite.

Cette seconde salle a été victime d’un défaut de climatisation. En novembre dernier, une soudure du réseau de climatisation a cédé. La température s’est rapidement élevée et, lorsqu’elle a atteint 55°C, l’onduleur a été le premier à tomber en panne. Les serveurs ont suivi.

Le schéma imaginé dans notre plan de reprise d’activités est qu’en cas de panne, si les serveurs s’arrêtent, un système d’alerte automatique nous envoie des SMS, par le serveur de messagerie. Mais celui-ci, faute d’onduleur, n’était plus alimenté. Le lendemain, à la reprise du travail, personne n’a constaté de défaillance du système informatique. Tout le monde pensait que le système fonctionnait normalement.

Ce n’est que vers midi, lors d’une visite de routine, que l’on a découvert l’arrêt total de la nouvelle salle. Non seulement le passage d’une salle à l’autre s’est effectué automatiquement pendant la nuit, mais celle qui restait en service a pu absorber toute la charge de travail du matin.

En réalité, l’impact a été nul dans la mesure où toute notre infrastructure est doublée, avec nos deux salles indépendantes mais répliqués en termes de données et distantes de 250 mètres. Le problème serait différent si les deux salles tombaient en même temps, mais la probabilité, sans être nulle, est proche de zéro.

Notre prochain chantier concerne la transformation du système d’information. Cette orientation est incontournable dans la mesure où nous avons deux types de clientèle : le grand public et les entreprises ou administrations, pour qui nous fabriquons les vêtements de leurs collaborateurs (postiers, contrôleurs de la SNCF, personnels d’Aéroports de Paris, etc.).

Ce segment de clients génère la moitié de notre chiffre d’affaires et nous assurons une prestation complète de gestion externalisée des vêtements d’entreprise : de la confection de vêtements spécifiques à la logistique, jusqu’à la livraison des colis individualisés, soit à domicile, soit dans l’entreprise.

Le système d’information d’Armor-Lux s’oriente donc vers une plus grande ouverture et une orientation Web plus prononcée pour la prise de commandes et leur suivi.