Qu’est-ce que le MLOps ?

Historiquement, le développement et la livraison d’applications suit un ensemble d’étapes successives bien établi. Une phase de spécification, suivie d’une phase de développement, puis une phase de livraison sur un environnement de production. Le comportement de ces applications est donc déterminé durant la phase de spécification/développement en anticipant toutes les possibilités.

De là, des méthodes agiles, fonctionnant par itération et de façon incrémentale, ont été développées, permettant désormais de produire beaucoup plus rapidement des logiciels. Le concept de DevOps est ainsi né. Depuis deux à trois ans, un nouveau concept voit le jour : le MLOps.

Une association de l’apprentissage automatique et du déploiement opérationnel

Contraction de Machine Learning et Operations, MLOps est l’association des processus d’apprentissage automatique et du déploiement opérationnel – Machine Learning et DevOps. En d’autres termes, MLOps est un procédé qui gère le déploiement opérationnel de modèles de Machine Learning, qui, par essence, sont fréquemment remis en cause. Ces derniers, alimentés en continu par de grands volumes de données, ne sont plus figés, mais dynamiques et évoluent en fonction des données. Il n’existe pas de configurations préétablies, tout le processus de développement est en itération et soumis en permanence au test & learn. Dès lors qu’une dérive est observée, une meilleure version du modèle est redéployée.

Que ce soit pour son développement, sa maintenance en condition opérationnelle et son suivi au cours du temps, un projet MLOps nécessite de mettre en place une organisation transverse. Celle-ci doit se structurer autour d’une équipe constituée d’experts métiers, de data scientists, de spécialistes du déploiement d’applications et de l’IT. Si regrouper des compétences est assez facile, créer un dialogue et des échanges au sein d’une telle équipe est beaucoup plus complexe. Parce que les compétences et les langages de ces profils sont si divers qu’ils rencontrent bien souvent des difficultés de communication.

Suivre en permanence les performances du modèle

Cette problématique trouve sa résolution dans la mise en place de bonnes pratiques et dans le déploiement d’une plateforme adaptée aux spécificités du ML. Cet outil est là pour non seulement développer le projet ML, mais aussi pour assurer sa mise en production et la gestion de son cycle de vie. Car un tel projet doit sans cesse être ajusté pour maintenir ses performances et le niveau peut rapidement se dégrader si les données ayant servi à son entraînement évoluent. Donc, pour maintenir la précision des prévisions en production, il est impératif de suivre en continu les performances du modèle et de procéder à des ajustements fréquents. Le MLOps n’est efficace que si le modèle est capable d’automatiser l’entraînement et de redéployer de nouveaux modèles pour les adapter au plus près des besoins des métiers.

Encore peu diffusé, le MLOps commence toutefois à se déployer dans quelques entreprises déjà digitalisées et orientées données. Cette technologie est particulièrement bien adaptée au secteur de la banque et des assurances, notamment dans la gestion du risque et des fraudes. Ces modèles apprenants et régulièrement réévalués permettent en effet d’assurer qu’elles repèrent et captent les cas risqués ou frauduleux. Les Retailers sont également friands de ce type de solutions, car elles leur permettent de faire des recommandations pertinentes de produits en ligne à leurs clients.

Cet article a été écrit par Ludovic Blusseau, directeur du Sales Engineering Europe du Sud chez Dataiku.