Le Machine Learning automatisé
3
 min
Monter en compétence
 Publié le 
17/10/2018

Le Machine Learning automatisé

Prédire, collecter, recommander. Quels sont aujourd’hui les usages concrets du Machine Learning en entreprise ? Adoptés par un nombre grandissant d’entreprises, les outils d’automatisation bousculent aujourd’hui les codes et process métiers. Ce workshop vous permettra de comprendre et d’expérimenter l’impact du Machine Learning sur la construction de modèles prédictifs puissants et leurs usages multiples.

Qu'est-ce-que le Machine Learning ?

Le Machine Learning “apprentissage automatique” en français – est un ensemble d’outils permettant de réaliser des prédictions et prévisions d’un phénomène ou d’une action. Il s’agit d’un programme informatique qui résout des tâches très complexes à partir des données récoltées par l’équipe Data.

Classifications SPAM sur Gmail, système de recommandations sur Netflix ou Amazon, voiture automatisée par Tesla ou Google, détection de tumeurs ou de maladies dans la médecine, reconnaissances d’objets, détection de fraudes : les applications du Machine Learning sont extrêmement nombreuses, et la véritable prouesse technique de ces dernières années réside dans la puissance calculatoire développée pour ces ordinateurs.

Lors de notre workshop sur les applications du Deep Learning, Antoine prenait l’exemple d’Alpha Go. Il s’agit d’un programme développé par Google dont le but est de jouer au Go, un jeu de plateau chinois. En 2016,  Alpha Go a battu le champion du monde de Go.

Qu’est-ce qui rend cette victoire notable ? Le nombre de combinaisons possibles au jeu de Go s’élève à 10 puissance 170 (vous aurez compris, soit 1,000,000,000,.....un 1 avec 170 zéros)  !  

Ce programme est donc capable d’apprendre par lui même les bonnes techniques de jeu à adopter selon les changements de son environnement (le jeu de son adversaire, le champion du monde de Go) .

Dans la pratique : les étapes d'un projet Machine Learning

Un même objectif à tous les projets Machine Learning : prédire des événements et prendre des décisions et actions basées sur ces prédictions.

Vous pouvez avoir une idée concrète du déroulé d’un projet Machine Learning en consultant ceux de nos élèves.

1. L’extraction via des bases de données : on extrait de là les informations que l’on veut traiter, analyser, et qui vont servir de socle à la prise de décision finale.

2.  Le pré-processing : cette étape consiste en un pré-traitement de toutes ces données avant de commencer à les analyser. Gestion des valeurs manquantes, des valeurs textuelles (un algorithme sait gérer des chiffres et non pas des mots et il va s’agir de les “traduire” en chiffre), mise sous forme tabulaire des données ; le but de cette étape de rendre la modélisation plus simple et rapide.

3. La modélisation et la mise en production : une fois les données pré-traitées, il va s’agir de trouver le bon algorithme correspondant à la problématique métier posée par votre client. En testant tous les algorithmes à disposition du Data Scientist (voir la Cheat Sheet) , cette étape est en somme très chronophage. Après avoir appliqué ce modèle, de nouvelles données arrivent, des prévisions sont faites et finalement des actions concrètes sont prises au sein de l’entreprise.

Machine Learning automatisé
En pratique, un des gros challenges d’un projet Data réside dans les différences métiers entre les équipes Data et les équipes IT. Les premières opèrent l’extraction des données, leur pré-processing, et leur modélisations, les équipes IT passent ces modèles en production (Data Engineering)

Ces deux collectifs ne parlent pas les mêmes langages informatiques, pourraient ne pas se comprendre, et donc pourraient mettre en compromission tout le projet mené pendant des mois.Il est donc important de bien embarquer les équipes IT dans vos projets Data, par exemple en leur délivrant ainsi qu’à l’ensemble de l’entreprise un Machine Learning Canvas.

Machine Learning automatisé

Le Machine Learning automatisé avec prevision.io

Dans tous les projets Machine Learning, peu importe la prédiction à réaliser, les étapes sont les mêmes. L’outil du Machine Learning Automatisé permet donc à partir de données récoltées, qui elles sont différentes pour chaque projet, de réaliser toutes les étapes intermédiaires du projet de manière automatique.

Avec un pré-processing réalisé par l’outil, celui-ci sélectionne les algorithmes et modèles selon des indicateurs de performance, puis les expose sur la plateforme. Il les mettra ensuite en production pour pouvoir rendre un reporting interprétable par le Data Scientist, menant à une prise de décision plus réfléchie.

Qu'est-ce que cela change pour l'équipe Data ?

Concrètement, cela signifie que le travail du Data Scientist peut être non seulement simplifié, mais lui fera en plus gagner énormément de temps. Au lieu de tester chaque algorithme individuellement (étape qui prend des semaines), l’outil les teste en quelques heures.

Pour l’équipe Data, le Machine Learning Automatisé facilite l’itération et donc la productivité : si le Data Scientist veut par exemple traiter une donnée différemment, ou en ajouter une nouvelle, il ne sera plus obligé de changer de modèle.

L’outil le fera automatiquement pour lui en prenant en compte les modifications apportées à la base de données d’origine.

Relativement à la prise de décision finale qui est l’objectif de tout projet Data, l’outil de Machine Learning Automatisé va permettre à l’équipe Data de choisir un modèle, mais surtout d’expliquer aux preneurs de décisions pourquoi celui-ci a été choisi. En somme, ce genre d’outil brise le manque de compréhension entre les différentes parties prenantes du projet : les équipes Data, IT et les preneurs de décision qui sont le plus souvent issus de départements commerciaux.

Florian Laroumagne
Écrit par
Florian Laroumagne
 - 
CEO
 @
Prevision.io

Obtenez notre manuel
d'introduction pratique à Python

Découvrez toutes les applications du langage de programmation le plus populaire

Testez-vous avec notre quizz !

Des compétences toujours plus recherchées par les recruteurs : évaluer votre niveau actuel en programmation !

Programmes, thématiques Data, admissions,
vous avez une question ?

Prenez rendez-vous avec nos équipes
pattern purple

Découvrez JULIE

la plateforme d’apprentissage
en ligne de Jedha !
Aller sur JULIE
JULIE desktop interface
JULIE mobile interface