Vous êtes vous déjà demandé comment Netflix savait quels films vous recommander, comment Facebook était capable d’identifier votre visage sur une photo ou encore comment Uber pouvait construire des voitures sans chauffeur ? Tout cela est possible grâce au Machine Learning. Découvrons le domaine dans cet article.
Des modèles de prédiction
Le Machine Learning se définit par la capacité d’un ordinateur à gérer des tâches sans qu’un développeur n’ait eu à coder chacune d’entre-elles.
Alors qu’auparavant, chaque ligne de code décrivait ce que votre algorithme pouvait faire, cette fois l’algorithme est plus ou moins capable de gérer certaines étapes par lui même.
Plus simplement, le Machine Learning est une collection de modèles de prédiction basés sur de puissantes théories mathématiques. Grâce aux différents modèles, vous allez être capable de définir si une personne va acheter un produit ou non, si une publicité performe mieux qu’une autre ou encore de reconnaître les mouvements humains (très utile dans le domaine de la réalité virtuelle).
Machine Learning supervisé et non-supervisé
On distingue trois types de Machine Learning : Supervisé et Non-supervisé.
Le Machine Learning supervisé
Ici, nous développons des modèles et réalisons des prédictions grâce aux données renseignées par l’homme. Autrement dit, votre modèle a besoin d’une base de données sur laquelle s’entraîner. On distingue dans le Machine Learning supervisé les modèles de régression, qui permettent de prédire un chiffre exact (comme un salaire en fonction du nombre d'années d'expérience) ou de classification qui permettent, eux, de prédire une catégorie (comme une probabilité d'achat d'un produit).
Le Machine Learning non-supervisés
A l'inverse, les modèles de Machine Learning non-supervisés n'ont pas pour but de faire des prédictions mais plutôt de créer des groupes, qu'on appelle aussi clusters (n'hésitez pas à regarder notre lexique Data si vous souhaitez avoir une définition complète). Ces groupes vont être relativement homogènes et vont nous permettre de pousser l'analyse pour essayer de dénicher des tendances ou des patterns. On peut par exemple utiliser le Machine Learning non-supervisé pour faire de la segmentation client.
Le Reinforcement Learning
C'est la typologie la plus nouvelle dans le Machine Learning. La méthodologie est d'entrainer un algorithme en modélisant un système de récompenses (+1) et de punitions (-1) et laisse un agent interagir dans un environnement (lui aussi modélisé). C'est par exemple de cet façon que l'algorithme alphaGo a été entrainé pour battre le meilleur joueur du monde de Go. Les cas d'applications sont encore limités car ce mode de fonctionnement est extrêmement coûteux en puissance de calcul.
Les différents modèles
Il y a beaucoup de modèles différents en Machine Learning, on pourrait les ranger en plusieurs catégories
- Régressions : permet de prédire un chiffre (ex : le salaire de quelqu’un)
- Classifications : permet de prédire une catégorie (ex : cet email est un spam ou non)
- Clustering : permet de faire des groupes que l’on ne connait pas à l’avance (ex : étudier des habitudes d’achat)
- Reinforcement Learning : permet de tester la performance de plusieurs choses à la fois (ex : la performance de différentes publicités)
- Natural Language Processing : qui permet d’étudier des textes (ex : des avis que vous auriez sur TripAdvisor)
Machine Learning & Deep Learning
Il y a une dernière catégorie de modèles dont on n’a pas encore parlé c’est l’Artificial Neural Network.
Ces modèles tentent d’imiter la façon dont fonctionne le cerveau humain. C’est ce qu’on appelle, plus communément, le Deep Learning. C’est simplement une catégorie (ou sous domaine) du Machine Learning.
On appelle cela le Deep Learning parce qu’on exécute un grand nombre de fois différents modèles de Machine Learning (souvent de classification) pour obtenir des résultats très précis. Le Deep Learning est, par exemple, utilisé dans les systèmes de reconnaissance faciale ou dans l’étude du churn rate d’une entreprise.
Le Deep Learning est la branche du Machine Learning qui génère le plus d’excitations aujourd’hui car c’est grâce à la puissance relativement nouvelle de nos ordinateurs que nous sommes capables de faire tourner ces algorithmes.
Pourquoi est-ce l'avenir ?
Le Machine Learning n’est d’ailleurs pas si nouveau que cela. En effet, l’homme est capable de créer des modèles de prédiction depuis déjà plusieurs décennies. Cependant, la puissance des ordinateurs est devenue telle que nous sommes capables de vraiment tirer profit des théories statistiques que les mathématiciens ont démontré il y a bien longtemps.
Nous produisons aujourd’hui tellement de données que nous ne sommes pas capables de toutes les traiter. Pour vous donner un ordre d’idée, il faudrait couper trois fois tous les arbres de la forêt amazonienne pour imprimer toutes les données que nous avons produites ces 5 dernières années. Le Machine Learning répond à ce problème en donnant aux ordinateurs la possibilité de traiter un nombre de données beaucoup plus grand.
Que ce soit dans le domaine des nouvelles technologies, de la santé ou du commerce, les applications du Machine Learning sont innombrables et incroyables. Par exemple, la réalité virtuelle utilise les algorithmes de Machine Learning pour reconnaître les mouvements et engendrer une action dans le jeu. Dans le secteur de la santé, le Machine Learning permettrait de prédire la prédisposition d’une personne à développer un cancer ou non et donc de pouvoir le soigner plus rapidement.
Si vous souhaitez en apprendre plus sur le Machine Learning, n’hésitez pas à consulter notre article pour savoir par où commencer pour l’apprendre. Nous espérons que cela a pu vous éclairer sur ce qu’était le Machine Learning, n’hésitez pas à mettre vos remarques !
Vous souhaitez vous lancer dans la data ? Regardez les meilleures formation data.