Par où commencer pour apprendre le Machine Learning ?
4
 min
Monter en compétences
 Publié le 
6/3/2018

Par où commencer pour apprendre le Machine Learning ?

Le Machine Learning, composant essentiel des Data Sciences, est devenu très populaire. Il existe depuis que nos ordinateurs sont assez puissants pour traiter l’énorme masse de données nécessaires au bon fonctionnement de ces algorithmes. Etre capable de comprendre et utiliser ces modèles sont donc devenues des compétences très recherchées par les recruteurs. Cet article va vous donner les clés pour commencer votre apprentissage du Machine Learning.

Coder en R ou en Python

Pour pouvoir parler à un ordinateur, vous devez utiliser un langage qu’il comprend. Python et R sont les langages les plus populaires en Machine Learning. Chez Jedha, nous avons une préférence pour Python qui devient de plus en plus populaire en raison de sa polyvalence.De même qu’en statistiques, être un expert et connaître absolument tout de ces deux langages n’est pas nécessaire (et est de toute façon presque impossible). Cependant, il est bon de comprendre les différents types de données (Text, Integer, Float, Array etc.) et de savoir construire des boucles.Vous pouvez utiliser les ressources suivantes pour commencer votre apprentissage :

  • Learnpython.org (plateforme gratuite)
  • Udemy (cours en ligne spécialisée Data)
  • Team Treehouse (Cours en ligne spécialisé web)


D’autres bibliothèque en ligne rassemble un grand nombre de MOOC. Course Duck a par exemple, établi un classement des meilleurs cours de Machine Learning en ligne, a différents niveaux d’expertise, de durées etc.

Statistiques

Avant de vous plonger dans l’écriture de codes et de vous amuser avec Python ou R, il est important de comprendre ce qu’il y a derrière le Machine Learning. En effet, ce domaine est exclusivement basé sur des concepts statistiques. Fort heureusement, vous n’avez pas besoin d’être un expert pour pouvoir manier le Machine Learning.

Le Machine Learning repose sur la création de modèles imparfaits qu’il faudra améliorer au cours du temps afin que ceux-ci répondent au mieux à votre problématique. Ce sont les statistiques qui vont vous aider à définir la qualité d’un modèle. Cela implique donc de connaître les notions de moyenne, médiane, écart-type et p-values et de construire des intervalles de confiance. Le site statsoft.fr vous aidera à appréhender ces notions statistiques.

Appliquer le code au Machine Learning

Après avoir compris les notions statistiques basiques et le fonctionnement de Python, vous allez pouvoir utiliser des librairies (comme NumPy, Pandas, Scikit learn pour Python) qui vous aideront pour construire votre modèle de Machine Learning. Vous avez différents types de Machine Learning :


  • Supervisé
  • Non-supervisé

En fonction de cela, vous allez déterminer quel modèle vous pouvez utiliser. Pour vous donner une idée, voici une liste des différents modèles :


  • Régression
  • Classification
  • Clustering

N’hésitez pas à lire les autres articles de notre blog pour accéder à des informations plus poussées sur le Machine Learning. Pour apprendre le Machine Learning, différentes ressources s’offrent à vous :


  • Le bootcamp Essentials de Jedha : 50 heures de formation sur 2 semaines pour apprendre les bases de Python, SQL, du Machine Learning avant de réaliser votre premier projet Data. Vous y verrez l'ensemble du pipeline Data et serez à la fin, à même de discuter avec des équipes techniques, de manager des équipes techniques.
  • Cours en ligne : les cours de Hadelin De Ponteves & Kirill Eremenko sur Udemy sont très bien faits.
  • Les formations Data de Jedha : en fonction de vos projets professionnels, vous pourrez vous inscrire au bootcamp Essentials, Fullstack ou Lead pour monter en compétence et atteindre un niveau Data Analyst, Data Scientist ou Data Engineer.
  • Master en Machine Learning : si vous souhaitez une formation à temps complet et sur plusieurs années et avoir une formation théorique.

Pratique sur Kaggle


Enfin, le meilleur moyen de ne pas oublier et solidifier ces connaissances est de pratiquer. Kaggle est la meilleure plateforme pour cela, puisqu’elle vous permet de participer à un grand nombres de compétitions de Machine Learning où vous pourrez utiliser vos connaissances ! L’avantage de cette plateforme est qu’elle fournit des bases de données nettoyées. Ainsi, vous n’aurez pas à passer beaucoup de temps à préparer ces dernières pour votre analyse. Nous espérons que cet article vous aidera dans votre recherche, n’hésitez pas à ajoutez en commentaire vos suggestions pour apprendre le Machine Learning.

Rejoignez la communauté sur JULIE !

Python, SQL, gestion de projet Data, toutes les compétences à acquérir pour monter en compétences avec cours en ligne gratuits.

Antoine Krajnc
Écrit par
Antoine Krajnc
 - 
Fondateur
@ Jedha

Python : le language de programmation le plus
populaire parmi les professionnels de la Data !

Obtenez notre livre d'Introduction Pratique à Python !

Programmes, thématiques Data, admissions,
vous avez une question ?

Prenez rendez-vous avec nos équipes