Par où commencer pour apprendre le Machine Learning ?
2
 min
Monter en compétence
 Publié le 
6/3/2018

Par où commencer pour apprendre le Machine Learning ?

Le Machine Learning, composant essentiel des Data Sciences, est devenu très populaire. Il existe depuis que nos ordinateurs sont assez puissants pour traiter l’énorme masse de données nécessaires au bon fonctionnement de ces algorithmes. Etre capable de comprendre et utiliser ces modèles sont donc devenues des compétences très recherchées par les recruteurs. Cet article va vous donner les clés pour commencer votre apprentissage du Machine Learning.

Coder en R ou en Python

Pour pouvoir parler à un ordinateur, vous devez utiliser un langage qu’il comprend. Python et R sont les langages les plus populaires en Machine Learning. Chez Jedha, nous avons une préférence pour Python qui devient de plus en plus populaire en raison de sa polyvalence.De même qu’en statistiques, être un expert et connaître absolument tout de ces deux langages n’est pas nécessaire (et est de toute façon presque impossible). Cependant, il est bon de comprendre les différents types de données (Text, Integer, Float, Array etc.) et de savoir construire des boucles.Vous pouvez utiliser les ressources suivantes pour commencer votre apprentissage
Learnpython.org

Teamtreehouse.com (site en anglais ayant des cours bien faits)
Udemy (plateforme de cours en ligne)

D’autres bibliothèque en ligne rassemble un grand nombre de MOOC. Course Duck a par exemple, établi un classement des meilleurs cours de Machine Learning en ligne, a différents niveaux d’expertise, de durées etc.

Statistiques

Avant de vous plonger dans l’écriture de codes et de vous amuser avec Python ou R, il est important de comprendre ce qu’il y a derrière le Machine Learning. En effet, ce domaine est exclusivement basé sur des concepts statistiques. Fort heureusement, vous n’avez pas besoin d’être un expert pour pouvoir manier le Machine Learning.Le Machine Learning repose sur la création de modèles imparfaits qu’il faudra améliorer au cours du temps afin que ceux-ci répondent au mieux à votre problématique. Ce sont les statistiques qui vont vous aider à définir la qualité d’un modèle. Cela implique donc de connaître les notions de moyenne, médiane, écart-type et p-values et de construire des intervalles de confiance. Le site statsoft.fr vous aidera à appréhender ces notions statistiques.

Appliquer le code au Machine Learning

Après avoir compris les notions statistiques basiques et le fonctionnement de Python, vous allez pouvoir utiliser des librairies (comme NumPy, Pandas, Scikit learn pour Python) qui vous aideront pour construire votre modèle de Machine Learning.Vous avez différents types de Machine Learning :

– Supervisés

– Non-supervisés

En fonction de cela, vous allez déterminer quel modèle vous pouvez utiliser. Pour vous donner une idée, voici une liste des différents modèles :

– Regression

– Classification

– Clustering

– Reinforcement Learning

– Natural Language Processing

– Artificial Neural Network

N’hésitez pas à lire les autres articles de notre blog pour accéder à des informations plus poussées sur le Machine Learning.Pour apprendre le Machine Learning, différentes ressources s’offrent à vous :

Cours en ligne : les cours de Hadelin De Ponteves & Kirill Eremenko sur Udemy sont très bien faits

– Notre formation Jedha : Formations à temps partiel sur 8 semaines durant lesquelles un professeur vous expliquera les différents concepts des Data Sciences et les bases du Machine Learning.

Master en Machine Learning : si vous souhaitez une formation à temps complet et sur plusieurs mois.

Pratique sur Kaggle


Enfin, le meilleur moyen de ne pas oublier et solidifier ces connaissances est de pratiquer. Kaggle est la meilleure plateforme pour cela, puisqu’elle vous permet de participer à un grand nombres de compétitions de Machine Learning où vous pourrez utiliser vos connaissances ! L’avantage de cette plateforme est qu’elle fournit des bases de données nettoyées. Ainsi, vous n’aurez pas à passer beaucoup de temps à préparer ces dernières pour votre analyse. Nous espérons que cet article vous aidera dans votre recherche, n’hésitez pas à ajoutez en commentaire vos suggestions pour apprendre le Machine Learning.

Écrit par
 - 

Python : le language de programmation le plus
populaire parmi les professionnels de la Data !

Obtenez notre livre d'Introduction Pratique à Python !

Testez-vous avec notre quizz !

Des compétences toujours plus recherchées par les recruteurs : évaluer votre niveau actuel en programmation !

Programmes, thématiques Data, admissions,
vous avez une question ?

Prenez rendez-vous avec nos équipes
pattern purple

Découvrez JULIE

la plateforme d’apprentissage
en ligne de Jedha !
Aller sur JULIE
JULIE desktop interface
JULIE mobile interface