Avoir un modèle qui n'atteint pas à 90%, ce n'est pas grave !
5
 min
Communauté
 Publié le 
12/10/2020

Avoir un modèle qui n'atteint pas à 90%, ce n'est pas grave !

RH x Data, démocratisation des compétences techniques, Retrouvez ici l'interview complète de David, Business Analyst & enseignant sur notre formation Essentials !

Qui est David Raux ?

David est un expert de l'éducation en Data. Après avoir commencé son parcours dans le domaine des Ressources Humaine, il a entamé une reconversion professionnelle en allant valider un Master spécialisé en IA et Data Science. Il couple ses deux passions qui sont l'éducation et la Data en devenant enseignant pour La Sorbonne, le CNAM et à l'Université de Nanterre. Il est en parallèle mentor chez OpenClassRoom et est également Maître Jedha.

Hello David, quel est ton parcours ?

J’ai d’abord réalisé un Master en Ressources Humaines et gestion de l'enseignement pour me former. J’ai continué sur un Master spécialisé en IA et Data Science : des analyses de données avec une spécialité en ressources humaines. J’avais comme projet de préparer un service RH à la mise en place de leurs analytics avec Tableau Software.

On dit souvent qu’on a besoin de beaucoup de professionnels dans la Data, cela veut bien dire qu’il y a d’importants besoins en enseignants. Au quotidien, j’essaie de vraiment transmettre cette vision de l’analyse de données, du quantitatif, pour aider à prendre des décisions un peu plus rationnelles, plus éclairées.

Enseigner sur des formations pour les personnes qui démarrent est un parti pris pour toi ?

Démocratiser la Data Science et l’analyse de données est très important pour moi. Je veux mettre mots simples sur ce que l’on pense très technique.

Ce côté très technique peut faire peur au départ quand on a 30 / 35 ans (ou même plus pour certains), mais tous les élèves ont de vrais savoirs-faire dans leur domaine, et cela sera déjà extrêmement valorisé dans la partie analyse de données.

Dans la Data Science, si on cherche un modèle précis, on voit bien que la connaissance business va vraiment apporter un plus.

C’est d’ailleurs pour cela que j’aime accompagner des personnes plus novices : les aider à débuter dans cette aventure de l’analyse de données pour leur montrer qu’ils ne viennent pas de nulle part et qu’ils ne repartent pas de zéro. Ce ne sont pas des personnes qui seront totalement junior : elles vont s’appuyer sur leurs connaissances. Mon but en enseignant est de montrer la valorisation de la donnée, donner toutes les pistes et tous les outils qu’il faut vraiment maîtriser et ensuite laisser les élèves en autonomie pour approfondir leurs connaissances.

Et en RH ?

Mon but est réellement d’accompagner la digitalisation du métier des ressources humaines.On a souvent des personnes qui ont moins d’expérience sur la partie prise de décision avec de l’analyse de données, c’est sur ce point là que j’appuie car la plus-value est énorme.

Se dire que l’entreprise dans laquelle je travaille dispose d’une mine d’or pour améliorer ses produits et services est la première brique.

Au fur et à mesure, quand l’entreprise sera plus habituée à cette vision data-centric, les données pourront être partagées entre les différents services, on pourra commencer à modéliser. On sait que dans le marketing, la finance ou l'assurance, ce sont des secteurs ou activités qui sont gouvernés par les chiffres, du moins dans la prise de décision. En revanche en RH, c’est moins commun.

Est-ce que tu as rencontré des RH qui étaient plus frileux à l’idée de mettre en place ce genre d’initiative ?

Pour moi, il va sûrement falloir commencer à partager cette donnée. On parle de données RH, mais on peut aussi parler de données commerciales. Parfois il y a de la résistance au changement et c’est aussi pour cela que des consultants viennent aider à la transformation des entreprises pour commencer à démocratiser la valorisation de la donnée.

Comment vois-tu évoluer les métiers de la Data Science ? Y'a-t-il encore cette image de boîte noire en IA ?

La Data Science, l’IA, le Machine Learning : ma volonté est d'enseigner tout ce qu’il y a derrière tous ces buzzwords.

Aujourd’hui on met le terme "Data Science" partout. La réalité est encore tournée vers de l’analyse de données : je récupère des données, je les prépare, je les nettoie et je les fais parler en faisant de la Data Visualisation par exemple.

C’est seulement aujourd’hui que les entreprises commencent à vraiment faire de la Data Science pour aider à la prédiction, la partie modélisation.

Car il faut se poser une question très simple : Qui fait cette Data Science ?

Est-ce qu’on embauche des Data Scientists dont c’est le cœur de métier, ou est-ce que l’on prend des gestionnaires qui vont monter en compétences en effectuant une formation et qui pourront obtenir la brique Analytics ?

Le but est de continuer à se former pendant que l’entreprise monte également en compétences sur la partie Data. Les salariés eux-mêmes (comme beaucoup d’élèves) se forment aux outils de Data Science, différents modèles, différents algorithmes de Machine Learning, etc.

Dans le métier, je vois finalement deux branches :
  • Le gestionnaire monte en compétence petit à petit et accompagne la transformation digitale de son entreprise avec une brique Data
  • La partie des Data Scientists de plus haut niveau, qui connaissent les algorithmes de Machine Learning, et qui vont pouvoir créer leurs propres outils ou applications. Le rôle du Data Scientist va se trouver vers des organisations où cela devient de plus en plus complexe en terme technique. Et à ce moment-là, et il y aura un besoin d’optimisation.
La force repose dans le fait de bien comprendre son environnement, les enjeux, et de modéliser ce problème pour y appliquer le meilleur algorithme ou la meilleure stratégie de Data. Cela nécessite effectivement un métier à part entière.

Comment convaincre tes équipes que cette aide à la décision est importante ?

Un Data Analyst ou Data Scientist doit détenir cette compétence de vulgarisation, de transmission de la connaissance.

Dans le cabinet de consultants où je travaille, le background de l'autre oriente beaucoup les sujets abordés : un statisticien veut de la justesse et de la précision dans son analyse statistique. Et parfois, la partie vulgarisation de la transmission peut venir à manquer, mais reste pourtant primordiale pour convaincre des personnes moins techniques.

Quels sont les softs skills qui sont importants pour toi en dehors de la communication ?

Être curieux, ne pas avoir peur d’apprendre. On a souvent beaucoup de variables à notre disposition. Il faut tout tenter et chercher des mises en relation.

Etre organisé ! Quoi qu’il arrive, on aura un résultat. Quand on démarre, il est plus que normal d’avoir des résultats qui ne crèvent pas le plafond ! L’objectif est de restituer un résultat et une méthode cohérents pour son organisation. Se remettre en question et s’améliorer : aller plus au bout de son nettoyage de données, de son analyse fait gagner non seulement en performance, mais aussi en crédibilité.

Comment gères-tu l'hétérogénéité du groupe ?

Pour la formation Essentials, nous avons une grande diversité au niveau des parcours. Des personnes qui ont déjà des PhDs, qui sont en reconversion mais également des personnes qui ont plus d’expérience notamment en marketing, finance, ou autre métier, et qui n’ont pas du tout la partie analyse de données.

La clé pour moi est de donnée envie, donner confiance, déconstruire la peur que l’on peut avoir face à l’immensité du volume de données.

Le but est que chacun puisse avancer à son rythme. L’idée du programme Essentials est d’ailleurs d’aller assez doucement pour les plus débutants, d’apporter les premières briques pour qu’ils balayent un champ assez important. On leur donne ensuite des outils pour aller encore plus loin avec des exercices & projets. Pour les plus avancés, certains veulent par les Essentials asseoir les briques de ce qu'ils savent déjà. Avec toute une librairie de ressources pratiques allouée, nous allons continuer la montée en compétences. En général une personne qui avance bien n’a pas besoin que l'on soit forcément derrière elle, donc il suffit de simplement l’aiguiller sur une ressource en donnant un conseil pertinent.

Les petits effectifs de sessions permettent vraiment d’avoir une vision globale de chacun. Si le groupe s’agrandit, on a un assistant qui permet de gérer tout ça. Chacun développera ensuite ses compétences selon ses besoins.

Comment est-ce que tu abordes l’introduction au projet ?

Prenons l’exemple d’une entreprise, on va avoir une équipe de Data Scientists qui va créer un super modèle. Mais finalement s’il n’y a pas de besoin et pas de problématique, cela risque d’être compliqué de convaincre qui que ce soit du côté métier d'accompagner ce projet.

Il faut donc d’abord bien caler le contexte, ce sur quoi la personne veut travailler, elle pourra bien s’appuyer sur son background professionnel.

Si par exemple la personne est au service marketing de son entreprise, il y a peut-être des données accessibles et on peut se poser des questions telles que : est-ce qu’il y a un parcours client type avant d’acheter tel ou tel article ?

J’insiste donc vraiment sur le contexte et sur la recherche d’une problématique.

Une fois la problématique trouvée, il faut rechercher ses données. Les élèves vont pouvoir les trouver via leur entreprise mais peuvent également être trouvées à l’extérieur. Je peux toujours essayer de trouver des variables en plus.

Si par exemple j’analyse le chiffre d’affaires d’une entreprise, je peux me demander si la météo est un élément de variables à celui-ci. A ce moment-là je peux aller récupérer des données sur des informations concernant la météo et observer sur la partie modélisation si cela joue un rôle ou non sur mon chiffre d’affaires.

Comment est abordée tout cette partie algorithmie dans ton enseignement chez Jedha ?

Pour la partie modélisation sur le programme Essentials, on met en application trois algorithmes de Machine Learning.  

Le but est de trouver les variables les plus intéressantes pour un modèle.

La difficulté se trouve effectivement dans le modèle, car là est l’importance de montrer la réalité.

Un modèle prédit peu souvent à 90% et ce n’est pas grave ! Optimiser son modèle fait complètement partie du travail d’un professionnel de la Data.

J’insiste beaucoup là-dessus pour démystifier la Data. Il n’y a pas de bon ou de mauvais score.

Ce qui est important est déjà de faire mieux que la concurrence, et surtout de savoir si l’on a apporté une connaissance en plus pour notre gestionnaire.

Data Science = 1984 & son Big Brother ?

L’IA rejoint très souvent dans l'opinion publique le problème de l’éthique. La Data ne reste finalement qu’un outil. Il faut simplement savoir ce que l'on en fait et pourquoi. C’est le rôle de chacun d’entre nous de développer ses compétences et d’accompagner des entreprises qui sont en équilibre avec ces valeurs. C’est une question très personnelle finalement.

Dans l’analyse et la prédiction au sein d’un département RH par exemple, on pourrait très facilement se dire que ce n’est pas humain, qu'il faut donc faire attention. A garder en tête que le biais est toujours présent, et qu'il est humain, notamment dans les RH ! L'automatisation de tâches permet notamment pour les gestionnaires d'allouer plus de temps à des missions plus intéressantes en termes de management ou de gestion RH. 

Il n’y a donc pas vraiment de réponse type, il faut simplement se poser la question du pourquoi. Pourquoi est-ce que l'on veut faire du traitement de donnés sur cette problématique ?

Vous êtes intéressé par la Data ? N'hésitez pas à regarder nos formations Data

Rejoignez la communauté sur JULIE !

Python, SQL, gestion de projet Data, toutes les compétences à acquérir pour monter en compétences avec cours en ligne gratuits.

Marine Barrier
Écrit par
Marine Barrier
 - 
Directrice de campus
@ Jedha Lyon

Python : le language de programmation le plus
populaire parmi les professionnels de la Data !

Obtenez notre livre d'Introduction Pratique à Python !

Programmes, thématiques Data, admissions,
vous avez une question ?

Prenez rendez-vous avec nos équipes