Quatre élèves en Fullstack vous présentent leur projet liant la Data et le football ! Tous passionnés de football, ils vous expliquent les stratégies qu'ils ont mis en place afin d'optimiser les recrutements pour les joueurs du football et n'hésitent pas à y mettre leurs compétences acquises en déploiement d'application. Un projet passionnant que nous découvrons dans cet article.
Système de recommandation de joueurs de football
Olivier Gara, Nicolas Gonfalone, Christophe Lefort et Ugo Rabenjamina - Promotion Fullstack #18
Commencez tout d'abord par imaginer votre prochaine recherche d'emploi. Le recruteur dispose d’une multitude d’informations à votre sujet. Des informations sur votre niveau d'agressivité, votre tolérance au stress, et même des informations sur vos dernières évaluations individuelles dont vous avez fait l’objet. Cela représente un puit d'informations intéressantes pour le recruteur.
Le monde du football a ceci de particulier : ces données sont disponibles. Il faut pour cela un certain savoir-faire pour pouvoir les récolter, les réconcilier et les croiser pour en tirer des informations pertinentes.
- Traditionnellement, le recrutement dans le football s’appuie sur des recruteurs expérimentés qui ont la capacité pour aller détecter les joueurs à potentiel. La question qui se pose est comment reconnaître un bon joueur. Est-ce simplement un joueur qui marque le plus de but ou qui récolte le plus de trophées ? Une telle approche serait simpliste. Derrière cette question, il y a un double enjeu.
- Le premier enjeu est celui de maximiser les chances de succès d’un recrutement. On touche ici à un sujet tabou dans certaines entreprises. Ce sont les lourdes conséquences d’un recrutement qui a échoué : impact sur le moral d'autres joueurs, perte conséquente d'argent, manque à gagner important du fait de ne pas avoir recruté un autre joueur.
- Le deuxième enjeu est celui de la préparation de l’avenir. Comment peut-on détecter les signaux faibles , afin d’identifier les profils sous-évalués et qui peuvent faire l’objet d’un recrutement opportun ?
C'est à ce moment précis qu'intervient FootMatcher : l'idée est de prendre un joueur de référence que l’on souhaite remplacer, car il est voué à être transféré. Nous lançons alors un algorithme de recommandation qui prendra en compte des données techniques, physiques et psychologiques du joueur de manière à avoir une liste de profils similaires, ainsi qu'à réaliser des recommandations à l’utilisateur pour lui permettre de trouver le joueur adéquat.
L’interface FootMatcher
L’idée est dans un premier temps de mettre un critère discriminatoire qui va être le poste et en fonction des antécédents des joueurs. Par la suite, nous pourrons sélectionner et filtrer sur un certain nombre de joueurs dans l’ensemble de notre Data set. Par exemple, Memphis Depay qui est l’attaquant Olympique Lyonnais, en contrat à la fin de la saison et qui a de grandes chances de partir et Luis Muriel qui est le joueur de l’Atalanta Bergame. Il s’agit d’un profil similaire, car il joue au même poste que Memphis Depay, en tant qu'Avant-Centre. Lorsqu’on clique sur ce joueur, nous avons un tableau récapitulatif des deux joueurs, nous avons l’âge, le poste, la valeur marchande, matchs joués et minutes jouées. On se rend compte que Luis Muriel a joué plus de match, néanmoins il a joué moins de minutes. C'est-à-dire qu’il est plus souvent remplaçant que Memphis Depay.
Chaque ordonnée de chaque métrique va être proportionnelle aux joueurs qui sont comparés, donc on voit que le graphique montre la comparaison entre les deux joueurs. Toutes ces informations et graphiques dépendent de ce que l’on veut pour son équipe. On peut vouloir d'un joueur qu'il prenne plus part à la construction de l'équipe ou d’un joueur qu'il soit plus dans la répétition des efforts, les courses et le dribble potentiellement.

Parlons de la recette de la secret sauce !
Regardons ensemble les composantes de la "secret sauce". Il en existe trois principales :
2 sources de données :
WyScout , une base de données extrêmement complexe qui est utilisée par de nombreuses fédérations de football et également de l’observatoire du sport. Leur collecte se fait directement au bord des terrains, tout simplement par des professionnels, et même certains analystes avec des grilles d’observations, bien entendu plus spécifiques. Ils fournissent des informations sur plus de 250 compétitions et dans le même temps sur les performances de chaque joueur professionnel.
Football manager, la porte de football manager est une des plus-values. En effet, le célèbre jeu est également un grand service, car il fournit des éléments sur les dimensions cognitives, psychologiques et athlétiques permettant de compléter les caractéristiques et les différentes informations sur le joueur professionnel. Ce qui faut bien comprendre est que comparer des centaines, voire des milliers de joueurs même avec de nos informations, s’avère extrêmement fastidieux.
Réduction de dimensions: permet de réduire cette complexité en identifiant des composantes issues des variables d'origine.
Méthode de “clustering”: cet algorithme identifie des groupes de joueurs les plus similaires possibles au regard des composantes choisies.
Les trois principales pistes d'améliorations
Bien évidemment, le nouveau FootMatcher reste perfectible. Voici les trois principaux axes de travail :
- Méthodologie de recommandation : Il s’agit de la pureté des données. Ici, nous nous appuyons sur des données avancées de match via les informations WyScout. Cela représente plutôt des variables techniques, toutes les autres données s'apparentant aux données physiques et psychocognitifs qui sont extrêmement importantes sur le foot professionnel et qui pour elles proviennent de football manager déjà soumises à l'interprétation. L’idéal est d’avoir des données plus robustes. Pour cela il faut récupérer des données auprès des préparateurs physiques pour avoir des informations sur les capacités cardio-respiratoires des joueurs, sur la vitesse, la détente ou développer de simples tests psychocognitifs adaptés à la pratique d’un sport professionnel cognitif de haut niveau comme le football par exemple.
- Une approche par complémentarité (par opposition à l’approche en similarité) : L'idée est de développer une métrique pour évaluer le niveau de complémentarité au sein d’un effectif modulable, suivant la philosophie de jeu que désire un entraîneur voulant avoir le profil d’un joueur plus agressif que le précédant. Il existe tout un axe de réflexion par rapport à cela.
- Industrialisation du processus ETL : L'application de recommandation Footmatcher. Le marché des joueurs étant en constante évolution, de par les performances des joueurs, par leurs valeurs marchandes fluctuantes. Pour cela, il faut mettre en place de nombreux outils à disposition pour pouvoir avoir une interface dynamique qui communique en temps réel.
Si vous souhaitez acquérir les compétences en Data recherchées des recruteurs , n'hésitez pas à vous informer sur toutes nos formations Data Science et à télécharger notre syllabus !