Les applications de la Data au sport
4
 min
Projet data
 Publié le 
30/3/2021

Les applications de la Data au sport

Vous seriez étonné de voir les vastes univers que couvrent les use cases de la Data ! Et pour preuve, parlons aujourd'hui de la Data dans le sport. Dans la communauté d'élèves de Jedha, les fans de sport n'hésitent d'ailleurs pas à y mettre en application leurs compétences nouvellement acquises en Data Visualisation, Machine Learning, développement & déploiement d'applications.

Reconnaissance automatique de positions de Yoga

Marine Gubler - Promotion Fullstack #3

Mêler Data et passion personnelle, c’est ce qu’a fait Marine dans ce projet.  Elle a développé ici une application permettant de détecter automatiquement les positions de Yoga, afin d’en améliorer la posture : utile pour tous les apprentis yogi ! Etant donné que certaines positions de Yoga sont des mix entre 2 ou 3 autres, Marine a voulu aller plus loin en calculant également les probabilités pour que telle position soit un mix entre un triangle et une planche (par exemple).

Entraîné sur des millions d’images, le réseau de neurones que Marine a utilisé permettra de mener cette prédiction à bien. Elle a donc créé un modèle dont elle a modifié les 2 dernières couches du réseau de neurones pour adapter le modèle à sa problématique, puis a réalisé une fonction d’activation afin de faire une classification (telle image correspond à telle position, ou classe).

Avec ce modèle, Marine a pu obtenir ses probabilités, et non pas seulement la classe d’une position de yoga. Par exemple : 

Une position peut être un mix entre plusieurs, un exemple ici !


Maintenant place à une Demo live avec la vidéo du projet de Marine présenté lors de son Demoday !


Optimiser sa stratégie de paris sportifs dans le football

Mohamed Zebli - Promotion Fullstack #5

L’objectif du projet de Mohamed ? Approximer le résultat d’une rencontre sportive et déterminer une stratégie de paris sportifs lorsque l’on joue sur des paris plus complexes sur plusieurs rencontres en même temps (par exemple les cas de paris multiples : gain = mise * ensemble des côtés). Quelle méthodologie a-t-il adoptée ?

  • Collecte de la donnée : Mohamed a pu scrapper (extraire les données du web) l’ensemble des résultats de rencontres des 1e et 2e division de 5 pays (Angleterre, France, Espagne, Italie & Allemagne) entre 2017 et 2020 (3 saisons), pour un total de 10600 rencontres, soit 10600 données ! En retenant la côte pour chacune des issues possibles (Victoire de l’équipe 1, de l’équipe 2 ou match nul), ainsi que l’état de forme des 2 équipes, c'est un total de 55 variables avec lesquelles il travaille pour chacune des 10 600 rencontres.
  • Modélisation : un réseau de neurones a été utilisé pour traiter des données textuelles (Pays par exemple) ET numériques (Issue par exemple). Avec non moins de 6 couches, son réseau de neurones va prendre en compte ces 55 variables.
  • Testons avec des données que le modèle n’a jamais vu ! Après soumissions de 59 rencontres qu’il n’a jamais traitées, Mohamed a obtenu de bonnes prédictions de 66% (39 bonnes prédictions).

Dans un contexte réel sur ces rencontres, si Mohamed avait misé 1€ sur chacune d’entre elles, le gain aurait été de 107€, soit une rentabilité intéressante de 87% ! Apprentissage par renforcement, prise de décision dans les paris, de belles pistes de développement pour le projet de Mohamed ! La vidéo du projet de Mohamed, c'est par ici.



Prédiction de performances en force athlétique

Gwénaëlle Breton - Promotion Essentials #20 - L'article complet

Que ce soit pour les athlètes ou les clubs de force eux-mêmes, savoir en avance comment un athlète va performer a plusieurs objectifs : gestion des budgets, matériel à acheter, marge de progression de certains athlètes. Dans ce projet, nous entendons par performance la charge maximale en kilogramme qu’un athlète va pouvoir soulever. 

Travaillant sur plus de 25 000 performances (données), Gwénaëlle a choisi les variables d’âge, de catégorie de poids, de poids et de sexe. Prédisons ici les performances sur la troisième saison basée sur celle des 2 premières. 

Gwénaëlle réalise donc un modèle de Machine Learning : une régression linéaire (voulant prédire une performance en kilogrammes) multiple (car basée sur plusieurs variables : le poids, l’âge, le sexe etc.) Après avoir lancé son modèle sur 1121 athlètes, Gwénaëlle a pu obtenir des prédictions tout à fait cohérentes avec la réalité. 

A partir de ces prédictions sur 3 mouvements de force (Squat, Bench et Deadlift), elle a également pu déterminer la composition d’une équipe idéale pour chacune des positions, ayant les meilleures performances. A en voir l'article qu'elle a produit suite au rendu de son projet Essentials.



Footmatcher, l’assistant recrutement - Système de recommandation de joueurs de football pour optimiser les recrutements

Ugo, Nicolas, Olivier & Christophe - Promotion Fullstack #18

Avis à tous les amateurs de football ! Optimiser les recrutements de joueurs  permettront au clubs de fidéliser les joueurs et d’éviter ce que l’on appelle du churn (un joueur quittant le club peu de temps après y avoir été recruté). Pour optimiser ces recrutements, des recruteurs expérimentés bénéficient de très nombreuses données relatives aux joueurs (caractéristiques cognitives, psychologiques, mais aussi sportives - vitesse, activité, endurance, recrutements passés, agressivité etc). Dans ce projet, notre quatuor va tenter d’analyser ces données puis construire des modèles de Machine Learning pour recommander les meilleurs profils aux club en fonction des besoins en remplacement.

Place maintenant à le Demo ! 

The secret sauce de notre quatuor ? Après avoir collecté la donnée, réduit la dimension pour passer d’une centaine de variables à moins de 10 composantes afin de faciliter l’analyse, ils ont pu construire un algorithme de clustering. Celui-ci permettra de regrouper des joueurs ayant des caractéristiques similaires, afin de pouvoir les recommander au mieux à un recruteur ayant des besoins spécifiques pour un remplacement. 

Un bel avenir pour ce projet qui pourrait bénéficier d’autres méthodes de recommandation, voire d'industrialisation et d'automatisation de la collecte de ces données. Le projet complet de notre quatuor !


Prédiction le tableau des médailles des Jeux Olympiques 2021

Afchine Said - Promotion Fullstack #18

Passionné de sport ? Vous souhaitez réaliser des paris sportifs ? Vous souhaitez connaître par avance les résultats les plus probables dans le tableau des médailles ? Suite au report des JO de 2020, Afchine va tenter de prédire le tableau des médailles pour les JO de Tokyo 2021. Quelle méthodologie a-t-il utilisée ? 

  • Collecte de la donnée : 3 CSVs complets dont la liste des athlètes et leurs caractéristiques, la liste des pays inscrits au CIO, et la liste des pays hôtes des JO (accueillir les JO a un impact conséquent sur les performances des athlètes locaux). 
  • Exploration de la donnée : mieux comprendre les variables les plus importantes et ainsi construire un solide modèle. Le contexte géopolitique influe énormément (des pays n'existant plus - Allemagne, URSS), et l’effet boost lorsqu’un pays accueille les JO se fait largement ressentir.
  • Le modèle : Afchine a ici utilisé un modèle de régression linéaire multiple, obtenant de très bonnes performances, de 82% !
  • Et concrètement ? Afchine nous présente ses prédiction pour le tableau des médailles 2021….voyez en le résultat dans la vidéo ci-dessous !

Rejoignez la communauté sur JULIE !

Python, SQL, gestion de projet Data, toutes les compétences à acquérir pour monter en compétences avec cours en ligne gratuits.

Myriam Emilion
Écrit par
Myriam Emilion
 - 
Directrice Marketing @
Jedha Bootcamp

Python : le language de programmation le plus
populaire parmi les professionnels de la Data !

Obtenez notre livre d'Introduction Pratique à Python !

Programmes, thématiques Data, admissions,
vous avez une question ?

Prenez rendez-vous avec nos équipes