Retour à l'accueil du blog
Qu'est-ce que la Data Science ?
1
 min
Monter en compétences
 Publié le 
27/5/2019

Qu'est-ce que la Data Science ?

Les termes d’Intelligence Artificielle, de Big Data, de Machine Learning fleurissent aux sein des projets menés par tous les acteurs, publics ou privés. Tous ces termes sont mis sous l’ombrelle de la Data Science. Analyser ses données clients, fournisseurs, partenaires etc devient vital pour les entités, et permet maintenant d’en prendre des décisions et directions bien plus éclairées

Une définition

La Data Science rassemble un ensemble de méthodes et outils permettant l’analyse d’un grand volume de données. Le cerveau humain étant incapable de gérer et de disséquer autant d’informations, les puissances de calcul qu’ont maintenant nos ordinateurs lambda le permettent !Un exemple : Calculer la moyenne ou la somme de 100 000 lignes Excel ? Bien qu’impossible pour le cerveau de l’Homme, très facile et rapide pour nos ordinateurs !

Autant de données ? Des débuts de l’humanité jusque 2005, nous avons crée 130 000 exabytes de données, soit 130 x 10^18, c’est à dire 13 avec 19 zéros qui le suivent !

Pour avoir un ordre d’idée, si l’on écrivant un énorme livre avec le papier de tous les arbres de la forêts amazonienne, on arriverait seulement à 1 exabytes de données.

qu'est-ce que la Data Science ?

La schématiser ?

Une des raisons pour lesquelles la Data Science et ses métiers sont aussi sollicités sur le marché, c’est la transversalité des compétences que demande la maîtrise de la discipline. Finalement, la Data Science se trouve au croisement de trois grands pans, tout à fait complémentaires dans le cadre d’un projet Data.

Les applications de la Data

Ses applications sont innombrables et nous entourent au quotidien.

  • La reconnaissance d’images de Facebook : plus besoin de rentrer le nom des personnes tagguées sur une photo, Facebook le fait pour vous, n’est-ce pas ?
  • Netflix :  un moteur de recommandation crée sur la base de ce que vous avez déjà aimé, ou regardé précédemment !
  • Uber : l’algorithme d’Uber permettra à votre chauffeur de prendre une personne en plus sur son chemin sans vous faire faire de grand détour.

En entreprise, ces mêmes applications sont tout aussi utilisées à 4 fins distinctes – entre autres – :

Intelligence Artificielle ? Big Data ? IA ?

Ces mots clés que l’on utilise très souvent se différencient largement l’un à l’autre.

La particularité d’Intelligence Artificielle réside dans l’ensemble des techniques utilisées pour imiter les mécanismes du cerveau humain,

que ce soit pour faire de la reconnaissance d’images avec le Deep Learning, réaliser des modèles de prédictions sur divers phénomènes grâce au Machine Learning (météo, comportement d’achat etc), ou bien traiter du texte pour par exemple repérer des commentaires abusifs. Les applications en sont innombrables, d’autant plus que les technologies nécessaires sont accessibles à tout un chacun.

Quant à lui, le terme Big Data se réfère à l’ensemble des méthodes utilisées pour analyser un volume bien plus grand de données. Alors que les outils classiques de gestion de données ne le permettent pas, évoluer dans un environnement Big Data requiert des puissances de calcul bien plus grandes.

Les technologies utilisées en sont différentes. Etoffez vos connaissances sur le Big Data avec cet article.

Les technologies à maîtriser ?

  • Programmation - Python & R sont les 2 grands langages grâce auxquels vous pourrez coder vos algorithmes !
  • Data Visualisation - Tableau est un outil vous permettant de réaliser des dashboards interactifs, afin de mieux comprendre vos données ou présenter vos résultats d’analyse à vos managers.
  • Machine Learning & Deep Learning - Programmer en Python vous permettra de coder des algorithmes pour faire des prédictions, faire de la reconnaissance d’images. Bien sûr derrière le Machine Learning se cache des concepts statistiques sur lesquels il faudra que vous soyez à l'aise. N'hésitez pas à consulter notre article sur comment devenir data scientist sans diplôme d'ingénieur.
  • Web Development : Apprenez à concevoir des applications web grâce au framework Flask.
  • Big Data : Apprenez à évoluer dans des environnements Big Data avec les frameworks Spark ou Hadoop. Vous devrez alors travailler sur des plateformes Cloud comme AWS (Amazon), Microsoft Azure, ou Google Cloud Platform.

Le recrutement

Selon une récente étude de Tencent, pour une personne formée en IA, ce sont 10 postes à pouvoir ! Ces métiers en analytiques sont de plus en plus sollicités (Data Engineer, Data Scientists, ou Data Analyst : tous les métiers expliqués dans cet article) car les projets IA des entreprises fleurissent, par exemple dans la constitution de leur Datalab.

Ce sont aussi bien les PME, start-up et grands groupes qui recherchent de tels profils, et tous les secteurs sont concernés : il y a autant d’applications de la Data Science qu’il existent de problématiques d’entreprise. Le décalage est tel entre l’offre et la demande dans les métiers de la Data que les salaires en sont largement impactés, les cabinets de recrutement spécialisés en Data fleurissent aussi, et les entreprises redoublent d’efforts pour garder leurs talents en Data chez elles !

En somme, un Data Scientist n’est jamais laissé sans projet. Quelques exemples ici avec les projets de nos alumni  🙂

Comment se former ?

Car ces métiers sont loin de faire partie d’une mode, et font déjà partie intégrante du processus décisionnel de toutes les entreprises. Teintée par cette image de « boîte noire » qu’elle peut avoir pour nous, la Data Science & ses outils sont voués à se démocratiser au sein des sociétés, et pas seulement dans leurs départements Data :

Les Data Scientists interviennent de manière transverse pour tous les métiers de l’entreprise, finance, marketing, produit, logistique & supply chain etc.

Une des nombreuses raisons pour lesquelles les Data Scientists se passionnent pour leur métier : les connaissances métiers acquises durant la réalisation de leur projet : compliqué de réaliser des prédictions sur la prédiction de prix d’appartements sans s’intéresser au marché de l’immobilier ! Toujours dans l’idée de démocratiser la discipline, les formations permettent d’acquérir ces compétences sollicitées :


Si vous souhaitez devenir Data Scientist, n'hésitez pas à lire notre articles sur les 4 stratégies pour devenir Data Scientist

Besoin d'un conseil carrière pour vous former en data ? 👋 Prenez rendez-vous avec nos équipes 👋

Rejoignez la communauté sur JULIE !

Python, SQL, gestion de projet Data, toutes les compétences à acquérir pour monter en compétences avec cours en ligne gratuits.

Myriam Emilion
Écrit par
Myriam Emilion
 - 
Directrice Marketing

Python : le language de programmation le plus
populaire parmi les professionnels de la Data !

Obtenez notre livre d'Introduction Pratique à Python !

Programmes, thématiques Data, admissions,
vous avez une question ?

Prenez rendez-vous avec nos équipes