Réponses Quiz - Vrai ou Faux ? Teste tes connaissances en Data !

Benoît Yèche
Par 
Benoît Yèche
Chief Marketing Officer
Dernière mise à jour le 
26
 
January
 
2024
Reconvertissez-vous dans la Data et donnez un tournant à votre carrière !
Découvrir nos formations
Réponses Quiz - Vrai ou Faux ? Teste tes connaissances en Data !
Sommaire

Vous venez de tester vos connaissances en Data à l'aide de notre quiz ? Découvrez les bonnes réponses et bien plus sur chacune des affirmations du quiz !

Et si vous souhaitez vous former en Data en 2025, découvrez nos principales formations dans le domaine :

Reconvertissez-vous dans la Data et donnez un tournant à votre carrière !
Découvrir nos formations
Formations DataFormations Data

La data science est née de la rencontre entre les statistiques et l’informatique - VRAI

Les premiers appels à la création d’une nouvelle science de l’analyse de données remontent au statisticien John Tukey dans les années 60. Mais c’est le statisticien Jeff Wu qui a véritablement popularisé le terme « data science » en 1997, plaidant pour « l’union de la statistique appliquée et de l’informatique ». Depuis le champ de la Data Science réunit des compétences en statistiques avec la puissance et polyvalence des outils numériques !

Les données structurées sont des données stockées de manière organisée, par exemple dans des lignes et des colonnes - VRAI

Les données structurées sont organisées selon un format précis, souvent sous forme de tableaux (lignes et colonnes) dans des bases de données ou des fichiers Excel. Cette organisation facilite leur exploitation ! À l’inverse, les données non structurées (comme des images ou des textes libres) sont plus difficiles à exploiter automatiquement.

Ajouter toujours plus de variables à un modèle de machine learning améliore forcément sa précision - FAUX

Ajouter trop de variables peut au contraire rendre un modèle moins performant : c’est ce qu’on appelle le fléau de la dimension (ou “curse of dimensionality”).

Quand il dispose de trop de données, le modèle risque de « surapprendre » les données d’entraînement et de mal généraliser sur de nouveaux cas (on parle d’overfitting). Il vaut mieux sélectionner les variables les plus pertinentes pour obtenir un modèle robuste.

Il faut être excellent en maths pour travailler dans la Data - FAUX

Contrairement à certaines idées reçues, il n'est pas nécessaire d'être un génie en maths (ou d’avoir fait S, ou prépa) pour travailler dans la data.

Le niveau de mathématiques requis dépend avant tout du poste que vous souhaitez occuper dans la Data, et va d’un niveau basique en statistique & logique pour devenir Data Analyst, à un niveau plus avancé en maths pour devenir Data Scientist. Avec la bonne méthode, les concepts mathématiques nécessaires en Data peuvent être appris par tous.

Aujourd’hui, Python est le langage le plus utilisé en entreprise pour les projets Data, loin devant R - VRAI

Python s’est imposé comme la référence en Data Science grâce à sa simplicité de prise en main, sa polyvalence et la richesse de ses bibliothèques (Pandas, Scikit-learn, TensorFlow, etc.), et cela même dans le monde de la recherche qui privilégiait jusqu’alors R.

D’après Stack Overflow, plus de 50 % des développeurs déclarent avoir utilisé Python l’an dernier, contre environ 4 à 5 % pour R. Python est donc le langage à maîtriser absolument pour travailler dans la Data en 2025. Pour en savoir plus, vous pouvez consulter notre article sur quel langage apprendre en Python et R en 2025 !

La moyenne est un meilleur indicateur de tendance centrale que la médiane - FAUX

Le problème avec la moyenne, c’est que c’est un indicateur très sensible aux valeurs extrêmes (les “outliers” en anglais) : par exemple, le salaire très élevé du manager peut fausser le salaire moyen d’une équipe !

La médiane, qui correspond à la valeur centrale d’un ensemble (le 50ème décile), est souvent plus représentative quand les données sont déséquilibrées ou contiennent des « outliers ».

La façon de fonctionner des modèles d'IA s'inspire du fonctionnement de notre cerveau et de nos neurones - VRAI

C'est vrai : les réseaux de neurones artificiels, qui sont une composante fondamentale de nombreux modèles d'IA, sont effectivement inspirés par la structure et le fonctionnement des neurones biologiques dans le cerveau humain.

Mais attention les modèles d'IA actuels sont encore très simplifiés par rapport à la complexité du cerveau humain : ils s'inspirent donc du fonctionnement de notre cerveau, mais ils ne fonctionnent pas exactement de la même manière que celui-ci !

L’IA permet aux professionnels de la Data d’automatiser les tâches répétitives (collecte, nettoyage de la donnée) et de se concentrer sur les tâches stratégiques - VRAI

Depuis l’apparition de ChatGPT, les avancées dans le domaine se multiplient à un rythme très rapide. Les outils d’analyse de données et de data visualisation intègrent désormais des fonctionnalités capables d’automatiser les tâches les plus chronophages : tri, nettoyage ou encore enrichissement des données.

Ce gain de temps permet aux Data Scientists et aux Data Analysts de se concentrer sur l’interprétation, l’optimisation des modèles et la prise de décisions, autant d’étapes stratégiques qui nécessitent toujours une expertise humaine.

Les algorithmes de Machine Learning sont neutres et objectifs - FAUX

Les modèles d’Intelligence Artificielle amplifient les biais présents dans leurs données ou leur conception. Par exemple en 2018 Amazon a abandonné un outil d'IA pour le recrutement après avoir découvert qu'il discriminait les femmes.

Il pénalisait les CV contenant des termes associés aux femmes car il avait été entraîné sur des CV majoritairement masculins. Ce cas est devenu un exemple emblématique des risques de biais dans les systèmes d'IA.

Il est nécessaire de savoir coder pour utiliser un outil de data visualisation comme Power BI - FAUX

Power BI a été conçu par Microsoft comme un outil de Business Intelligence accessible à tous, même sans compétence en programmation. Exactement comme peuvent l’être d’autres outils de la suite Office. Pour cela, Power BI propose des connecteurs prêts à l’emploi pour collecter des données et une interface drag-and-drop pour créer des dashboards.

Des fonctionnalités plus avancées, comme les formules DAX ou les scripts Pythons intégrés, existent mais elles ne sont absolument pas indispensables pour débuter sur Power BI !

Soirée Portes Ouvertes Jedha BootcampSoirée Portes Ouvertes Jedha Bootcamp
Benoît Yèche
Benoît Yèche
Chief Marketing Officer
Benoît est le Chief Marketing Officer de Jedha Bootcamp depuis décembre 2022. Diplômé d'HEC et Sciences Po Paris, il s'est spécialisé dans le marketing et les start-ups. Passionné de Data Marketing et des sujets liés à la formation continue, il a rejoint Jedha pour développer la notoriété de l'école de référence en Data et en Cybersécurité !

Articles recommandés

Testez vos connaissances en Data en 3 minutes 📊
Faire le quiz