Formation Data Engineer
Ajoutez une compétence clé à votre CV en vous formant au Data Engineering. En 150h, apprenez à concevoir et piloter des infrastructures data modernes et à grande échelle.
.webp)


Devenez un expert du Data Engineering
Les entreprises data-driven ne peuvent plus se contenter de pipelines bricolés. Elles recherchent des professionnels capables de concevoir des infrastructures data fiables pour exploiter leurs données à grande échelle.
En 150h, cette formation vous apprend à implémenter et opérer la Modern Data Stack (Airbyte, dbt, Delta Lake, S3) et vous prépare aux métiers de Data Engineer, Analytics Engineer ou Data Architect. À la fin de votre formation chez Jedha, vous serez en mesure de :
- Concevoir et opérer des pipelines data et workflows robustes et scalables
- Mettre en place des architectures lakehouse au service de l’analyse et de l’IA
- Garantir la qualité, la traçabilité, la sécurité et la gouvernance des données dans le temps

Le programme de notre bootcamp de Data Engineer
Contenu de la card compilé au chargement
Contenu de la card compilé au chargement
Data Governance
Ce module pose les bases de la gouvernance des données, indispensable pour construire des systèmes data fiables et durables. Vous aborderez les principes clés de la data governance, la structuration des données dès leur collecte, l’évaluation de la maturité data d’une organisation et l’intégration des contraintes réglementaires comme le RGPD.
À l’issue de ce module, vous serez en mesure de concevoir des pipelines data alignés avec les enjeux business, réglementaires et organisationnels.
Outils & Technologies
Compétences maîtrisées
- Principes fondamentaux de la gouvernance des données (DMBOK).
- Évaluation de la maturité data d’une organisation et définition d’une structuration adaptée.
- Intégration des contraintes réglementaires (RGPD).
- Rôle et usages des data catalogs au sein d’un écosystème data.
- Mise en place de la traçabilité et des responsabilités autour des données.
Big Data
Ce module marque un changement d’échelle : vous découvrirez comment les entreprises traitent de grands volumes de données grâce au calcul et au stockage distribués.
Vous apprendrez à manipuler des données avec Spark, à concevoir des infrastructures scalables et à arbitrer entre performance et consommation de ressources. Objectif : construire des systèmes capables de répondre à des contraintes industrielles réelles, dans une logique de sobriété et de frugalité.
Outils & Technologies
Compétences maîtrisées
- Principes du calcul et du stockage distribués appliqués aux architectures Big Data.
- Choix des stratégies de scalabilité : verticale vs horizontale.
- Manipulation de données volumineuses avec Spark (DataFrames et Spark SQL).
- Analyse des performances des traitements Big Data et identification des goulots d’étranglement.
- Optimisation de l’utilisation des ressources.
Modern Data Stack
Ce module constitue le cœur du programme. Vous apprendrez à concevoir et implémenter un Modern Data Stack complet, fondé sur des architectures ELT et Lakehouse.
De l’ingestion à la transformation, en passant par l’orchestration et la gestion des métadonnées, vous apprendrez à assembler les briques utilisées par les entreprises data-driven.
Outils & Technologies
Compétences maîtrisées
- Conception d’architectures ELT modernes.
- Mise en place de pipelines d’ingestion et de transformation avec dbt.
- Orchestration de pipelines data batch et événementiels avec Airflow.
- Implémentation d’architectures Lakehouse à partir de formats de tables modernes.
- Mise en œuvre de data contracts pour garantir la qualité et la stabilité des schémas.
Data Quality & CI/CD
Une donnée non fiable est une donnée inutilisable. Dans ce module, vous apprendrez à mettre en place les bonnes pratiques qui permettent de garantir la qualité des données en production.
Tests automatisés, validation de schémas, automatisation des contrôles et intégration continue deviennent des standards pour prévenir les incidents et assurer la fiabilité des données tout au long de vos pipelines Data.
Outils & Technologies
Compétences maîtrisées
- Mise en place de tests automatisés.
- Détection des anomalies, incohérences et ruptures de schéma.
- Automatisation des contrôles de qualité dans les pipelines CI/CD lors des évolutions du code.
- Exploitation des métadonnées et du lineage pour comprendre, documenter et sécuriser les pipelines data.
- Compréhension des rôles du métastore et du data catalog.
AI Engineering
Ce module vous permettra de devenir un Data Engineer capable de travailler efficacement avec des équipes d’IA et de Data Science. Vous apprendrez à concevoir des pipelines data capables d’alimenter des systèmes d’IA et de Machine Learning.
Données non structurées, vectorisation, recherche sémantique, fine-tuning et RAG : vous verrez comment intégrer les besoins spécifiques de l’IA dans une architecture data existante, de manière opérationnelle et scalable.
Outils & Technologies
Compétences maîtrisées
- Conception de pipelines data adaptés aux usages d’IA et de Machine Learning.
- Traitement de données non structurées (documents, PDF, images) pour des usages IA.
- Mise en œuvre de pipelines de vectorisation et de recherche sémantique.
- Implémentation d’architectures de type RAG.
- Compréhension des principes de fine-tuning et d’évaluation des systèmes IA.
Projet final
Vous conclurez votre apprentissage par un projet concret : la conception d’un pipeline de données complet alimentant un système d’IA. Vous mobiliserez l’ensemble des compétences acquises pour concevoir une architecture performante, implémenter les pipelines et garantir la qualité des données.
Vous repartirez avec un projet complet à intégrer à votre portfolio, directement valorisable auprès d’employeurs ou de clients.
Outils & Technologies
Compétences maîtrisées
- Conception de pipelines data adaptés aux usages d’IA et de Machine Learning.
- Traitement de données non structurées (documents, PDF, images) pour des usages IA.
- Mise en œuvre de pipelines de vectorisation et de recherche sémantique.
- Implémentation d’architectures de type RAG.
- Compréhension des principes de fine-tuning et d’évaluation des systèmes IA.
Une double reconnaissance de vos compétences
À l'issue de votre formation de Data Engineer, vous serez en mesure d'obtenir 2 types de certifications pour faire valoir vos compétences sur le marché du travail :
Téléchargez le programme de nos formations
- Excellence académique et technique
- Apprentissage par la pratique
- Formations adaptées à vos besoins
Rechargez la page et ressayez d'envoyer le formulaire.
Nos prochaines sessions de formation
Suivez votre formation à distance ou dans l'un de nos 17 campus à Paris, Lyon, Lille, Marseille, Bordeaux, Toulouse, Nantes et dans bien d'autres villes de France et d'Europe.
Temps plein
Temps plein
Temps plein
Temps partiel
Temps partiel
Temps partiel
Choisissez l’excellence pour vous former en data engineering



Reconversion réussie de Data Analyst à Data Engineer en freelance
A suivi la formation Data Lead
J'ai pu passer du métier de Data Analyst à celui de Data Engineer
Formation excellente donc le contenu est très bien structurée et permet de réellement progresser d'un point de vue compétences opérationnelles. L'équipe pédagogique est très compétente et investie dans le transmission des compétences. Je recommande donc fortement cette formation et Jedha qui m'ont permis de passer du métier de Data Analyst à celui de Data Engineer.
Voir plusReconversion réussie de Responsable fonctionnel à Data & AI Product Owner @ BNP Paribas
A suivi les formations Data Fullstack & Lead
L'ambiance est super, avec beaucoup d'échanges et d'entraide
Je recommande vivement : c'est du sérieux, très intensif (prévoyez de bien manger et dormir !) mais l'ambiance est super, avec beaucoup d'échanges et d'entraide. Le programme est riche et complet et la pratique complète systématiquement la théorie. La plateforme JULIE est excellente, je m'en sers toujours pour revoir des concepts ou retrouver des templates de code ! Les enseignants sont des professionnels passionnés, très pédagoques et disponibles.
Voir plusReconversion réussie de Head of Finance à Data Analyst @ Lemonway
A suivi les formations Data Essentials, Fullstack & Lead
Une école à la pointe et tournée vers l'avenir
J'ai choisi Jedha pour ma reconversion, et j'ai trouvé cette école vraiment à la pointe des technos et tournée vers l'avenir, toujours en quête d'amélioration.On m'a constamment poussé à dépasser mes limites, ce que j'ai beaucoup apprécié. Pour finir, l'école offre un accès à vie aux contenus de formation, régulièrement mis à jour, ce qui est un vrai plus !
Voir plusFormez-vous au Data Engineering à votre rythme
Montez en compétences facilement en Data Engineering. Formation en ligne ou Bootcamp : nous avons forcément une formation qui correspond à votre projet de reconversion !

Temps complet (1 mois)
insert-icon_pre-required_s24
Modalités
- 150h d'apprentissage en classe
- Lundi à vendredi, 9h30 - 18h
- À temps complet sur 1 mois
insert-icon_location_s24
Localisation
En ligne ou sur l'un de nos 17 campus
insert-icon_smiley_s24
Avantages
- Formation accélérée
- Esprit de promo
- Discipline de travail

Temps partiel (10 semaines)
insert-icon_pre-required_s24
Modalités
- 150h d'apprentissage hybride (travail en autonomie, cours, coaching)
- À votre rythme (2h par jour)
- À temps partiel sur 10 semaines
insert-icon_location_s24
Localisation
En ligne
insert-icon_smiley_s24
Avantages
- Adapté à vos contraintes pros et persos
- Apprentissage en autonomie
- Accessible partout dans le monde
Les débouchés de notre formation en Data Engineering
Cette formation vous permet d’accéder à des métiers de la Data plus techniques, très recherchés et difficilement remplaçables par l’IA. L’APEC a d’ailleurs classé le métier de Data Engineer parmi les « métiers Formule 1 » en 2026, ceux dont la croissance est la plus rapide en France.
Data Platform Engineer
Consultant Data
Analytics Engineer
Data Engineer

Vos questions sur les débouchés de la formation
Le Data Engineering enseignés par des professionnels
Les maîtres Jedha, ce sont eux ! Nos intervenants et nos créateurs de contenu sont des professionnels en activité dans le domaine de la Data. Ils disposent d'une véritable expertise technique qu'ils vous transmettent lors de la formation.


Eloïse Gomez
Senior Sales Engineer

Sébastien Benferhat
Senior Analytics & Optimization Manager

Sofiane Benchabane
Data Engineer

Vos questions sur la formation
Quelle différence entre un Data Engineer et un Data Scientist ?
Le Data Engineer est en charge de concevoir et gérer les infrastructures de données. Le Data Scientist se concentre lui sur l'analyse des données et la création de modèles prédictifs. Les deux rôles sont complémentaires et essentiels pour une gestion efficace des données et une prise de décision éclairée au sein de l'entreprise.
Comment devenir Data Engineer ?
Pour devenir Data Engineer, il n'est pas obligatoire de suivre une formation universitaire et d'obtenir un master en Data Engineering ou en Data Science. Chez Jedha, nous proposons des formations courtes, de type Bootcamp, qui permettent d'apprendre les fondamentaux de la science et de l'ingéniérie des données et de changer de carrière en quelques mois seulement.
Quel est le salaire d'un Data Engineer ?
Le salaire d'un Data Engineer est très variable. Il dépend de son expérience, de son lieu de résidence mais aussi de l'entreprise dans laquelle il travaille.En France, en 2023, le salaire moyen d'un Data Engineer était d'environ 53 000 euros brut par an selon Glasdoor. Cependant, dans les grandes villes comme Paris, le salaire moyen peut être plus élevé en raison du coût de la vie plus élevé.
Comment se déroule la journée type d'un Data Engineer ?
Les activités quotidiennes d'un Data Engineer comprennent la mise en place et l'optimisation de pipelines Data, la gestion des bases de données, et la prise en compte des retours et besoins des Data analysts et Data scientists.
Quelles compétences sont cruciales pour un Data Engineer ?
Pour devenir Data Engineer, il est nécessaire de maîtriser les langages de programmation comme Python et Java, d'avoir des compétences en ingénierie de données et en systèmes cloud.
Combien coûte la participation à votre formation en Data Engineering ?
Pour participer, des frais de formation de 4 000€ sont requis, applicables quelque soit le mode d'apprentissage et le rythme de formation choisis.
Quels sont les pré-requis pour rejoindre la formation Lead ?
Pour intégrer la formation Data Lead de Jedha, vous avez 2 options possibles :
- Vous suivrez la formation Lead dans les meilleures conditions si vous passez par la formation Fullstack en amont. Cette formation Lead de 70 heures enseigne des compétences de niveau expert en Data Engineering et un très solide set de connaissances et nécessaire. La formation Fullstack vous donnera toutes les clés pour avoir ce bagage.
- Pour que vous puissiez suivre la formation Lead sans avoir suivi la formation Fullstack, il vous faudra avoir l'arc de compétences équivalent. Vous enverrez un dossier de candidature à notre équipe d'admissions, cette dernière l'étudiera avant de valider votre inscription.
Pour avoir d'autant plus d'informations sur tout ceci, vous pouvez prendre rendez-vous avec notre équipe d'admissions.
150 heures de formations sont-elles suffisantes pour maîtriser les compétences en Data Engineering ?
En complément de la formation Data Fullstack de Jedha, l'objectif de cette formation Lead est bien de vous amener à un niveau expert dans la donnée, autant sur les pans Data Engineering que Data Science. Vous apprendrez dans cette formation à construire des infrastructures Data solides, adaptées à votre environnement et capables de supporter un volume de données important. L'idée n'est pas seulement de créer cette infrastructure, mais aussi de la maintenir en adéquation avec l'augmentation de la volumétrie de données que vous aurez.
Quel volume de travail dois-je fournir pendant cette formation ?
On ne le cache jamais, cette formation est dense et intense ! De nombreuses technologies sont amenées à être enseignées. Tout dépend du niveau duquel vous partez en entrant en formation (si vous avez réalisé le programme Fullstack en amont ou non). Environ 10 heures de travail supplémentaire seraient à fournir, entre les exercices, les cas pratiques, et projets Data Engineering à réaliser.
Peut-on prétendre à des postes de Data Engineer après la formation Data Lead ?
Les pré-requis de la formation Lead permettent justement de vous assurer les compétences nécessaires pour bien suivre la formation Lead. Avec les compétences nouvellement acquises dans cette formation dense, vous pourrez tout à fait postuler à des postes de Data Engineer ou encore Machine Learning Engineer.
En quelle langue sont délivrés les cours ?
Nos cours sont dispensés en français et tous nos professeurs et Teacher Assistants sont francophones. Pour la plupart des cours, nous proposons un replay en vidéo, enregistré par l'un de nos Lead Teachers, qui est également en français.
Néanmoins l'ensemble des ressources pédagogiques écrites (cours, exercices, projets) sur notre plateforme d'e-learning JULIE sont en anglais. Nous avons fait ce choix car l'anglais est la langue de travail de la majorité des professionnels de la Tech et qu'il est essentiel d'avoir un niveau minimum d'anglais pour continuer à vous auto-former après votre passage chez Jedha.
Pour suivre la formation, vous aurez donc besoin d'être à l'aise pour lire et comprendre des contenus en anglais, à savoir avoir un niveau B1/B2 en compréhension écrite en anglais.
Dois-je venir avec mon propre ordinateur ?
Nous ne fournissons pas d'ordinateur dans le cadre de nos formations. Il est donc essentiel que vous disposiez de votre propre machine et que celle-ci soit suffisamment puissante.
Vous trouverez ci-dessous les spécifications techniques minimales pour suivre la formation dans de bonnes conditions. Pour en savoir plus, et découvrir une sélection d’ordinateurs adaptés à nos formations, consultez notre article dédié.
- Système d'exploitation : Linux / Windows / MacOS. Les autres OS ne permettent pas de suivre la formation.
- RAM : 16 Go minimum.
- Stockage : SSD de 512 Go à 1 To.
- Processeur : Sur PC, Intel i5 minimum (idéalement Intel i7). Sur Mac, puces Apple Silicon M1 à M4. Évitez les processeurs Snapdragon (incompatibles avec la virtualisation).
Téléchargez le programme de nos formations
- Excellence académique et technique
- Apprentissage par la pratique
- Formations adaptées à vos besoins
Rechargez la page et ressayez d'envoyer le formulaire.

.webp)


.webp)
