Formation Data Engineering
Ajoutez une compétence cruciale à votre CV en vous formant au Data Engineering. En 150h de formation, maîtrisez les bases du métier de Data Engineer et validez vos compétences avec notre certification reconnue par l'État.
.webp)


Devenez un expert du Data Engineering
Vous travaillez déjà dans la Data ? Développez une double-compétence très demandée ! En 2025, les entreprises recherchent des profils hybrides entre Data Scientist et Data Engineer. En 150h, obtenez des bases solides en Data Engineering et Deep Learning.
À la fin de votre formation Data Science Lead chez Jedha, vous serez en mesure de :
- Déployer de manière robuste vos applications avec Docker et Kubernetes
- Construire un pipeline Data pour analyser les données générées par vos applications
- Automatiser et monitorer vos modèles de Machine Learning

Le programme de notre formation Data Engineer
Contenu de la card compilé au chargement
Contenu de la card compilé au chargement
Data Governance
Ce module vous permettra de comprendre les enjeux liés au data management et d’accompagner les entreprises dans la mise en place d’une gouvernance des données efficace.
Vous apprendrez à évaluer la maturité d’une entreprise en matière de gestion des données, à structurer ses équipes data en fonction des besoins et à assurer la conformité aux réglementations en vigueur (RGPD, AI Act, etc.).
Outils & Technologies
Compétences maîtrisées
- Conception et mise en place d’une politique de Data Gouvernance.
- Évaluation des risques à l’aide d’audits de data management.
- Structuration et évolution des équipes data en fonction des enjeux métiers et business.
- Mise en conformité des pratiques avec les réglementations en vigueur.
Déploiement & ML Distribué
Dans ce deuxième module, vous découvrirez comment déployer votre application d’IA sur n’importe quel serveur grâce à Docker. La maîtrise de Kubernetes vous permettra de vous assurer qu’elle fonctionne bien à l’échelle.
Vous apprendrez également à booster vos modèles grâce à Ray, un Framework de ML distribué. Cela vous permettra de travailler sur des modèles de Machine Learning et Deep Learning plus complexes.
Outils & Technologies



Compétences maîtrisées
- Déploiement d'applications à l'aide de Docker et Kubernetes.
- Distributed Machine Learning & Deep Learning avec le framework Ray.
Architecture des bases de données
Dans ce module, vous apprendrez à concevoir et déployer différentes architectures de bases de données en fonction des besoins métiers. Vous découvrirez les bases de données transactionnelles (OLTP), analytiques (OLAP) et NoSQL, ainsi que leurs cas d’usage respectifs.
À l’issue de ce module, vous serez ainsi capable de structurer efficacement les données pour optimiser leur stockage, leur accès et leur analyse.
Outils & Technologies



Compétences maîtrisées
- Déploiement d’infrastructures OLTP à l'aide de Postgres.
- Déploiement d’infrastructures OLAP à l’aide d’une data warehouse comme Snowflake.
- Déploiement d’infrastructures NoSQL à l’aide d’un logiciel de gestion de base de données NoSQL comme MongoDB.
Data Pipelines
Une fois votre application en production, elle génère une grande quantité de données qu'il faut collecter, transformer et acheminer efficacement.
Dans ce module, vous apprendrez à concevoir et mettre en place des pipelines de données robustes, en comprenant les différences entre les architectures ETL et ELT, ainsi que leurs cas d’usage. Vous appliquerez ces concepts en pratique sur Airbyte.
Outils & Technologies


Compétences maîtrisées
- Compréhension des pipelines de données : différences entre ETL (Extract, Transform, Load) et ELT (Extract, Load, Transform), cas d’usage et bonnes pratiques.
- Mise en place de processus ELT : extraction, chargement et transformation des données avec Airbyte sur Kubernetes.
Automation & Workflow
Vous découvrirez la puissance des automatisations pour gagner en efficacité ! Vous apprendrez à créer des automatisations entre applications à l’aide d’outils comme Airflow, et découvrirez les bonnes pratiques.
Vous apprendrez également comment utiliser Airflow pour automatiser votre pipeline Data.
Outils & Technologies

Compétences maîtrisées
- Automatisations entre applications : bonnes pratiques & création de workflows avec Airflow.
- Automatisation de votre pipeline Data : utilisation d’Airflow.
Reinforcement Learning
Dans ce module, vous découvrirez le Reinforcement Learning, une branche avancée de l’IA qui permet à un agent d’apprendre par essais et erreurs pour maximiser une récompense. Utilisé pour l’amélioration des modèles de langage (LLM) tels que ChatGPT, le Reinforcement Learning est à l’origine d’avancées majeures ces dernières années.
Vous apprendrez également à créer votre propre environnement de développement et à améliorer la puissance et vitesse de calcul de vos modèles.
Outils & Technologies


Compétences maîtrisées
- Utilisation des bibliothèques PyTorch et trl pour entraîner des modèles de Reinforcement Learning.
- Déploiement et gestion d’environnements de calcul avancés avec Docker et Kubernetes.
- Création et personnalisation d’environnements avec OpenAI Gym.
MLOps
Dans ce module, vous apprendrez à industrialiser vos modèles de Machine Learning en automatisant chaque étape : le testing, l’intégration et le déploiement continus (CI/CD), l’entraînement automatisé (Continuous Training) et le monitoring.
Vous adopterez les meilleures pratiques de MLOps pour garantir des modèles performants, fiables et faciles à maintenir en production.
Outils & Technologies


Compétences maîtrisées
- Écriture et exécution de tests automatisés avec pytest.
- Mise en place de pipelines CI/CD avec Jenkins.
- Continuous Training avec Jenkins et Mlflow.
- Monitoring des performances des modèles avec Evidently AI.
Projet final
Lors de ce projet final, vous mettrez à profit l’ensemble des connaissances acquises au cours du module MLOps et des modules précédents afin de construire une pipeline de données incluant une pipeline d’IA entièrement automatisée.
Outils & Technologies
Compétences maîtrisées
- Créer une data pipeline automatisée.
- Développer une ML pipeline automatisée.
Obtenez une certification Bac+5
À l'issue de votre formation de Data Engineer, vous serez en mesure d'obtenir 2 types de certifications pour faire valoir vos compétences sur le marché du travail :
Téléchargez le syllabus de nos formations
- Excellence académique et technique
- Apprentissage par la pratique
- Formations adaptées à vos besoins
Rechargez la page et ressayez d'envoyer le formulaire.
Nos prochaines sessions de formation
Suivez votre formation à distance ou dans l'un de nos 17 campus à Paris, Lyon, Lille, Marseille, Bordeaux, Toulouse, Nantes et dans bien d'autres villes de France et d'Europe.
Temps plein
Temps plein
Temps plein
Temps partiel
Temps partiel
Temps partiel
Choisissez l’excellence pour vous former en data engineering





Reconversion réussie de Data Analyst à Data Engineer en freelance
A suivi la formation Data Science Lead
J'ai pu passer du métier de Data Analyst à celui de Data Engineer
Formation excellente donc le contenu est très bien structurée et permet de réellement progresser d'un point de vue compétences opérationnelles. L'équipe pédagogique est très compétente et investie dans le transmission des compétences. Je recommande donc fortement cette formation et Jedha qui m'ont permis de passer du métier de Data Analyst à celui de Data Engineer.
Voir plusReconversion réussie de Responsable fonctionnel à Data & AI Product Owner @ BNP Paribas
A suivi les formations Data Science Fullstack & Lead
L'ambiance est super, avec beaucoup d'échanges et d'entraide
Je recommande vivement : c'est du sérieux, très intensif (prévoyez de bien manger et dormir !) mais l'ambiance est super, avec beaucoup d'échanges et d'entraide. Le programme est riche et complet et la pratique complète systématiquement la théorie. La plateforme JULIE est excellente, je m'en sers toujours pour revoir des concepts ou retrouver des templates de code ! Les enseignants sont des professionnels passionnés, très pédagoques et disponibles.
Voir plusReconversion réussie de Head of Finance à Data Analyst @ Lemonway
A suivi les formations Data Science Essentials, Fullstack & Lead
Une école à la pointe et tournée vers l'avenir
J'ai choisi Jedha pour ma reconversion, et j'ai trouvé cette école vraiment à la pointe des technos et tournée vers l'avenir, toujours en quête d'amélioration.On m'a constamment poussé à dépasser mes limites, ce que j'ai beaucoup apprécié. Pour finir, l'école offre un accès à vie aux contenus de formation, régulièrement mis à jour, ce qui est un vrai plus !
Voir plusFormez-vous au Data Engineering à votre rythme
Montez en compétences facilement en Data Science & Data Engineering. Formation en ligne ou Bootcamp : nous avons forcément une formation qui correspond à votre projet de reconversion !

Temps complet (1 mois)
insert-icon_pre-required_s24
Modalités
- 150h d'apprentissage en classe
- Lundi à vendredi, 9h30 - 18h
- À temps complet sur 1 mois
insert-icon_location_s24
Localisation
En ligne ou sur l'un de nos 17 campus
insert-icon_smiley_s24
Avantages
- Formation accélérée
- Esprit de promo
- Discipline de travail

Temps partiel (3 mois)
insert-icon_pre-required_s24
Modalités
- 150h d'apprentissage hybride (travail en autonomie, cours, coaching)
- À votre rythme (2h par jour)
- À temps partiel sur 3 mois
insert-icon_location_s24
Localisation
En ligne
insert-icon_smiley_s24
Avantages
- Adapté à vos contraintes pros et persos
- Apprentissage en autonomie
- Accessible partout dans le monde
Les débouchés de notre formation en Data Engineering
Notre formation en Data Engineering vous permettra d'atteindre un niveau d'expertise plus élévé et d'accéder à des métiers plus techniques dans le domaine : Data Engineer, Machine Learning Engineer, ML Ops.
C'est la suite parfaite à donner à votre carrière de Data Scientist, ou si vous venez de suivre une formation pour devenir Data Scientist.
Machine Learning Ops
AI Engineer
ML Engineer
Data Engineer

Vos questions sur les débouchés de la formation
La Data Science et le Data Engineering enseignés par des professionnels
Les maîtres Jedha, ce sont eux ! Nos intervenants et nos créateurs de contenu sont des professionnels en activité dans le domaine de la Data. Eux-mêmes Lead Data Scientist ou Data Engineer, ils disposent d'une véritable expertise technique en Data Engineering qu'ils vous transmettent lors de la formation.


Smaïl Darbane
Machine Learning Engineer

Sofiane Benchabane
Data Engineer

Charles Tanguy
Lead Teacher

Vos questions sur la formation
Quelle différence entre un Data Engineer et un Data Scientist ?
Le Data Engineer est en charge de concevoir et gérer les infrastructures de données. Le Data Scientist se concentre lui sur l'analyse des données et la création de modèles prédictifs. Les deux rôles sont complémentaires et essentiels pour une gestion efficace des données et une prise de décision éclairée au sein de l'entreprise.
Comment devenir Data Engineer ?
Pour devenir Data Engineer, il n'est pas obligatoire de suivre une formation universitaire et d'obtenir un master en Data Engineering ou en Data Science. Chez Jedha, nous proposons des formations courtes, de type Bootcamp, qui permettent d'apprendre les fondamentaux de la science et de l'ingéniérie des données et de changer de carrière en quelques mois seulement.
Quel est le salaire d'un Data Engineer ?
Le salaire d'un Data Engineer est très variable. Il dépend de son expérience, de son lieu de résidence mais aussi de l'entreprise dans laquelle il travaille.En France, en 2023, le salaire moyen d'un Data Engineer était d'environ 53 000 euros brut par an selon Glasdoor. Cependant, dans les grandes villes comme Paris, le salaire moyen peut être plus élevé en raison du coût de la vie plus élevé.
Comment se déroule la journée type d'un Data Engineer ?
Les activités quotidiennes d'un Data Engineer comprennent la mise en place et l'optimisation de pipelines Data, la gestion des bases de données, et la prise en compte des retours et besoins des Data analysts et Data scientists.
Quelles compétences sont cruciales pour un Data Engineer ?
Pour devenir Data Engineer, il est nécessaire de maîtriser les langages de programmation comme Python et Java, d'avoir des compétences en ingénierie de données et en systèmes cloud.
Quelle est le rôle d'un Data Engineer ?
Le Data Engineer est responsable de la conception, de la construction et de la maintenance des infracstructures de traitement de la donnée. Son travail contribue à faciliter l'accès et l'analyse des données dans l'entreprise.
En quelle langue sont dispensés les cours chez Jedha ?
Nos formateurs enseignent en français. Toutefois pour les ressources écrites (cours, projets, exercices) sur JULIE, l'anglais est privilégié afin de préparer nos étudiants avec les standards internationaux de la Data.
Combien coûte la participation à votre formation en Data Engineering ?
Pour participer, des frais de formation de 4 000€ sont requis, applicables quelque soit le mode d'apprentissage et le rythme de formation choisis.
Quels sont les pré-requis pour rejoindre la formation Lead ?
Pour intégrer la formation Data Lead de Jedha, vous avez 2 options possibles :
- Vous suivrez la formation Lead dans les meilleures conditions si vous passez par la formation Fullstack en amont. Cette formation Lead de 70 heures enseigne des compétences de niveau expert en Data Engineering et un très solide set de connaissances et nécessaire. La formation Fullstack vous donnera toutes les clés pour avoir ce bagage.
- Pour que vous puissiez suivre la formation Lead sans avoir suivi la formation Fullstack, il vous faudra avoir l'arc de compétences équivalent. Vous enverrez un dossier de candidature à notre équipe d'admissions, cette dernière l'étudiera avant de valider votre inscription.
Pour avoir d'autant plus d'informations sur tout ceci, vous pouvez prendre rendez-vous avec notre équipe d'admissions.
150 heures de formations sont-elles suffisantes pour maîtriser les compétences en Data Engineering ?
En complément de la formation Data Fullstack de Jedha, l'objectif de cette formation Lead est bien de vous amener à un niveau expert dans la donnée, autant sur les pans Data Engineering que Data Science. Vous apprendrez dans cette formation à construire des infrastructures Data solides, adaptées à votre environnement et capables de supporter un volume de données important. L'idée n'est pas seulement de créer cette infrastructure, mais aussi de la maintenir en adéquation avec l'augmentation de la volumétrie de données que vous aurez.
Quel volume de travail dois-je fournir pendant cette formation ?
On ne le cache jamais, cette formation est dense et intense ! De nombreuses technologies sont amenées à être enseignées. Tout dépend du niveau duquel vous partez en entrant en formation (si vous avez réalisé le programme Fullstack en amont ou non). Environ 10 heures de travail supplémentaire seraient à fournir, entre les exercices, les cas pratiques, et projets Data Engineering à réaliser.
Peut-on prétendre à des postes de Data Engineer après la formation Data Lead ?
Les pré-requis de la formation Lead permettent justement de vous assurer les compétences nécessaires pour bien suivre la formation Lead. Avec les compétences nouvellement acquises dans cette formation dense, vous pourrez tout à fait postuler à des postes de Data Engineer ou encore Machine Learning Engineer.
Comment justifier vous ces choix d'outils et de langage ? AWS ? Scala et non Python ?
Les outils enseignés dans la formation Lead sont ceux à la pointe de la technologie. Ces choix de l'équipe pédagogique de Jedha ont été motivés par les raisons suivantes :
- Pourquoi AWS ? Les services Cloud d'Amazon sont les leader sur leur marché ! Entre la très large gamme d'outils proposés, la stabilité de leurs infrastructures, AWS permet à nos élèves de faire le tour des technologies liées au Cloud Computing
- Pourquoi Spark en Scala et pas Spark en Python ? Spark est LE framework qui vous permettra de gérer de très gros volumes de données (Big Data). Ce framework étant originellement codé en Scala, ce langage permet de simplifier l'écriture des programmes complexes et les rend plus lisibles.
Quels sont les objectifs de la formation ?
A l'issue de la formation Lead, l'apprenant sera en capacité de :
- Créer et gérer une architecture de données robuste pouvant accueillir une volumétrie de données toujours plus importante (Big Data) dans le Cloud
- Savoir utiliser les services Cloud les plus populaires (AWS) pour stocker de la donnée, la traiter et la manipuler (processus ETL)
- Savoir standardiser des environnements Data pour qu'ils puissent être abrités sous différents systèmes d'exploitation (Linux, Windows, Mac)
- En somme, avoir des compétences poussés en Data Engineering
Dois-je venir avec mon propre ordinateur ?
Nous ne fournissons pas d'ordinateur dans le cadre de nos formations. Il est donc essentiel que vous disposiez de votre propre machine et que celle-ci soit suffisamment puissante.
Vous trouverez ci-dessous les spécifications techniques minimales pour suivre la formation dans de bonnes conditions. Pour en savoir plus, et découvrir une sélection d’ordinateurs adaptés à nos formations, consultez notre article dédié.
- Système d'exploitation : Linux / Windows / MacOS. Les autres OS ne permettent pas de suivre la formation.
- RAM : 16 Go minimum.
- Stockage : SSD de 512 Go à 1 To.
- Processeur : Sur PC, Intel i5 minimum (idéalement Intel i7). Sur Mac, puces Apple Silicon M1 à M3.
Téléchargez le syllabus de nos formations
- Excellence académique et technique
- Apprentissage par la pratique
- Formations adaptées à vos besoins
Rechargez la page et ressayez d'envoyer le formulaire.