Acquérez des compétences pratiques en ingénierie des données en apprenant à concevoir, développer et exécuter des pipelines ETL (Extract, Transform, Load) de bout en bout à l'aide d'Apache Spark. Dans cette formation pratique, vous commencerez par mettre en place un environnement de développement Spark, installer et configurer PySpark, Hadoop et MySQL, organiser les structures de projets ETL et explorer des ensembles de données réels.

Apache Spark : Conception et exécution de pipelines ETL (Hands-On)
Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Apache Spark : Conception et exécution de pipelines ETL (Hands-On)
Ce cours fait partie de Spécialisation "Spark et Python pour le Big data avec PySpark"

Instructeur : EDUCBA
Inclus avec
23 avis
Expérience recommandée
Ce que vous apprendrez
Installer et configurer PySpark, Hadoop et MySQL pour les flux de travail ETL.
Construisez des applications Spark pour des chargements de données complets et incrémentaux via JDBC.
Appliquer des transformations, gérer les problèmes de déploiement et optimiser les pipelines ETL.
Compétences que vous acquerrez
- Catégorie : Pipelines de données
- Catégorie : Environnement de développement
- Catégorie : Importation/exportation de données
- Catégorie : Transformation des données
- Catégorie : Analyse exploratoire des données
- Catégorie : Traitement des données
- Catégorie : Ingénierie des données
- Catégorie : Magasin de données
- Catégorie : Extraire, transformer, charger
- Catégorie : Installation du logiciel
- Catégorie : SQL
- Catégorie : Analyse des données
Outils que vous découvrirez
- Catégorie : MySQL
- Catégorie : Apache Spark
- Catégorie : PySpark
- Catégorie : Apache Hadoop
- Catégorie : MySQL Workbench
Détails à connaître

Ajouter à votre profil LinkedIn
6 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 2 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
En savoir plus sur Analyse des données
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Avis des étudiants
- 5 stars
52,17 %
- 4 stars
34,78 %
- 3 stars
8,69 %
- 2 stars
0 %
- 1 star
4,34 %
Affichage de 3 sur 23
Révisé le 19 janv. 2026
Learners feel they actually build powerful pipelines — from raw ingestion to analytics-ready outputs, not just toy examples.
Révisé le 4 déc. 2025
Learners get a solid understanding of transformations, actions, filtering, joins, and aggregations using real code examples.
Révisé le 5 janv. 2026
I liked how this course didn’t just talk about Spark, but actually showed me how to build and run ETL pipelines — that’s rare in short courses.
Foire Aux Questions
Plus de questions
Aide financière disponible,








