Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable
Il y a 2 modules dans ce cours
Ce cours pratique dote les apprenants des compétences nécessaires pour concevoir, construire et gérer des flux de travail ETL (Extraction, Transformation, Chargement) de bout en bout à l'aide d'Apache Spark dans un contexte réel d'ingénierie des données. Structuré en deux modules complets, le cours commence par une configuration fondamentale, guidant les apprenants à travers l'installation de composants essentiels tels que PySpark, Hadoop et MySQL. Les participants apprendront à configurer leur environnement, à organiser les structures de projet et à explorer efficacement les ensembles de données sources. Au fur et à mesure que le cours progresse, les apprenants développeront des applications Spark pour effectuer des chargements de données complets et incrémentiels en utilisant l'intégration JDBC avec MySQL. Grâce à des exemples pratiques, ils appliqueront une logique de transformation à l'aide de Spark SQL, filtreront les données en fonction des règles métier et traiteront les pièges courants tels que les incohérences de type et les problèmes de structure de dossier lors du déploiement de Spark. À la fin du cours, les apprenants seront en mesure de construire, d'exécuter et d'optimiser des pipelines ETL basés sur Spark qui sont évolutifs et prêts pour la production, ce qui leur permettra de contribuer efficacement à des rôles d'ingénierie des données dans le monde réel.
Ce module présente aux apprenants les principes fondamentaux de la construction d'un framework ETL à l'aide d'Apache Spark. Il commence par donner un aperçu de l'écosystème Spark et de ses avantages dans le traitement des Big data. Les apprenants seront guidés dans l'installation et la configuration des progiciels essentiels, la mise en place de l'environnement de développement et la compréhension de la structure d'un projet ETL basé sur Spark. Le module aborde également la manière de travailler avec des ensembles de données du monde réel et de préparer des fichiers de configuration pour les interactions avec les bases de données - en posant des bases solides pour les flux de travail de traitement de données évolutifs.
Inclus
5 vidéos3 devoirs
Afficher les informations sur le contenu du module
5 vidéos•Total 52 minutes
Introduction au projet•14 minutes
Installation des paquets•7 minutes
L'installation des paquets se poursuit•8 minutes
Mise en place de la structure du projet•10 minutes
Exploration de l'ensemble de données•12 minutes
3 devoirs•Total 60 minutes
Démarrer le projet ETL•15 minutes
Construire la structure du projet et comprendre les données•15 minutes
Quiz noté - Mise en place des fondations•30 minutes
Construire des workflows ETL avec Apache Spark
Module 2•2 heures à terminer
Détails du module
Ce module guide les apprenants dans la mise en œuvre pratique des processus d'Extraction, de transformation et de chargement (ETL) à l'aide d'Apache Spark. Les apprenants exploreront les chargements complets de données dans MySQL, appliqueront la logique de transformation à l'aide de Spark SQL et traiteront les scénarios de chargement incrémentiel en suivant et en gérant les nouveaux enregistrements. Les leçons comprennent la gestion des erreurs, les stratégies de filtrage, la compatibilité des types de données et l'intégration des bases de données à l'aide de JDBC - le tout dans un environnement PySpark pratique. Ce module renforce les connaissances appliquées de Spark pour les tâches d'ingénierie des données du monde réel.
Inclus
6 vidéos3 devoirs
Afficher les informations sur le contenu du module
6 vidéos•Total 47 minutes
Charge totale et transformations Partie 1•7 minutes
Chargement complet et transformations Partie 2•7 minutes
Charge totale et transformations Partie 3•7 minutes
Charge totale et transformations Partie 4•9 minutes
Chargement incrémentiel•7 minutes
Chargement incrémentiel Continuer•10 minutes
3 devoirs•Total 60 minutes
Chargement complet et transformations•15 minutes
Gestion des charges incrémentielles•15 minutes
Quiz noté - Construire des workflows ETL dans Apache Spark•30 minutes
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeur
Évaluations de l’enseignant
Évaluations de l’enseignant
Nous avons demandé à tous les étudiants de fournir des commentaires sur nos enseignants au sujet de la qualité de leur pédagogie.
Bienvenue à EDUCBA, un lieu où le savoir est illimité ! Nous proposons une large sélection de programmes instructifs et attrayants conçus pour permettre aux étudiants de tous âges et de toutes expériences de s'épanouir. Depuis le confort de votre maison, commencez une expérience éducative révolutionnaire avec nos cours sur les technologies de pointe et nos instructeurs expérimentés.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Avis des étudiants
4.3
23 avis
5 stars
52,17 %
4 stars
34,78 %
3 stars
8,69 %
2 stars
0 %
1 star
4,34 %
Affichage de 3 sur 23
P
PP
5·
Révisé le 27 nov. 2025
The course does a good job comparing Spark’s distributed processing with traditional ETL tools, so you understand why Spark is used.
G
GJ
5·
Révisé le 3 janv. 2026
The emphasis on applied Spark SQL, transformations, and JDBC integration gives you real working skills.
D
DD
4·
Révisé le 5 janv. 2026
I liked how this course didn’t just talk about Spark, but actually showed me how to build and run ETL pipelines — that’s rare in short courses.
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Qu'est-ce que je recevrai si je souscris à cette Specializations ?
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Une aide financière est-elle disponible ?
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.