Ce cours est conçu pour doter les ingénieurs de données des compétences nécessaires pour construire des pipelines de données évolutifs et efficaces à l'aide de Scala et Spark. Les ingénieurs de données apprendront les meilleures pratiques pour le développement, les tests et le déploiement dans les environnements cloud, en mettant l'accent sur l'optimisation des performances et la garantie de la qualité des données. Le cours fournit les outils nécessaires pour transformer les données brutes en informations exploitables, ce qui le rend très pertinent dans le monde actuel axé sur les données. Tout au long du cours, les apprenants amélioreront leurs compétences en ingénierie des données en maîtrisant les techniques de construction de pipelines de données en streaming et en batch. Le contenu met l'accent sur des résultats pratiques tels que l'optimisation des performances et le profilage des données. Avec des exemples pratiques et des conseils étape par étape, les apprenants acquerront une solide compréhension des pipelines de traitement en temps réel et par lots. Ce qui rend ce cours unique, c'est sa combinaison de théorie fondamentale et d'applications du monde réel. À la fin, vous serez en mesure d'utiliser Scala et Spark pour traiter efficacement de grands ensembles de données et optimiser les pipelines dans les environnements cloud. Ce cours est idéal pour les ingénieurs de données ayant une certaine expérience dans le traitement des données. Bien qu'il suppose une certaine familiarité avec les concepts d'ingénierie des données et les technologies cloud, toute personne désireuse d'améliorer ses compétences en Scala et Spark bénéficiera de l'approche pratique, étape par étape.

Ingénierie des données avec Scala et Spark
Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire
Expérience recommandée
2 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Ce que vous apprendrez
Mettre en place un environnement de développement pour la création de pipelines de données en Scala
Utiliser les DataFrames, les Datasets et le langage SQL de Spark avec Scala pour le traitement des données
Profilage et nettoyage des données avec Deequ pour une meilleure qualité des données
Compétences que vous acquerrez
- Catégorie : Intégrité des données
- Catégorie : Tests unitaires
- Catégorie : Validation des données
- Catégorie : Transformation des données
- Catégorie : Qualité des données
- Catégorie : Traitement des données
- Catégorie : CI/CD
- Catégorie : Intégration continue
- Catégorie : Pipelines de données
- Catégorie : Magasin de données
- Catégorie : Développement piloté par les tests (TDD)
- Catégorie : Architecture des données
- Catégorie : Maintenabilité
- Catégorie : Optimisation des performances
- Catégorie : Déploiement continu
Outils que vous découvrirez
- Catégorie : Apache Spark
- Catégorie : Programmation en Scala
- Catégorie : Flux d'air Apache
- Catégorie : Apache Kafka
- Catégorie : Lacs de données
Détails à connaître

Certificat partageable
Ajouter à votre profil LinkedIn
Récemment mis à jour !
mars 2026
Évaluations
13 devoirs
Enseigné en Anglais
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Il y a 13 modules dans ce cours
Instructeur

Offert par
En savoir plus sur Gestion des données
Statut : Essai gratuit
Statut : Essai gratuitDuke University
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Foire Aux Questions
Plus de questions
Aide financière disponible,





