Ce cours présente aux débutants les concepts fondamentaux et intermédiaires du traitement des données distribuées à l'aide d'Apache Spark, l'un des moteurs les plus puissants pour l'analytique à grande échelle. À travers deux modules progressivement structurés, les apprenants identifieront l'architecture de Spark, décriront ses composants de base et démontreront des constructions de programmation clés telles que les RDD (Resilient Distributed Datasets). Dans le module 1, les apprenants reconnaîtront les principes derrière le modèle transformateur distribué de Spark et illustreront les transformations RDD de base. Dans le module 2, ils appliqueront une logique de transformation avancée, mettront en œuvre des stratégies de persistance et différencieront les formats de fichiers tels que CSV, JSON, Parquet et Avro pour un traitement efficace des données. À la fin du cours, les apprenants seront en mesure d'analyser les applications Spark pour l'optimisation, d'évaluer les stratégies de stockage et de développer des flux de travail de traitement de données évolutifs en utilisant les API de base de Spark. Le cours mélange la clarté conceptuelle avec des exemples pratiques pour équiper les apprenants pour les défis Big data du monde réel.

Apache Spark : Appliquer et évaluer les flux de travail Big data
Économisez sur les compétences qui vous font briller avec 40 % de réduction sur 3 mois de Coursera Plus. Économisez maintenant

Apache Spark : Appliquer et évaluer les flux de travail Big data
Ce cours fait partie de Spécialisation "Spark et Python pour le Big data avec PySpark"

Instructeur : EDUCBA
Inclus avec
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
4 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Ce que vous apprendrez
Décrire l'architecture de Spark, les composants de base et les constructions de programmation RDD.
Appliquer des transformations, la persistance, et gérer plusieurs formats de fichiers dans Spark.
Développez des flux de travail évolutifs et évaluez les applications Spark pour les optimiser.
Compétences que vous acquerrez
- Catégorie : Importation/exportation de données
- Catégorie : Optimisation des performances
- Catégorie : Big Data
- Catégorie : Traitement des données
- Catégorie : Informatique distribuée
- Catégorie : Transformation des données
Outils que vous découvrirez
- Catégorie : Persistance des données
- Catégorie : Apache Spark
- Catégorie : JSON
Détails à connaître

Certificat partageable
Ajouter à votre profil LinkedIn
Évaluations
6 devoirs
Enseigné en Anglais
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
Ce cours fait partie de la Spécialisation "Spark et Python pour le Big data avec PySpark"
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

En savoir plus sur Analyse des données
Statut : Essai gratuit
Statut : Essai gratuitUniversity of Pittsburgh
Statut : Essai gratuit
Statut : PrévisualisationÉcole Polytechnique Fédérale de Lausanne
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Foire Aux Questions
Plus de questions
Aide financière disponible,




