Coursera

Optimiser les performances et le débit de Spark

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Coursera

Optimiser les performances et le débit de Spark

Ce cours fait partie de plusieurs programmes.

Merna Elzahaby

Instructeur : Merna Elzahaby

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

4 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

4 heures à compléter
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Analyser l'interface utilisateur et les indicateurs de Spark (durée des tâches, E/S de shuffle, utilisation du processeur et de la mémoire par les exécuteurs) afin d'identifier les goulots d'étranglement et de proposer des optimisations concrètes.

  • Appliquer des techniques de partitionnement et d'atténuation de l'asymétrie (salting/partitionneur personnalisé) et réduire le shuffle (joins par diffusion, éviter groupByKey, AQE) afin d'améliorer le parallélisme.

  • Configurez les paramètres relatifs aux exécuteurs, aux COREs, à la mémoire, à l'allocation dynamique et au parallélisme/mise en cache afin d'optimiser le débit tout en respectant les objectifs SLA définis.

Compétences que vous acquerrez

  • Catégorie : Allocation des ressources
  • Catégorie : Gestion de la mémoire
  • Catégorie : Analyse de l'emploi
  • Catégorie : Optimisation des processus
  • Catégorie : Analyse des performances
  • Catégorie : Optimisation des performances
  • Catégorie : Niveau de service
  • Catégorie : Configuration du système

Outils que vous découvrirez

  • Catégorie : Apache Spark
  • Catégorie : PySpark

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

février 2026

Évaluations

1 devoir

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours est disponible dans le cadre de
Lorsque vous vous inscrivez à ce cours, vous devez également sélectionner un programme spécifique.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 3 modules dans ce cours

Ce module présente aux apprenants le modèle d'exécution des tâches de Spark ainsi que ses principaux indicateurs de performance. Les apprenants découvriront l'interface utilisateur de Spark, apprendront à interpréter les étapes des tâches, les tâches elles-mêmes et les indicateurs de « shuffle », et sauront diagnostiquer les goulots d'étranglement en matière de performance à l'aide de journaux de tâches réels.

Inclus

4 vidéos2 lectures1 évaluation par les pairs

Ce module enseigne aux apprenants comment résoudre les goulots d'étranglement les plus courants dans Spark : asymétrie des données, shuffling excessif, jointures inefficaces et partitionnement inadéquat. Les apprenants mettent en pratique des techniques telles que le salting, le repartitionnement, les jointures de diffusion et l'AQE.

Inclus

3 vidéos1 lecture1 évaluation par les pairs

Ce module est consacré à la configuration des ressources Spark (exécuteurs, CPU, mémoire, allocation dynamique, parallélisme) et à l'optimisation des paramètres des tâches afin de maximiser le débit et de respecter des accords de niveau de service (SLA) stricts en matière de performances.

Inclus

4 vidéos1 lecture1 devoir2 évaluations par les pairs

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Merna Elzahaby
Coursera
1 Cours114 apprenants

Offert par

Coursera

En savoir plus sur Informatique en nuage

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions