In groß angelegten Data-Engineering-Umgebungen können Leistungsprobleme wie langsame Transformationen, übermäßige Shuffle-Operationen und unausgewogene Arbeitslasten die Analytik, das Berichtswesen und die Einhaltung von SLAs beeinträchtigen. In diesem Kurs lernen Sie, wie Sie Apache-Spark-Anwendungen analysieren, diagnostizieren und optimieren, damit diese schneller, effizienter und zuverlässiger laufen. Zu Beginn des Kurses lernen Sie die Grundlagen der Spark-Jobausführung kennen, einschließlich der Frage, wie Stages, Tasks, Shuffle-Operationen und Ausführungspläne Aufschluss darüber geben, wo Engpässe auftreten. Sie lernen die in Spark integrierten Überwachungstools kennen, um das Jobverhalten zu interpretieren. Anschließend wenden Sie praktische Optimierungstechniken an, darunter die Verbesserung der Datenpartitionierung, die Minderung von Datenschiefheiten, die Optimierung von Joins, die Konfiguration von Caching-Strategien und die Auswahl effizienter Dateiformate. Außerdem lernen Sie, wie Sie Executor, Arbeitsspeicher, Rechenkerne und die dynamische Zuweisung anpassen, um Kosten und Leistung über verschiedene Workloads hinweg auszugleichen.

Optimierung von Spark-Leistung und -Durchsatz
Sichern Sie sich eines unserer besten Angebote mit Coursera Plus für 199 $ (normalerweise 399 $). Jetzt sparen.

Optimierung von Spark-Leistung und -Durchsatz
Dieser Kurs ist Teil mehrerer Programme.

Dozent: Merna Elzahaby
Bei enthalten
Fragen Sie Coursera
Empfohlene Erfahrung
Was Sie lernen werden
Überprüfen Sie die Spark-Benutzeroberfläche und die Metriken (Aufgabendauer, Shuffle-I/O, CPU-/Speicherauslastung des Executors), um Engpässe zu identifizieren und umsetzbare Optimierungsmaßnahmen vorzuschlagen.
Wenden Sie Partitionierung und Skew-Minderung (Salting/benutzerdefinierter Partitionierer) an und reduzieren Sie den Shuffle-Aufwand (Broadcast-Joins, Vermeidung von `groupByKey`, AQE), um die Parallelität zu verbessern.
Konfigurieren Sie die Einstellungen für Executor, COREs, Arbeitsspeicher, dynamische Zuweisung sowie Parallelität und Caching, um den Durchsatz zu maximieren und gleichzeitig die festgelegten SLA-Ziele zu erreichen.
Kompetenzen, die Sie erwerben
- Kategorie: Speicherverwaltung
- Kategorie: Prozess-Optimierung
- Kategorie: Leistungsanalyse
- Kategorie: Dienstleistungsebene
- Kategorie: Leistungsoptimierung
- Kategorie: Ressourcen-Zuweisung
- Kategorie: System-Konfiguration
- Kategorie: Arbeitsplatzanalyse
Werkzeuge, die Sie lernen werden
- Kategorie: Apache Spark
- Kategorie: PySpark
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
Februar 2026
1 Aufgabe
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 3 Module
Erwerben Sie ein Karrierezertifikat.
Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
Dozent

von
Mehr von Cloud Computing entdecken
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Häufig gestellte Fragen
Weitere Fragen
Finanzielle Unterstützung verfügbar,




