Daten-Engpässe beheben: Optimierung der Spark-Leistung

Sichern Sie sich eines unserer besten Angebote mit Coursera Plus für 199 $ (normalerweise 399 $). Jetzt sparen.

Daten-Engpässe beheben: Optimierung der Spark-Leistung

Dieser Kurs ist Teil mehrerer Programme.

Dozent: Hurix Digital

Bei enthalten

Mehr erfahren

Fragen Sie Coursera

2 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Anfänger

Empfohlene Erfahrung

2 Stunden zu vervollständigen

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

2 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Anfänger

Empfohlene Erfahrung

2 Stunden zu vervollständigen

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

Leistungsengpässe in verteilten Systemen sind häufig eher auf eine ungleichmäßige Datenverteilung als auf unzureichende Rechenressourcen zurückzuführen.
Die visuelle Analyse des Ausführungsplans ist unerlässlich, um bestimmte Phasen zu identifizieren, in denen Ungleichgewichte bei der Datenverarbeitung auftreten.
Eine proaktive Auswahl der Partitionsstrategie beugt Leistungseinbußen wirksamer vor als eine reaktive Optimierung
Die „shuffle.partitions“-Konfiguration und die Broadcast-Join-Muster von Spark sind grundlegende Werkzeuge für eine nachhaltige Pipeline-Optimierung.

Kompetenzen, die Sie erwerben

Kategorie: Leistungsanalyse
Kategorie: Fehlersuche
Kategorie: Skalierbarkeit
Kategorie: Feinabstimmung
Kategorie: System-Konfiguration
Kategorie: Leistungsoptimierung
Kategorie: Verteiltes Rechnen
Kategorie: Analyse
Kategorie: Daten-Pipelines
Kategorie: Datenverarbeitung

Werkzeuge, die Sie lernen werden

Kategorie: Apache Spark

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

Februar 2026

Bewertungen

4 Zuweisungen¹

KI-bewertet siehe Haftungsausschluss

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Weitere Informationen zu Coursera für Unternehmen

Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist als Teil verfügbar

Wenn Sie sich für diesen Kurs anmelden, müssen Sie auch ein bestimmtes Programm auswählen.

Lernen Sie neue Konzepte von Branchenexperten
Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 2 Module

Datenengpässe beheben: Die Spark-Leistung optimieren

Wussten Sie, dass ineffizientes Daten-Shuffling Spark-Jobs um über 70 % verlangsamen kann? Zu verstehen, wie man diese Engpässe erkennt und behebt, ist entscheidend, um in verteilten Datensystemen Spitzenleistung zu erzielen. Dieser Kurzkurs wurde entwickelt, um Fachleuten in diesem Bereich dabei zu helfen, die Leistung von Datenpipelines zu optimieren und Verarbeitungsengpässe in verteilten Spark-Umgebungen zu beseitigen. Nach Abschluss dieses Kurses sind Sie in der Lage, Spark-Ausführungspläne zu analysieren, Ursachen für Datenschiefheit und Ineffizienzen beim Daten-Shuffle zu identifizieren sowie Optimierungsstrategien anzuwenden – Fähigkeiten, die die Verarbeitungsgeschwindigkeit, die Skalierbarkeit und die Gesamteffizienz des Daten-Workflows verbessern. Am Ende dieses 3-stündigen Kurses werden Sie in der Lage sein: Verteilte Ausführungspläne zu analysieren, um durch Daten-Shuffle und -Skew verursachte Leistungsengpässe zu beheben. Das Besondere an diesem Kurs ist die Kombination aus praktischer Spark-Fehlerbehebung und realitätsnahen Optimierungstechniken, wodurch Sie praktische Erfahrungen bei der Diagnose verteilter Leistungsprobleme und der Feinabstimmung groß angelegter Datenoperationen sammeln. Um dieses Projekt erfolgreich zu absolvieren, sollten Sie über folgende Voraussetzungen verfügen: Grundlegende Spark-Kenntnisse SQL-Grundlagen Verständnis der Prinzipien des verteilten Rechnens Erfahrung in der Datenverarbeitung

Die Teilnehmer erwerben grundlegende Fähigkeiten zur Analyse verteilter Ausführungspläne, um Leistungsengpässe zu identifizieren, die durch Datenumschichtungen und Skew-Muster in Spark-Anwendungen verursacht werden.

Das ist alles enthalten

3 Videos3 Lektüren1 Aufgabe1 Unbewertetes Labor

3 VideosInsgesamt 14 Minuten

Warum Leistungsanalysen Datenteams vor Pipeline-Katastrophen bewahren3 Minuten
Die Architektur der verteilten Ausführung von Spark verstehen6 Minuten
Interpretation visueller Ausführungsmetriken und Leistungsindikatoren6 Minuten

3 LektürenInsgesamt 22 Minuten

Datenvermischung und -verzerrung: Die versteckten Leistungsbremsen8 Minuten
Einführung in die Schnittstelle zur Ausführungsüberwachung von Spark7 Minuten
Erkennung von Engpassmustern in Kennzahlen zur Aufgabenausführung7 Minuten

1 AufgabeInsgesamt 3 Minuten

Wissenscheck: Grundlagen der Ausführungsplananalyse3 Minuten

1 Unbewertetes LaborInsgesamt 20 Minuten

Leistungsengpässe durch Analyse des Ausführungsplans diagnostizieren20 Minuten

Die Teilnehmer wenden fortgeschrittene Optimierungsstrategien an, um identifizierte Leistungsengpässe durch Partitionsoptimierung, Broadcast-Joins und Techniken zur Konfigurationsoptimierung zu beheben.

Das ist alles enthalten

1 Video1 Lektüre3 Aufgaben

1 VideoInsgesamt 7 Minuten

Konfigurationsoptimierung: Spark für maximale Leistung optimieren7 Minuten

1 LektüreInsgesamt 10 Minuten

Partitionierungsstrategien und Techniken zur Optimierung von Broadcast-Joins10 Minuten

3 AufgabenInsgesamt 30 Minuten

Abschließende Bewertung: Umfassende Analyse und Behebung von Leistungsengpässen12 Minuten
Optimierung des Leistungsszenarios unter realen Bedingungen15 Minuten
Wissenscheck: Strategien zur Leistungsoptimierung3 Minuten

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozent

Hurix Digital

454 Kurse60.347 Lernende

von

Coursera

Mehr von Datenanalyse entdecken

Status: Kostenloser Testzeitraum
Coursera
Optimize Spark Performance & Throughput
Kurs
Status: Kostenloser Testzeitraum
Coursera
Optimize Spark Performance: Analyze & Accelerate
Kurs
Status: Kostenloser Testzeitraum
Coursera
Optimizing Spark and Cloud Data Storage for Analytics
Kurs
Status: Kostenloser Testzeitraum
Coursera
Spark, Skew & Speed: Pipeline Performance Engineering
Spezialisierung

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018

„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020

„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021

„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen

Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.

Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzufügen.

Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.

Weitere Fragen

Besuchen Sie die das Hilfe-Center für Kursteilnehmer.

Finanzielle Unterstützung verfügbar,

¹ Einige Aufgaben in diesem Kurs werden mit AI bewertet. Für diese Aufgaben werden Ihre Daten in Übereinstimmung mit Datenschutzhinweis von Courseraverwendet.