Dieser Kurs führt Anfänger in die grundlegenden und fortgeschrittenen Konzepte der verteilten Datenverarbeitung mit Apache Spark ein, einer der leistungsstärksten Engines für groß angelegte Analysen. In zwei progressiv aufgebauten Modulen werden die Teilnehmer die Architektur von Spark identifizieren, seine Kernkomponenten beschreiben und wichtige Programmierkonstrukte wie z. B. Resilient Distributed Datasets (RDDs) demonstrieren. In Modul 1 werden die Teilnehmer die Prinzipien hinter dem verteilten Datenverarbeitungsmodell von Spark erkennen und grundlegende RDD-Transformationen veranschaulichen. In Modul 2 werden sie fortgeschrittene Transformationslogik anwenden, Persistenzstrategien implementieren und zwischen Dateiformaten wie CSV, JSON, Parquet und Avro für eine effiziente Datenverarbeitung unterscheiden. Am Ende des Kurses werden die Teilnehmer in der Lage sein, Spark-Anwendungen zur Optimierung zu analysieren, Speicherstrategien zu bewerten und skalierbare Datenverarbeitungs-Workflows unter Verwendung von Spark-Kern-APIs zu entwickeln. Der Kurs verbindet konzeptionelle Klarheit mit praktischen Beispielen, um die Teilnehmer für Big Data-Herausforderungen in der Praxis zu rüsten.

Erwerben Sie mit Coursera Plus für 199 $ (regulär 399 $) das nächste Level. Jetzt sparen.

Apache Spark: Big Data-Workflows anwenden und auswerten
Dieser Kurs ist Teil von Spezialisierung für Spark und Python für Big Data mit PySpark

Dozent: EDUCBA
Bei enthalten
Was Sie lernen werden
Beschreiben Sie die Spark-Architektur, die Kernkomponenten und die RDD-Programmierkonstrukte.
Anwendung von Transformationen, Persistenz und Handhabung mehrerer Dateiformate in Spark.
Entwickeln Sie skalierbare Workflows und bewerten Sie Spark-Anwendungen zur Optimierung.
Kompetenzen, die Sie erwerben
- Kategorie: JSON
- Kategorie: Verteiltes Rechnen
- Kategorie: Daten importieren/exportieren
- Kategorie: Persistenz der Daten
- Kategorie: Leistungsoptimierung
- Kategorie: Datenumwandlung
- Kategorie: Datenverarbeitung
- Kategorie: Apache Spark
- Kategorie: Big Data
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
August 2025
6 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 2 Module
Dieses Modul führt die Teilnehmer in die grundlegenden Konzepte von Apache Spark ein, einer leistungsstarken Open Source-Engine, die für die Verarbeitung und Analyse von Big Data entwickelt wurde. Durch eine Reihe von strukturierten Lektionen erkunden die Lernenden die Spark-Architektur, die Kernkomponenten und die wesentlichen Programmierkonstrukte. Das Modul vermittelt ein konzeptionelles Verständnis dafür, wie Spark verteiltes Computing und In-Memory-Verarbeitung nutzt, gefolgt von einer praktischen Einführung in die Arbeit mit Resilient Distributed Datasets (RDDs), der Kernabstraktion von Spark für die Datenverarbeitung. Am Ende des Moduls werden die Lernenden mit dem Wissen ausgestattet sein, das sie benötigen, um grundlegende Datenoperationen in Spark zu initiieren und seine High-Level-Architektur zu verstehen.
Das ist alles enthalten
5 Videos3 Aufgaben
Dieses Modul vertieft das Verständnis von Apache Spark, indem es sich auf fortgeschrittene RDD-Transformationen, Persistenzstrategien, Operationen mit Schlüssel-Wert-Paaren (RDDs) und den effizienten Umgang mit verschiedenen Datenformaten konzentriert. Die Lernenden erfahren, wie sie Transformationen wie map, flatMap und reduceByKey anwenden, die Rolle und Konfiguration von Persistenzstufen in Spark verstehen, Pair-RDDs mithilfe von Sortier- und Gruppieraktionen manipulieren und mit häufig verwendeten Dateiformaten wie CSV, JSON, Parquet und Avro arbeiten. Das Modul vermittelt den Lernenden die Fähigkeit, Spark-Anwendungen sowohl rechnerisch als auch in Bezug auf die Datenspeicherung und -verarbeitung zu optimieren.
Das ist alles enthalten
6 Videos3 Aufgaben
Erwerben Sie ein Karrierezertifikat.
Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
Mehr von Datenanalyse entdecken
Status: Kostenloser Testzeitraum
Status: VorschauÉcole Polytechnique Fédérale de Lausanne
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Warum entscheiden sich Menschen für Coursera für ihre Karriere?




Häufig gestellte Fragen
Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzufügen.
Ja. Für ausgewählte Lernprogramme können Sie eine finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Anmeldungsgebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.
Weitere Fragen
Finanzielle Unterstützung verfügbar,




