EDUCBA
Apache Spark: Big Data-Workflows anwenden und auswerten

Erwerben Sie mit Coursera Plus für 199 $ (regulär 399 $) das nächste Level. Jetzt sparen.

EDUCBA

Apache Spark: Big Data-Workflows anwenden und auswerten

EDUCBA

Dozent: EDUCBA

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
3 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
3 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Beschreiben Sie die Spark-Architektur, die Kernkomponenten und die RDD-Programmierkonstrukte.

  • Anwendung von Transformationen, Persistenz und Handhabung mehrerer Dateiformate in Spark.

  • Entwickeln Sie skalierbare Workflows und bewerten Sie Spark-Anwendungen zur Optimierung.

Kompetenzen, die Sie erwerben

  • Kategorie: JSON
  • Kategorie: Verteiltes Rechnen
  • Kategorie: Daten importieren/exportieren
  • Kategorie: Persistenz der Daten
  • Kategorie: Leistungsoptimierung
  • Kategorie: Datenumwandlung
  • Kategorie: Datenverarbeitung
  • Kategorie: Apache Spark
  • Kategorie: Big Data

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

August 2025

Bewertungen

6 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung für Spark und Python für Big Data mit PySpark
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 2 Module

Dieses Modul führt die Teilnehmer in die grundlegenden Konzepte von Apache Spark ein, einer leistungsstarken Open Source-Engine, die für die Verarbeitung und Analyse von Big Data entwickelt wurde. Durch eine Reihe von strukturierten Lektionen erkunden die Lernenden die Spark-Architektur, die Kernkomponenten und die wesentlichen Programmierkonstrukte. Das Modul vermittelt ein konzeptionelles Verständnis dafür, wie Spark verteiltes Computing und In-Memory-Verarbeitung nutzt, gefolgt von einer praktischen Einführung in die Arbeit mit Resilient Distributed Datasets (RDDs), der Kernabstraktion von Spark für die Datenverarbeitung. Am Ende des Moduls werden die Lernenden mit dem Wissen ausgestattet sein, das sie benötigen, um grundlegende Datenoperationen in Spark zu initiieren und seine High-Level-Architektur zu verstehen.

Das ist alles enthalten

5 Videos3 Aufgaben

Dieses Modul vertieft das Verständnis von Apache Spark, indem es sich auf fortgeschrittene RDD-Transformationen, Persistenzstrategien, Operationen mit Schlüssel-Wert-Paaren (RDDs) und den effizienten Umgang mit verschiedenen Datenformaten konzentriert. Die Lernenden erfahren, wie sie Transformationen wie map, flatMap und reduceByKey anwenden, die Rolle und Konfiguration von Persistenzstufen in Spark verstehen, Pair-RDDs mithilfe von Sortier- und Gruppieraktionen manipulieren und mit häufig verwendeten Dateiformaten wie CSV, JSON, Parquet und Avro arbeiten. Das Modul vermittelt den Lernenden die Fähigkeit, Spark-Anwendungen sowohl rechnerisch als auch in Bezug auf die Datenspeicherung und -verarbeitung zu optimieren.

Das ist alles enthalten

6 Videos3 Aufgaben

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozent

EDUCBA
EDUCBA
617 Kurse182.960 Lernende

von

EDUCBA

Mehr von Datenanalyse entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen