Dieser Kurs führt Anfänger in die grundlegenden und fortgeschrittenen Konzepte der verteilten Datenverarbeitung mit Apache Spark ein, einer der leistungsstärksten Engines für groß angelegte Analysen. In zwei progressiv aufgebauten Modulen werden die Teilnehmer die Architektur von Spark identifizieren, seine Kernkomponenten beschreiben und wichtige Programmierkonstrukte wie z. B. Resilient Distributed Datasets (RDDs) demonstrieren. In Modul 1 werden die Teilnehmer die Prinzipien hinter dem verteilten Datenverarbeitungsmodell von Spark erkennen und grundlegende RDD-Transformationen veranschaulichen. In Modul 2 werden sie fortgeschrittene Transformationslogik anwenden, Persistenzstrategien implementieren und zwischen Dateiformaten wie CSV, JSON, Parquet und Avro für eine effiziente Datenverarbeitung unterscheiden. Am Ende des Kurses werden die Teilnehmer in der Lage sein, Spark-Anwendungen zur Optimierung zu analysieren, Speicherstrategien zu bewerten und skalierbare Datenverarbeitungs-Workflows unter Verwendung von Spark-Kern-APIs zu entwickeln. Der Kurs verbindet konzeptionelle Klarheit mit praktischen Beispielen, um die Teilnehmer für Big Data-Herausforderungen in der Praxis zu rüsten.

Apache Spark: Big Data-Workflows anwenden und auswerten

Apache Spark: Big Data-Workflows anwenden und auswerten
Dieser Kurs ist Teil von Spezialisierung „Spark und Python für Big Data mit PySpark“

Dozent: EDUCBA
Bei enthalten
Was Sie lernen werden
Beschreiben Sie die Spark-Architektur, die Kernkomponenten und die RDD-Programmierkonstrukte.
Anwendung von Transformationen, Persistenz und Handhabung mehrerer Dateiformate in Spark.
Entwickeln Sie skalierbare Workflows und bewerten Sie Spark-Anwendungen zur Optimierung.
Kompetenzen, die Sie erwerben
- Kategorie: Data Import/Export
- Kategorie: Performance Tuning
- Kategorie: Data Processing
- Kategorie: Big Data
- Kategorie: Distributed Computing
- Kategorie: Data Transformation
Werkzeuge, die Sie lernen werden
- Kategorie: Data Persistence
- Kategorie: Apache Spark
- Kategorie: JSON
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
6 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

Mehr von Datenanalyse entdecken
Status: Kostenloser Testzeitraum
Status: Kostenloser TestzeitraumUniversity of Pittsburgh
Status: VorschauÉcole Polytechnique Fédérale de Lausanne
Status: Kostenloser Testzeitraum
Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.

Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Weitere Fragen
Finanzielle Unterstützung verfügbar,

