Dieser Kurs für Einsteiger soll die Teilnehmer in die leistungsstarke Kombination von Python und Apache Spark (PySpark) für die verteilte Datenverarbeitung und -analyse einführen. Durch strukturierte Lektionen und Beispiele aus der Praxis werden die Teilnehmer die grundlegende Python-Syntax rekapitulieren, die Schlüsselelemente von PySpark identifizieren und die Verwendung von zentralen Spark-Transformationen und -Aktionen unter Verwendung von Resilient Distributed Datasets (RDDs) demonstrieren. Im weiteren Verlauf des Kurses werden die Teilnehmer fortgeschrittene Datenverarbeitungstechniken wie Joins und Datenintegration unter Verwendung von JDBC mit MySQL anwenden und skalierbare Datenpipelines wie die Wortzählung unter Verwendung von Transformationsketten konstruieren. Jedes Modul legt Wert auf eine Mischung aus konzeptionellem Verständnis und praktischer Code-Erfahrung, die es den Lernenden ermöglicht, ihre PySpark-Anwendungen effizient zu analysieren, zu debuggen und zu evaluieren. Am Ende des Kurses werden die Lernenden praktische Kenntnisse im Aufbau verteilter Daten-Workflows erlangt haben und darauf vorbereitet sein, komplexere Data-Engineering- und Big Data Analytics-Herausforderungen anzugehen.

PySpark und Python: Praktische Anleitung zur Datenverarbeitung
Sichern Sie sich eines unserer besten Angebote mit Coursera Plus für 199 $ (normalerweise 399 $). Jetzt sparen.

PySpark und Python: Praktische Anleitung zur Datenverarbeitung
Dieser Kurs ist Teil von Spezialisierung „Spark und Python für Big Data mit PySpark“

Dozent: EDUCBA
2.612 bereits angemeldet
Bei enthalten
42 Bewertungen
Was Sie lernen werden
Recall der Python-Syntax und Identifizierung der wichtigsten PySpark-Komponenten für die Datenverarbeitung.
Anwendung von RDD-Transformationen, Joins und JDBC-Integration mit MySQL.
Erstellen Sie skalierbare Pipelines wie ANZAHL und debuggen Sie PySpark-Anwendungen.
Kompetenzen, die Sie erwerben
- Kategorie: Datenumwandlung
- Kategorie: Daten-Pipelines
- Kategorie: Datenzugang
- Kategorie: Verteiltes Rechnen
- Kategorie: Daten importieren/exportieren
- Kategorie: Datenmanipulation
- Kategorie: Datenverarbeitung
Werkzeuge, die Sie lernen werden
- Kategorie: Apache Spark
- Kategorie: Python-Programmierung
- Kategorie: PySpark
- Kategorie: MySQL
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
7 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

Mehr von Datenanalyse entdecken
Status: VorschauEdureka
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Bewertungen von Lernenden
- 5 stars
64,28 %
- 4 stars
23,80 %
- 3 stars
4,76 %
- 2 stars
2,38 %
- 1 star
4,76 %
Zeigt 3 von 42 an
Geprüft am 26. Okt. 2025
Insightful but somewhat basic; lacks depth and advanced techniques for seasoned PySpark and Python professionals.
Geprüft am 15. Nov. 2025
Topics progress naturally—from basic operations to more advanced transformations—without overwhelming beginners.
Geprüft am 28. Okt. 2025
I learned so much about PySpark architecture, transformations, and actions. Ideal for anyone stepping into data engineering.
Häufig gestellte Fragen
Weitere Fragen
Finanzielle Unterstützung verfügbar,




