EDUCBA
Spezialisierung für Spark and Python for Big Data with PySpark

Entdecken Sie neue Fähigkeiten mit $120 Rabatt auf Kurse von Branchenexperten. Jetzt sparen.

Diese spezialisierung ist nicht verfügbar in Deutsch (Deutschland)

Wir übersetzen es in weitere Sprachen.
EDUCBA

Spezialisierung für Spark and Python for Big Data with PySpark

Spark and Python for Big Data with PySpark. Build scalable data workflows and predictive models using Spark and Python.

EDUCBA

Dozent: EDUCBA

Bei Coursera Plus enthalten

Befassen Sie sich eingehend mit einem Thema
Stufe Anfänger

Empfohlene Erfahrung

4 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Befassen Sie sich eingehend mit einem Thema
Stufe Anfänger

Empfohlene Erfahrung

4 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Apply PySpark to build, optimize, and evaluate distributed data processing workflows.

  • Design and execute predictive machine learning models for large-scale analytics.

  • Construct ETL pipelines, real-time streaming applications, and advanced big data solutions with Spark.

Kompetenzen, die Sie erwerben

  • Kategorie: Data Processing
  • Kategorie: Scala Programming
  • Kategorie: Real Time Data
  • Kategorie: Data Structures
  • Kategorie: Systems Integration
  • Kategorie: Apache Maven
  • Kategorie: Object Oriented Programming (OOP)
  • Kategorie: Scalability
  • Kategorie: Apache Hadoop
  • Kategorie: Apache Spark
  • Kategorie: Data Import/Export
  • Kategorie: Data Pipelines
  • Kategorie: Development Environment
  • Kategorie: Software Installation
  • Kategorie: PySpark
  • Kategorie: Data Store
  • Kategorie: Data Transformation
  • Kategorie: MySQL
  • Kategorie: Extract, Transform, Load
  • Kategorie: System Configuration
  • Kategorie: Java Platform Enterprise Edition (J2EE)
  • Kategorie: Data Manipulation
  • Kategorie: JSON
  • Kategorie: Distributed Computing
  • Kategorie: Performance Tuning
  • Kategorie: Big Data
  • Kategorie: Advanced Analytics
  • Kategorie: Unstructured Data
  • Kategorie: Statistical Modeling
  • Kategorie: Data Mining
  • Kategorie: Customer Analysis
  • Kategorie: Text Mining
  • Kategorie: Image Analysis
  • Kategorie: Simulation and Simulation Software
  • Kategorie: Supervised Learning
  • Kategorie: Classification And Regression Tree (CART)
  • Kategorie: Predictive Modeling
  • Kategorie: Predictive Analytics
  • Kategorie: Unsupervised Learning
  • Kategorie: Statistical Machine Learning
  • Kategorie: Random Forest Algorithm
  • Kategorie: Machine Learning Algorithms
  • Kategorie: Regression Analysis
  • Kategorie: Applied Machine Learning
  • Kategorie: SQL
  • Kategorie: Debugging
  • Kategorie: Programming Principles
  • Kategorie: Python Programming

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Unterrichtet in Englisch
Kürzlich aktualisiert!

September 2025

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse.

  • Erlernen Sie gefragte Kompetenzen von Universitäten und Branchenexperten.
  • Erlernen Sie ein Thema oder ein Tool mit echten Projekten.
  • Entwickeln Sie ein fundiertes Verständnisse der Kernkonzepte.
  • Erwerben Sie ein Karrierezertifikat von EDUCBA.

Spezialisierung - 6 Kursreihen

Was Sie lernen werden

  • Recall Python syntax and identify key PySpark components for data processing.

  • Apply RDD transformations, joins, and JDBC integration with MySQL.

  • Build scalable pipelines like word count and debug PySpark applications.

Kompetenzen, die Sie erwerben

Kategorie: Distributed Computing
Kategorie: Data Transformation
Kategorie: Data Pipelines
Kategorie: MySQL
Kategorie: SQL
Kategorie: Debugging
Kategorie: Programming Principles
Kategorie: Python Programming
Kategorie: Data Manipulation
Kategorie: PySpark
Kategorie: Apache Spark
Kategorie: Data Processing

Was Sie lernen werden

  • Build and evaluate regression models in PySpark using linear, GLM, and ensemble methods.

  • Apply logistic regression, decision trees, and Random Forests for classification.

  • Implement K-Means clustering and assess scalable ML workflows with PySpark.

Kompetenzen, die Sie erwerben

Kategorie: Supervised Learning
Kategorie: Classification And Regression Tree (CART)
Kategorie: Predictive Modeling
Kategorie: Data Pipelines
Kategorie: Predictive Analytics
Kategorie: Unsupervised Learning
Kategorie: Statistical Machine Learning
Kategorie: Random Forest Algorithm
Kategorie: Machine Learning Algorithms
Kategorie: Apache Spark
Kategorie: Regression Analysis
Kategorie: PySpark
Kategorie: Applied Machine Learning

Was Sie lernen werden

  • Apply RFM analysis and K-Means clustering for customer segmentation.

  • Extract and analyze textual data using OCR with PySpark DataFrames.

  • Build and interpret Monte Carlo simulations for uncertainty modeling.

Kompetenzen, die Sie erwerben

Kategorie: Advanced Analytics
Kategorie: Data Processing
Kategorie: Unstructured Data
Kategorie: Statistical Modeling
Kategorie: PySpark
Kategorie: Data Mining
Kategorie: Customer Analysis
Kategorie: Data Manipulation
Kategorie: Text Mining
Kategorie: Image Analysis
Kategorie: Simulation and Simulation Software
Kategorie: Big Data

Was Sie lernen werden

  • Apply Scala fundamentals including variables, functions, and advanced concepts.

  • Implement Spark RDD operations, streaming, and fault-tolerant pipelines.

  • Build real-time big data solutions integrating Spark with external systems.

Kompetenzen, die Sie erwerben

Kategorie: Data Processing
Kategorie: Scala Programming
Kategorie: Real Time Data
Kategorie: Data Structures
Kategorie: Systems Integration
Kategorie: Apache Maven
Kategorie: Object Oriented Programming (OOP)
Kategorie: Scalability
Kategorie: Apache Hadoop
Kategorie: Apache Spark

Was Sie lernen werden

  • Install and configure PySpark, Hadoop, and MySQL for ETL workflows.

  • Build Spark applications for full and incremental data loads via JDBC.

  • Apply transformations, handle deployment issues, and optimize ETL pipelines.

Kompetenzen, die Sie erwerben

Kategorie: Data Import/Export
Kategorie: Data Pipelines
Kategorie: Development Environment
Kategorie: Software Installation
Kategorie: PySpark
Kategorie: Data Store
Kategorie: Data Transformation
Kategorie: MySQL
Kategorie: Apache Spark
Kategorie: Extract, Transform, Load
Kategorie: System Configuration
Kategorie: Apache Hadoop
Kategorie: Java Platform Enterprise Edition (J2EE)
Kategorie: Data Manipulation

Was Sie lernen werden

  • Describe Spark architecture, core components, and RDD programming constructs.

  • Apply transformations, persistence, and handle multiple file formats in Spark.

  • Develop scalable workflows and evaluate Spark applications for optimization.

Kompetenzen, die Sie erwerben

Kategorie: PySpark
Kategorie: JSON
Kategorie: Data Transformation
Kategorie: Data Processing
Kategorie: Data Manipulation
Kategorie: Distributed Computing
Kategorie: Performance Tuning
Kategorie: Apache Spark
Kategorie: Data Pipelines
Kategorie: Scala Programming
Kategorie: Big Data

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozent

EDUCBA
EDUCBA
230 Kurse104.910 Lernende

von

EDUCBA

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Coursera Plus

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen