Edureka
Spezialisierung für PySpark for Data Science

Erwerben Sie mit Coursera Plus für 199 $ (regulär 399 $) das nächste Level. Jetzt sparen.

spezialisierung ist nicht verfügbar in Deutsch (Deutschland)

Wir übersetzen es in weitere Sprachen.
Edureka

Spezialisierung für PySpark for Data Science

Fast-track your career in Data Science with PySpark. Unlock the potential of PySpark for data science, mastering data processing and analytics, and machine learning to drive informed decision-making.

Edureka

Dozent: Edureka

Bei Coursera Plus enthalten

Befassen Sie sich eingehend mit einem Thema
Stufe Mittel

Empfohlene Erfahrung

4 months to complete
unter 5 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Befassen Sie sich eingehend mit einem Thema
Stufe Mittel

Empfohlene Erfahrung

4 months to complete
unter 5 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Master the fundamentals of Big Data and PySpark to process data using RDDs and DataFrames.

  • Optimize data science workflows by leveraging advanced PySpark DataFrame and SQL operations.

  • Build machine learning models with PySpark MLlib, applying regression and clustering techniques.

  • Implement data streaming with structured streaming and explore NLP for text processing in big data.

Kompetenzen, die Sie erwerben

  • Kategorie: Dashboard
  • Kategorie: Data Pipelines
  • Kategorie: Deep Learning
  • Kategorie: Natural Language Processing
  • Kategorie: Data Processing
  • Kategorie: Machine Learning
  • Kategorie: Data Storage Technologies
  • Kategorie: Machine Learning Methods
  • Kategorie: Data Transformation
  • Kategorie: Logistic Regression
  • Kategorie: Data Analysis Expressions (DAX)
  • Kategorie: PySpark
  • Kategorie: Data Storage
  • Kategorie: Data Visualization

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse.

  • Erlernen Sie gefragte Kompetenzen von Universitäten und Branchenexperten.
  • Erlernen Sie ein Thema oder ein Tool mit echten Projekten.
  • Entwickeln Sie ein fundiertes Verständnisse der Kernkonzepte.
  • Erwerben Sie ein Karrierezertifikat von Edureka.

Spezialisierung - 3 Kursreihen

Was Sie lernen werden

  • Explore the fundamental concepts of Big Data and the components of the Hadoop ecosystem.

  • Explain the architecture and key principles of Apache Spark and its role in big data processing.

  • Utilize RDD transformations and actions to effectively process large-scale datasets with PySpark.

  • Execute advanced DataFrame operations, including data manipulation and aggregation techniques.

Kompetenzen, die Sie erwerben

Kategorie: PySpark
Kategorie: Apache Spark
Kategorie: SQL
Kategorie: Big Data
Kategorie: Data Manipulation
Kategorie: Data Processing
Kategorie: Distributed Computing
Kategorie: Apache Hadoop
Kategorie: Data Storage Technologies
Kategorie: Data Analysis Expressions (DAX)
Kategorie: Data Transformation
Kategorie: Data Storage
Kategorie: Data Pipelines
Kategorie: Performance Tuning

Was Sie lernen werden

  • Implement machine learning models using PySpark MLlib.

  • Implement linear and logistic regression models for predictive analysis.

  • Apply clustering methods to group unlabeled data using algorithms like K-means.

  • Explore real-world applications of PySpark MLlib through practical examples.

Kompetenzen, die Sie erwerben

Kategorie: PySpark
Kategorie: Machine Learning Methods
Kategorie: Logistic Regression
Kategorie: Machine Learning
Kategorie: Applied Machine Learning

Was Sie lernen werden

  • Analyze streaming data to extract insights and trends in real-time applications.

  • Analyze real-time data streams and apply Spark Streaming techniques for efficient processing.

  • Develop robust streaming applications using Spark's Structured Streaming for fault-tolerant processing.

  • Implement NLP techniques to process and analyze textual data efficiently.

Kompetenzen, die Sie erwerben

Kategorie: PySpark
Kategorie: Apache Spark
Kategorie: Natural Language Processing
Kategorie: Data Processing
Kategorie: Real Time Data
Kategorie: Data Transformation
Kategorie: Dashboard
Kategorie: Deep Learning
Kategorie: Data Pipelines
Kategorie: Distributed Computing
Kategorie: Data Visualization
Kategorie: Performance Tuning

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozent

Edureka
Edureka
131 Kurse122.335 Lernende

von

Edureka

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen