Wann werde ich mein Kurszertifikat erhalten?

Wenn Sie den Kurs erfolgreich abgeschlossen haben, wird Ihr elektronisches Kurszertifikat zu Ihrer Erfolgsseite hinzugefügt - von dort aus können Sie Ihr Kurszertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen.

Warum kann ich diesen Kurs nicht besuchen?

Dieser Kurs ist derzeit nur für Lernende verfügbar, die eine finanzielle Unterstützung gezahlt oder erhalten haben, sofern verfügbar.

Ist finanzielle Hilfe verfügbar?

Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.

Datentechnik mit Scala und Spark

Sichern Sie sich eines unserer besten Angebote mit Coursera Plus für 199 $ (normalerweise 399 $). Jetzt sparen.

Datentechnik mit Scala und Spark

Dozent: Packt - Course Instructors

Bei enthalten

Mehr erfahren

Fragen Sie Coursera

13 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

2 Wochen zu vervollständigen

unter 10 Stunden pro Woche

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

13 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

2 Wochen zu vervollständigen

unter 10 Stunden pro Woche

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

Eine Entwicklungsumgebung für die Erstellung von Datenpipelines in Scala einrichten
Verwenden Sie Spark DataFrames, Datasets und SQL mit Scala zur Datenverarbeitung
Daten mit Deequ aufbereiten und bereinigen, um die Datenqualität zu verbessern

Kompetenzen, die Sie erwerben

Kategorie: Daten-Pipelines
Kategorie: Kontinuierliche Integration
Kategorie: Qualität der Daten
Kategorie: CI/CD
Kategorie: Einheitliche Prüfung
Kategorie: Validierung von Daten
Kategorie: Datenumwandlung
Kategorie: Datenspeicher
Kategorie: Integrität der Daten
Kategorie: Testgetriebene Entwicklung (TDD)
Kategorie: Datenarchitektur
Kategorie: Datenverarbeitung
Kategorie: Kontinuierliche Bereitstellung
Kategorie: Instandhaltbarkeit
Kategorie: Leistungsoptimierung

Werkzeuge, die Sie lernen werden

Kategorie: Apache Spark
Kategorie: Apache Airflow
Kategorie: Scala-Programmierung
Kategorie: Apache Kafka
Kategorie: Daten-Seen

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

März 2026

Bewertungen

13 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Weitere Informationen zu Coursera für Unternehmen

Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

In diesem Kurs gibt es 13 Module

Dieser Kurs soll Dateningenieuren die Fähigkeiten vermitteln, skalierbare und effiziente Datenpipelines mit Scala und Spark zu erstellen. Die Teilnehmer lernen Best Practices für die Entwicklung, das Testen und die Bereitstellung in Cloud-Umgebungen kennen, wobei der Schwerpunkt auf der Leistungsoptimierung und der Sicherstellung der Datenqualität liegt. Der Kurs vermittelt die notwendigen Werkzeuge, um Rohdaten in verwertbare Erkenntnisse umzuwandeln, was ihn in der heutigen datengesteuerten Welt äußerst relevant macht.

Im Laufe des Kurses verbessern die Teilnehmer ihre Data-Engineering-Fähigkeiten, indem sie Techniken zum Aufbau von Streaming- und Batch-Datenpipelines erlernen. Der Schwerpunkt der Inhalte liegt auf praktischen Ergebnissen wie Leistungsoptimierung und Datenprofilierung. Anhand praktischer Beispiele und Schritt-für-Schritt-Anleitungen erwerben die Teilnehmer ein solides Verständnis von Echtzeit- und Batch-Verarbeitungspipelines. Was diesen Kurs einzigartig macht, ist die Kombination aus grundlegender Theorie und praktischen Anwendungen. Am Ende des Kurses sind Sie in der Lage, mit Scala und Spark große Datensätze zu verarbeiten und Pipelines in Cloud-Umgebungen effektiv zu optimieren. Dieser Kurs ist ideal für Dateningenieure mit etwas Erfahrung in der Datenverarbeitung. Zwar werden Kenntnisse über Konzepte des Data Engineering und Cloud-Technologien vorausgesetzt, doch jeder, der seine Fähigkeiten in Scala und Spark verbessern möchte, wird von dem praktischen, schrittweisen Ansatz profitieren.

In diesem Abschnitt befassen wir uns mit funktionaler Programmierung, Funktionen höherer Ordnung, polymorphen Funktionen und Musterabgleich in Scala für Anwendungen im Bereich Data Engineering.

Das ist alles enthalten

2 Videos6 Lektüren1 Aufgabe

2 VideosInsgesamt 2 Minuten

Überblick über den Kurs1 Minute
Scala-Grundlagen für Dateningenieure – Übersichtsvideo1 Minute

6 LektürenInsgesamt 120 Minuten

Einführung10 Minuten
Objekte, Klassen und Traits verstehen10 Minuten
Merkmal10 Minuten
Beispiele für HOFs aus der Scala-Sammlungsbibliothek30 Minuten
Polymorphe Funktionen verstehen30 Minuten
Grundlagen des Musterabgleichs30 Minuten

1 AufgabeInsgesamt 10 Minuten

Scala-Grundlagen für Dateningenieure10 Minuten

In diesem Abschnitt befassen wir uns mit cloudbasierten und lokalen Umgebungen für Data-Engineering-Pipelines und konzentrieren uns dabei auf Einrichtungsprozesse, Vor- und Nachteile sowie praktische Anwendungsbeispiele.

Das ist alles enthalten

1 Video5 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit den APIs von Spark und konzentrieren uns dabei auf DataFrame und Dataset für die verteilte Datenverarbeitung.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der Verwendung der Spark-JDBC-API für den Datenbankzugriff, der Gestaltung von Datenbankschnittstellen und der Durchführung von Operationen unter Einbeziehung von Konfigurationsdaten.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit Objektspeichern, Data Lakes und Lakehouses und konzentrieren uns dabei auf deren Rolle bei der effizienten Verwaltung groß angelegter Datenworkflows.

Das ist alles enthalten

1 Video6 Lektüren1 Aufgabe

1 VideoInsgesamt 1 Minute

Objektspeicher und Data Lakes – Übersichtsvideo1 Minute

6 LektürenInsgesamt 65 Minuten

Einführung5 Minuten
Objektspeicher10 Minuten
Ein tiefer Einblick in die „Lakehouses“10 Minuten
Streaming-Daten10 Minuten
Verarbeitung und Spülbecken10 Minuten
Ströme aggregieren20 Minuten

1 AufgabeInsgesamt 10 Minuten

Grundlagen der Datenspeicherung und -verwaltung10 Minuten

In diesem Abschnitt befassen wir uns mit Spark-Transformationen, Aggregationen, Joins und Fensterfunktionen, um die Datenverarbeitung für BI und Analytik zu optimieren. Zu den wichtigsten Konzepten zählen die effiziente Datenbearbeitung und die Entwicklung von Datenpipelines.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit Deequ, um Datenqualitätsprüfungen durchzuführen, die Vollständigkeit und Richtigkeit zu analysieren und Einschränkungen festzulegen, um zuverlässige Datenpipelines zu gewährleisten.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit testgetriebener Entwicklung, statischer Codeanalyse und Linting, um die Codequalität, Wartbarkeit und Konsistenz in Data-Engineering-Projekten zu verbessern.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

1 VideoInsgesamt 1 Minute

Testgetriebene Entwicklung, Code-Qualität und Wartbarkeit – Übersichtsvideo1 Minute

4 LektürenInsgesamt 70 Minuten

Einführung20 Minuten
Durchführung von Integrationstests10 Minuten
Statische Codeanalyse durchführen30 Minuten
Linting und Code-Stil verstehen10 Minuten

1 AufgabeInsgesamt 10 Minuten

Grundlagen der testgetriebenen Entwicklung und der Code-Wartbarkeit10 Minuten

In diesem Abschnitt befassen wir uns mit CI/CD-Verfahren unter Verwendung von GitHub zur Automatisierung von Scala-Datenpipeline-Workflows, wobei der Schwerpunkt auf GitHub Actions, Versionskontrolle und zuverlässigen Bereitstellungsprozessen liegt.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der Orchestrierung von Datenpipelines mithilfe von Tools wie Airflow, Argo, Databricks und Azure Data Factory. Dabei konzentrieren wir uns auf das Workflow-Design, das Aufgabenmanagement und praktische Implementierungsstrategien.

Das ist alles enthalten

1 Video6 Lektüren1 Aufgabe

1 VideoInsgesamt 1 Minute

Orchestrierung der Datenpipeline – Übersichtsvideo1 Minute

6 LektürenInsgesamt 80 Minuten

Einführung10 Minuten
Überwachung und Benutzeroberfläche10 Minuten
Arbeiten mit Argo Workflows20 Minuten
Erstellen eines Argo-Workflows10 Minuten
Verwendung von Databricks-Workflows20 Minuten
Nutzung von Azure Data Factory10 Minuten

1 AufgabeInsgesamt 10 Minuten

Grundlagen der Datenpipeline-Orchestrierung10 Minuten

In diesem Abschnitt analysieren wir die Spark-UI-Metriken, um Leistungsprobleme zu identifizieren, das Daten-Shuffling zu optimieren und die Rechenressourcen für eine effiziente Datenverarbeitung bedarfsgerecht anzupassen.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der Erstellung von Batch-Pipelines unter Verwendung von Spark und Scala, wobei der Schwerpunkt auf der Medallion-Architektur, der Datenerfassung, der Datentransformation und der Orchestrierung für eine skalierbare Datenverarbeitung liegt.

Das ist alles enthalten

1 Video5 Lektüren1 Aufgabe

1 VideoInsgesamt 1 Minute

Erstellen von Batch-Pipelines mit Spark und Scala – Übersichtsvideo1 Minute

5 LektürenInsgesamt 60 Minuten

Einführung10 Minuten
Die Daten verstehen20 Minuten
Die End-to-End-Pipeline10 Minuten
Die Daten umwandeln10 Minuten
Erstellen einer Serviceschicht10 Minuten

1 AufgabeInsgesamt 10 Minuten

Grundlagen der Datenpipeline mit Spark und Scala10 Minuten

In diesem Abschnitt befassen wir uns mit der Erstellung von Echtzeit-Datenpipelines unter Verwendung von Spark, Scala und Kafka für IoT-Anwendungen. Zu den wichtigsten Konzepten zählen die Datenerfassung, die Datentransformation und die Gestaltung der Ausgabeschicht.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

Dozent

Packt - Course Instructors

Packt

1.946 Kurse575.115 Lernende

von

Packt

Mehr von Datenverwaltung entdecken

Status: Kostenloser Testzeitraum
Packt
Apache Spark with Scala – Hands-On with Big Data!
Kurs
Status: Kostenloser Testzeitraum
Duke University
Spark, Hadoop, and Snowflake for Data Engineering
Kurs
Packt
Data Engineering with Databricks Cookbook
Kurs
Status: Kostenloser Testzeitraum
EDUCBA
Apache Spark with Scala: Master Data Building & Analysis
Kurs

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018

„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020

„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021

„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen

Ja, Sie können das erste Video in der Vorschau ansehen und den Lehrplan einsehen, bevor Sie sich anmelden. Sie müssen den Kurs kaufen, um auf Inhalte zuzugreifen, die nicht in der Vorschau enthalten sind.

Wenn Sie sich vor dem Beginn der Sitzung in den Kurs einschreiben, haben Sie Zugang zu allen Vorlesungsvideos und Lesestoff für den Kurs. Sobald die Sitzung beginnt, können Sie die Aufgaben einreichen.

Sobald Sie sich angemeldet haben und Ihre Sitzung beginnt, haben Sie Zugang zu allen Videos und anderen Ressourcen, einschließlich der Lektüre und dem Diskussionsforum des Kurses. Sie können Übungsaufgaben ansehen und einreichen und die erforderlichen benoteten Aufgaben erledigen, um eine Note und ein Kurszertifikat zu erhalten.

Weitere Fragen

Besuchen Sie die das Hilfe-Center für Kursteilnehmer.

Finanzielle Unterstützung verfügbar,

Datentechnik mit Scala und Spark

Datentechnik mit Scala und Spark

Was Sie lernen werden

Kompetenzen, die Sie erwerben

Werkzeuge, die Sie lernen werden

Wichtige Details

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

In diesem Kurs gibt es 13 Module

Scala-Grundlagen für Dateningenieure

Das ist alles enthalten

Umgebung einrichten

Das ist alles enthalten

Eine Einführung in Apache Spark und seine APIs: DataFrame, Dataset und Spark SQL

Das ist alles enthalten

Arbeiten mit Datenbanken

Das ist alles enthalten

Objektspeicher und Data Lakes

Das ist alles enthalten

Verständnis der Datenumwandlung

Das ist alles enthalten

Datenprofilierung und Datenqualität

Das ist alles enthalten

Testgetriebene Entwicklung, Codequalität und Wartbarkeit

Das ist alles enthalten

CI/CD mit GitHub

Das ist alles enthalten

Koordination der Datenpipeline

Das ist alles enthalten

Leistungsoptimierung

Das ist alles enthalten

Erstellen von Batch-Pipelines mit Spark und Scala

Das ist alles enthalten

Erstellung von Streaming-Pipelines mit Spark und Scala

Das ist alles enthalten

Dozent

von

Mehr von Datenverwaltung entdecken

Apache Spark with Scala – Hands-On with Big Data!

Spark, Hadoop, and Snowflake for Data Engineering

Data Engineering with Databricks Cookbook

Apache Spark with Scala: Master Data Building & Analysis

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.

Sparen Sie zur Jahresmitte und bringen Sie Ihre Karriere in Schwung

Helfen Sie Ihrem Team aufzusteigen

Häufig gestellte Fragen

Kann ich einen Kurs vor der Einschreibung ansehen?

Wann werde ich Zugang zu den Vorlesungen und Aufgaben haben?

Was bekomme ich, wenn ich mich einschreibe?

Weitere Fragen