Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
Lernen Sie neue Konzepte von Branchenexperten
Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
Erwerben Sie ein Berufszertifikat zur Vorlage
In diesem Kurs gibt es 2 Module
Dieser praxisorientierte Kurs vermittelt den Teilnehmern die Fähigkeit, durchgängige ETL-Workflows (Extrahieren, Transformieren, Laden) mit Apache Spark in einem realen Data Engineer-Kontext zu entwerfen, zu erstellen und zu verwalten. Der Kurs ist in zwei umfassende Module gegliedert und beginnt mit der grundlegenden Einrichtung, wobei die Teilnehmer durch die Installation der wesentlichen Komponenten wie PySpark, Hadoop und MySQL geführt werden. Die Teilnehmer lernen, ihre Umgebung zu konfigurieren, Projektstrukturen zu organisieren und Quelldatensätze effektiv zu erforschen. Im weiteren Verlauf des Kurses entwickeln die Teilnehmer Spark-Anwendungen, um vollständige und inkrementelle Datenladungen mithilfe der JDBC-Integration mit MySQL durchzuführen. Anhand praktischer Beispiele wenden sie Transformationslogik mit Spark SQL an, filtern Daten auf der Grundlage von Geschäftsregeln und behandeln häufige Probleme wie Typabweichungen und Probleme mit der Ordnerstruktur während der Spark-Bereitstellung. Am Ende des Kurses sind die Teilnehmer in der Lage, Spark-basierte ETL-Pipelines zu konstruieren, auszuführen und zu optimieren, die skalierbar und produktionsbereit sind, so dass sie in der Lage sind, einen effektiven Beitrag in realen Data-Engineering-Rollen zu leisten.
Dieses Modul führt die Lernenden in die Grundlagen des Aufbaus eines ETL-Frameworks mit Apache Spark ein. Es beginnt mit einem Überblick über das Spark-Ökosystem und seine Vorteile bei der Big Data-Verarbeitung. Die Lernenden werden durch die Installation und Konfiguration der wesentlichen Softwarepakete, die Einrichtung der Entwicklungsumgebung und das Verständnis der Struktur eines Spark-basierten ETL-Projekts geführt. Das Modul behandelt auch die Arbeit mit realen Datensätzen und die Vorbereitung von Konfigurationsdateien für die Interaktion mit Datenbanken - eine solide Grundlage für skalierbare Workflows zur Datenverarbeitung.
Das ist alles enthalten
5 Videos3 Aufgaben
Infos zu Modulinhalt anzeigen
5 Videos•Insgesamt 52 Minuten
Einführung in das Projekt•14 Minuten
Installation von Paketen•7 Minuten
Installation der Pakete fortsetzen•8 Minuten
Aufbau der Projektstruktur•10 Minuten
Datensatz erforschen•12 Minuten
3 Aufgaben•Insgesamt 60 Minuten
Einstieg in das ETL-Projekt (Extrahieren, Transformieren, Laden)•15 Minuten
Aufbau der Projektstruktur und Verständnis der Daten•15 Minuten
Benotetes Quiz - Aufbau des Fundaments•30 Minuten
Aufbau von ETL-Workflows in Apache Spark
Modul 2•2 Stunden abzuschließen
Moduldetails
Dieses Modul führt die Lernenden durch die praktische Implementierung von Prozessen zum Extrahieren, Transformieren, Laden (ETL) mit Apache Spark. Die Lernenden erforschen das vollständige Laden von Daten in MySQL, wenden Transformationslogik mit Spark SQL an und behandeln inkrementelle Ladeszenarien, indem sie neue Einträge verfolgen und verwalten. Die Lektionen umfassen Fehlerbehandlung, Filterstrategien, Datentypkompatibilität und Datenbankintegration mit JDBC - alles in einer praktischen PySpark-Umgebung. Dieses Modul stärkt das angewandte Wissen über Spark für reale Data-Engineering-Aufgaben.
Das ist alles enthalten
6 Videos3 Aufgaben
Infos zu Modulinhalt anzeigen
6 Videos•Insgesamt 47 Minuten
Gesamte Last und Transformationen Teil 1•7 Minuten
Gesamte Last und Transformationen Teil 2•7 Minuten
Gesamte Last und Transformationen Teil 3•7 Minuten
Gesamte Last und Transformationen Teil 4•9 Minuten
Inkrementelle Last•7 Minuten
Inkrementelle Last Fortsetzen•10 Minuten
3 Aufgaben•Insgesamt 60 Minuten
Vollständige Last und Transformationen•15 Minuten
Handhabung inkrementeller Lasten•15 Minuten
Benotetes Quiz - Erstellen von ETL Workflows in Apache Spark•30 Minuten
Erwerben Sie ein Karrierezertifikat.
Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
Dozent
Lehrkraftbewertungen
Lehrkraftbewertungen
Wir haben alle Lernenden um Feedback zu unseren Dozenten gebeten, ausgehend von der Qualität ihres Unterrichtsstils.
Willkommen bei EDUCBA, einem Ort, an dem das Wissen grenzenlos ist! Wir bieten eine große Auswahl an lehrreichen und fesselnden Programmen, die Studenten jeden Alters und jeder Erfahrung fördern. Starten Sie ganz bequem von zu Hause aus eine revolutionäre Bildungserfahrung mit unseren hochmodernen Technologiekursen und erfahrenen Lehrern.
Wann werde ich Zugang zu den Vorlesungen und Aufgaben haben?
Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Was bekomme ich, wenn ich mich für diese Specialization einschreibe?
Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzufügen.
Ist finanzielle Hilfe verfügbar?
Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.