In diesem Kurs werden verschiedene Themen des Data Engineering zur Unterstützung von Entscheidungsunterstützungssystemen, Data Analytics, Data Mining, Maschinelles Lernen und Künstliche Intelligenz behandelt. Sie werden sich mit der Architektur von Data Warehouses vor Ort, der dimensionalen Modellierung von Data Warehouses, der Integration von Extrahieren, Transformieren, Laden (ETL) von Quellsystemen in Data Warehouses, OLAP-Systemen (On-line Analytical Processing) und der sich entwickelnden Welt der Datenqualität und Datenintegration beschäftigen. Es bietet Ihnen die Möglichkeit, Cloud-basierte Datenpipelines zu entwerfen, zu entwickeln und zu pflegen. Es werden sowohl lokale als auch Cloud-basierte Plattformen verwendet, um Data-Engineering-Techniken mit operativen und analytischen Data Warehouses zu veranschaulichen und zu implementieren.
In diesem Modul werden Data Warehousing und Business Intelligence vorgestellt, wobei der Schwerpunkt auf ihrer Rolle bei der Verbesserung der Entscheidungsfindung in Unternehmen liegt. Data Warehouses wandeln Rohdaten mit Hilfe von Prozessen wie ETL (Extrahieren, Transformieren, Laden) in verwertbare Erkenntnisse um, unterstützt von Tools wie OLAP für Abfragen und Data Mining. Während sich operative Datenbanken (OLTP) für tägliche Transaktionen eignen, sind OLAP-Datenbanken für komplexe Analysen optimiert.
Das ist alles enthalten
3 Videos6 Lektüren1 Aufgabe
Infos zu Modulinhalt anzeigen
3 Videos•Insgesamt 7 Minuten
Überblick über den Kurs•2 Minuten
Treffen Sie Ihren Ausbilder: Venkat Krishnamurthy•2 Minuten
Einführung in Data Warehouses•4 Minuten
6 Lektüren•Insgesamt 178 Minuten
Willkommen bei Data Warehousing & Integration Teil 1•2 Minuten
Syllabus - Data Warehousing & Integration Teil 1•10 Minuten
Akademische Integrität•1 Minute
Modul 1 Überblick•5 Minuten
Einführung in Data Warehouses•5 Minuten
Konzeptioneller Datenbankentwurf•155 Minuten
1 Aufgabe•Insgesamt 15 Minuten
Bewerten Sie Ihr Lernen: Konzeptionelle Datenbank-Modellierung•15 Minuten
Datenbank-Konzepte 2
Modul 2•6 Stunden abzuschließen
Moduldetails
Dieses Modul baut auf den Grundlagen des Datenbankentwurfs aus dem vorherigen Modul auf und konzentriert sich auf die Modellierung relationaler Datenbanken, Normalisierung und SQL. Die Lektüre wird Sie bei der Übersetzung eines konzeptionellen EER-Diagramms in ein relationales Modell anleiten, wobei die Einhaltung der Normalisierungsprinzipien sichergestellt und die dritte Normalform (3NF) angestrebt wird. Wir werden auch das Verständnis von Primärschlüsseln und Fremdschlüsseln zur Aufrechterhaltung der Datenintegrität und zum Aufbau von Tabellenbeziehungen hervorheben. Sie werden auch die Möglichkeit haben, relationale Modelle zu erstellen und zu kritisieren. Anschließend werden wir uns mit den SQL-Grundlagen befassen und dabei die Syntax (SELECT, INSERT, UPDATE, DELETE), Abfragetechniken (WHERE, ORDER BY, JOIN) und Operatoren mit Funktionen und Aggregaten (ANZAHL, SUMME, AVG, MIN, MAX) behandeln, die für die Abfrage und Verwaltung von Datenbanken von grundlegender Bedeutung sind.
Das ist alles enthalten
3 Lektüren2 Aufgaben1 App-Element
Infos zu Modulinhalt anzeigen
3 Lektüren•Insgesamt 339 Minuten
Modul 2 Überblick•5 Minuten
Logischer Datenbankentwurf•165 Minuten
SQL•169 Minuten
2 Aufgaben•Insgesamt 40 Minuten
Bewerten Sie Ihr Lernen: Logischer Datenbankentwurf•20 Minuten
Bewerten Sie Ihr Lernen: SQL•20 Minuten
1 App-Element•Insgesamt 10 Minuten
Normalisierung•10 Minuten
Data Warehouse-Konzepte
Modul 3•3 Stunden abzuschließen
Moduldetails
Dieses Modul bietet eine Einführung in Data Warehouse-Konzepte. Data Warehouses basieren auf einem multidimensionalen Modell. Wir werden das multidimensionale Modell und seine Darstellung in Form von Datenwürfeln (auch bekannt als Hyperwürfel) näher betrachten. Wir werden untersuchen, wie verschiedene Aspekte von Daten in Fakten, Maßnahmen und Dimensionen kategorisiert werden. Dimensionen wie "Produkt", "Zeit" und "Kunde" sind innerhalb eines Cubes hierarchisch organisiert, so dass die Daten auf verschiedenen Detailebenen analysiert werden können. Measures wie Menge und Verkaufsbetrag werden in diesen Würfeln gespeichert, und Analysten können mit Hilfe von "Roll-up"- und "Drill-down"-Techniken durch verschiedene Detailstufen navigieren. Außerdem werden wir uns mit Schlüsselkonzepten wie Granularität, Dimensionsschema und Mitgliedshierarchien befassen, die für das Verständnis der Strukturierung und Analyse von Daten in multidimensionalen Modellen von entscheidender Bedeutung sind. Schließlich werden wir lernen, Techniken wie Disjungheit, Vollständigkeit und Korrektheit zu verwenden, um die Genauigkeit und Integrität von Daten bei der Aggregation von Informationen in Datenwürfeln zu gewährleisten, was allgemein als Zusammenfassbarkeit bekannt ist.
Das ist alles enthalten
2 Videos5 Lektüren2 Aufgaben1 App-Element
Infos zu Modulinhalt anzeigen
2 Videos•Insgesamt 6 Minuten
Mentales Bild eines mehrdimensionalen Würfels•3 Minuten
Zusammenfassbarkeit•3 Minuten
5 Lektüren•Insgesamt 93 Minuten
Modul 3 Überblick•5 Minuten
Mehrdimensionales Modell•12 Minuten
Maßnahmen und Zusammenfassbarkeit•46 Minuten
OLAP-Operationen auf einem multidimensionalen Modell•10 Minuten
Data Warehouse und Architektur•20 Minuten
2 Aufgaben•Insgesamt 50 Minuten
Bewerten Sie Ihr Lernen: Maßnahmen und Zusammenfassbarkeit•25 Minuten
Bewerten Sie Ihr Lernen: OLAP-Operationen•25 Minuten
1 App-Element•Insgesamt 15 Minuten
Das multidimensionale Modell•15 Minuten
Konzeptioneller Entwurf 1
Modul 4•2 Stunden abzuschließen
Moduldetails
In diesem Modul werden wir die konzeptionelle Modellierung mit mehrdimensionalen Modellen erkunden, die mit MultiDim visualisiert werden. Dieser Ansatz hilft uns, Daten in Fakten und Dimensionen zu organisieren und die Beziehungen zwischen ihnen zu verstehen, was für die Entwicklung von Data Warehouses unerlässlich ist. Wir werden Themen wie Dimensionen (z. B. Datum, Kunde) und Kennzahlen (z. B. Menge, Gesamtumsatz) genauer untersuchen. Wir werden auch den Unterschied zwischen primären und sekundären Ereignissen erforschen und lernen, wie sie verwendet werden. Schließlich werden wir uns eine weitere Kategorisierung von Measures in Flow ansehen: Level und Unit Measures.
Bewerten Sie Ihr Lernen: Konzeptionelle Modellierung 1•15 Minuten
Bewerten Sie Ihr Lernen: Primäre und sekundäre Ereignisse•8 Minuten
Bewerten Sie Ihr Lernen: Additivität von Maßnahmen•8 Minuten
Konzeptioneller Entwurf 2
Modul 5•3 Stunden abzuschließen
Moduldetails
In diesem Modul werden wir uns mit der konzeptionellen Modellierung von Hierarchien in Data Warehouses beschäftigen und ihre Definitionen, Merkmale und Bedeutung untersuchen. Ausgewogene Hierarchien haben eine einheitliche Struktur, bei der jedes Kind ein Elternteil hat und alle Verzweigungen gleich lang sind, was die Datenanalyse konsistent und effizient macht. Im Gegensatz dazu weisen unausgewogene Hierarchien unterschiedliche Zweiglängen und fehlende Aggregationsebenen auf und bieten so die Flexibilität, reale Szenarien wie Produktkategorien und geografische Hierarchien zu modellieren. Sie werden auch verallgemeinerte Hierarchien kennen lernen, die "is-a"-Beziehungen zwischen Supertypen und Subtypen beinhalten und eine detaillierte Datendarstellung ermöglichen, aber eine sorgfältige Verwaltung der Aggregation und Spezialisierung erfordern. Wir werden auch alternative Hierarchien erforschen und verschiedene Möglichkeiten zur Organisation derselben Dimension aufzeigen, wie z. B. die kalendarische und die fiskalische Sicht auf die Zeit. Schließlich werden wir uns parallele Hierarchien ansehen, sowohl unabhängige als auch abhängige, als Werkzeuge für die Analyse von Daten aus mehreren Perspektiven, die komplexe Organisationsstrukturen darstellen. Das Verständnis dieser Hierarchietypen ist entscheidend für ein effektives Datenmanagement und die Analyse im Data Warehousing.
Das ist alles enthalten
4 Videos3 Lektüren2 Aufgaben
Infos zu Modulinhalt anzeigen
4 Videos•Insgesamt 14 Minuten
Ausgewogene und unausgewogene Hierarchien•5 Minuten
Verallgemeinerte Hierarchien•4 Minuten
Alternative Hierarchien•3 Minuten
Parallele Hierarchien•2 Minuten
3 Lektüren•Insgesamt 140 Minuten
Modul 5 Überblick•5 Minuten
Ausgewogene und unausgewogene Hierarchien•60 Minuten
Erweiterte Modellierungskonzepte•75 Minuten
2 Aufgaben•Insgesamt 23 Minuten
Bewerten Sie Ihr Lernen: Konzeptuelles Modellieren von Hierarchien•15 Minuten
Bewerten Sie Ihr Lernen: Fortgeschrittene Konzepte für die Modellierung•8 Minuten
Logische Modellierung
Modul 6•3 Stunden abzuschließen
Moduldetails
In diesem Modul befassen Sie sich mit der logischen Modellierung im Data Warehousing, d. h. mit dem Entwurf einer strukturierten, abstrakten Darstellung der zu speichernden Daten, wobei der Schwerpunkt darauf liegt, wie die Daten für eine effiziente Abfrage und Analyse organisiert, verknüpft und optimiert werden. Aufbauend auf den in den vorangegangenen Modulen erworbenen Kenntnissen werden Sie den nächsten Schritt im Data Warehouse-Design vollziehen: die Umsetzung eines konzeptionellen Modells in ein logisches Modell für die Implementierung. Das Modul konzentriert sich auf die relationale Darstellung von Data Warehouses, einschließlich der Untersuchung verschiedener Schema-Implementierungen: Star, Snowflake, Starflake und Constellation. Sie werden auch die Regeln für die Abbildung eines multidimensionalen konzeptionellen Modells auf ein relationales Modell untersuchen und dabei die Rolle und Bedeutung verschiedener Arten von Schlüsseln in diesem Prozess hervorheben. Außerdem werden wir Strategien zur Aufrechterhaltung der Konsistenz in einem Data Warehouse diskutieren. Schließlich werden Sie untersuchen, wie Sie bestimmte Dimensionen, wie z. B. die Zeit, vorbesetzen können, um die Abläufe zu rationalisieren und die Abfrageleistung zu verbessern.
Das ist alles enthalten
6 Videos11 Lektüren2 Aufgaben1 App-Element
Infos zu Modulinhalt anzeigen
6 Videos•Insgesamt 9 Minuten
Einführung in die logische Modellierung im Data Warehousing•2 Minuten
Verschiedene ROLAP-Schemata Schlussfolgerung•2 Minuten
Surrogat-Schlüssel•1 Minute
Die Bedeutung der Datenkonsistenz•1 Minute
Konsistenz in einem Data Warehouse Beispiel•2 Minuten
Beispiel für das Vorfüllen von Dimensionsdaten•1 Minute
11 Lektüren•Insgesamt 122 Minuten
Modul 6 Überblick•5 Minuten
Logische Modellierung des Data Warehouse•32 Minuten
Einführung in Surrogate Keys•10 Minuten
Vorteile von Surrogatschlüsseln•10 Minuten
Implementierung von Surrogatschlüsseln in einem Data Warehouse•10 Minuten
Die Bedeutung der Datenkonsistenz•5 Minuten
Herausforderungen und bewährte Praktiken für die Aufrechterhaltung und Sicherstellung der Datenkonsistenz•10 Minuten
Verstehen von vorfüllenden Dimensionen•5 Minuten
Der Prozess der Vorauswahl der zeitlichen und geografischen Dimensionen•5 Minuten
Vorteile der Vorbelegung von Zeit- und Geografiedimensionen•5 Minuten
Vorbelegung von Dimensionen•25 Minuten
2 Aufgaben•Insgesamt 35 Minuten
Bewerten Sie Ihr Lernen: Logische Modellierung•20 Minuten
Bewerten Sie Ihr Lernen: Schlüssel, Konsistenz und Vorbelegung von Dimensionen•15 Minuten
1 App-Element•Insgesamt 20 Minuten
Arten von ROLAP-Schemata•20 Minuten
Langsam wechselnde Dimensionen
Modul 7•3 Stunden abzuschließen
Moduldetails
Die Entwicklung eines Data Warehouse ist ein komplexer Prozess, der den Übergang von konzeptionellen Modellen auf hoher Ebene zu detaillierten logischen Modellen erfordert. Dieser Übergang ist von entscheidender Bedeutung, da er die Brücke zwischen dem Verständnis der geschäftlichen Anforderungen und deren Umsetzung in ein technisches Framework schlägt, das diese Anforderungen effektiv unterstützt. In diesem Modul wird der logische Modellierungsprozess, der im vorherigen Modul behandelt wurde, vertieft, wobei der Schwerpunkt auf dem Entwurf dimensionaler Modelle und den Feinheiten der Hierarchiemodellierung liegt. Bei der Vertiefung lernen Sie die logische Modellierung für fortgeschrittene Konzepte wie Many-to-Many-Dimensionen, Verknüpfungen zwischen Fakten und Fakten mit mehreren Granularitäten kennen. Wir werden auch das Konzept der Slowly Changing Dimensions (SCDs) erkunden, die für die Verwaltung historischer Daten in Ihrem Warehouse unerlässlich sind. Sie lernen, wie Sie verschiedene SCD-Typen implementieren, um Änderungen in Dimensionsdaten im Laufe der Zeit genau zu verfolgen und zu verwalten. Schließlich werden wir uns mit SQL für OLAP befassen, wobei der Schwerpunkt auf fortgeschrittenen Konzepten wie Aggregation und Fensterfunktionen liegt, und Sie werden lernen, wie Sie SQL zum Abfragen und Analysieren von Data Warehouses einsetzen können.
Das ist alles enthalten
5 Videos11 Lektüren1 Aufgabe
Infos zu Modulinhalt anzeigen
5 Videos•Insgesamt 13 Minuten
Modellierung verschiedener Arten von Hierarchien•5 Minuten
SCD Bewährte Praktiken•2 Minuten
Übersetzen zwischen SCDs•3 Minuten
Beispiele für das Übersetzen zwischen SCD-Typen•2 Minuten
Schlussfolgerung•1 Minute
11 Lektüren•Insgesamt 137 Minuten
Modul 7 Überblick•5 Minuten
Einführung in konzeptionelle und logische Modelle•15 Minuten
Mapping-Prozess•10 Minuten
Fazit•1 Minute
Erweiterte Modellierungskonzepte•36 Minuten
Verständnis für sich langsam verändernde Dimensionen•5 Minuten
Arten von sich langsam verändernden Dimensionen•10 Minuten
Vorteile des Managements sich langsam verändernder Dimensionen•5 Minuten
Schritte zum Umrechnen zwischen SCD-Typen•10 Minuten
Durchführung von OLAP-Abfragen mit SQL•38 Minuten
Herzlichen Glückwunsch!•2 Minuten
1 Aufgabe•Insgesamt 25 Minuten
Bewerten Sie Ihr Lernen: Logische Darstellung von Hierarchien und fortgeschrittene Konzepte•25 Minuten
Northeastern wurde 1898 gegründet und ist eine globale Forschungsuniversität mit einem unverwechselbaren, erfahrungsorientierten Ansatz für Bildung und Entdeckung. Die Universität ist führend im Bereich des erfahrungsbasierten Lernens und verfügt über das weltweit umfassendste Programm für kooperative Ausbildung. Der Geist der Zusammenarbeit leitet ein vom Nutzen inspiriertes Forschungsunternehmen, das sich auf die Lösung globaler Herausforderungen in den Bereichen Gesundheit, Sicherheit und Nachhaltigkeit konzentriert.
OK
Warum entscheiden sich Menschen für Coursera für ihre Karriere?
Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Wann werde ich Zugang zu den Vorlesungen und Aufgaben haben?
Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Was erhalte ich, wenn ich das Zertifikat kaufe?
Wenn Sie ein Zertifikat erwerben, erhalten Sie Zugang zu allen Kursmaterialien, einschließlich der benoteten Aufgaben. Nach Abschluss des Kurses wird Ihr elektronisches Zertifikat zu Ihrer Erfolgsseite hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen.
Ist finanzielle Hilfe verfügbar?
Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.