Northeastern University
Data Warehousing und Integration Teil 1

Erwerben Sie mit Coursera Plus für 199 $ (regulär 399 $) das nächste Level. Jetzt sparen.

Northeastern University

Data Warehousing und Integration Teil 1

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
2 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
2 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Kompetenzen, die Sie erwerben

  • Kategorie: Data Governance
  • Kategorie: Datenqualität
  • Kategorie: Datenmodellierung
  • Kategorie: Systeme Design
  • Kategorie: Daten-Integration
  • Kategorie: Data-Mining
  • Kategorie: Star Schema
  • Kategorie: Datenanalyse
  • Kategorie: Datenbank-Design
  • Kategorie: Relationale Datenbanken
  • Kategorie: Daten Architektur
  • Kategorie: SQL
  • Kategorie: Datenmanagement
  • Kategorie: Business Intelligence
  • Kategorie: Extrahieren, Transformieren, Laden
  • Kategorie: Data-Warehousing

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

August 2025

Bewertungen

13 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

In diesem Kurs gibt es 7 Module

In diesem Modul werden Data Warehousing und Business Intelligence vorgestellt, wobei der Schwerpunkt auf ihrer Rolle bei der Verbesserung der Entscheidungsfindung in Unternehmen liegt. Data Warehouses wandeln Rohdaten mit Hilfe von Prozessen wie ETL (Extrahieren, Transformieren, Laden) in verwertbare Erkenntnisse um, unterstützt von Tools wie OLAP für Abfragen und Data Mining. Während sich operative Datenbanken (OLTP) für tägliche Transaktionen eignen, sind OLAP-Datenbanken für komplexe Analysen optimiert.

Das ist alles enthalten

3 Videos6 Lektüren1 Aufgabe

Dieses Modul baut auf den Grundlagen des Datenbankentwurfs aus dem vorherigen Modul auf und konzentriert sich auf die Modellierung relationaler Datenbanken, Normalisierung und SQL. Die Lektüre wird Sie bei der Übersetzung eines konzeptionellen EER-Diagramms in ein relationales Modell anleiten, wobei die Einhaltung der Normalisierungsprinzipien sichergestellt und die dritte Normalform (3NF) angestrebt wird. Wir werden auch das Verständnis von Primärschlüsseln und Fremdschlüsseln zur Aufrechterhaltung der Datenintegrität und zum Aufbau von Tabellenbeziehungen hervorheben. Sie werden auch die Möglichkeit haben, relationale Modelle zu erstellen und zu kritisieren. Anschließend werden wir uns mit den SQL-Grundlagen befassen und dabei die Syntax (SELECT, INSERT, UPDATE, DELETE), Abfragetechniken (WHERE, ORDER BY, JOIN) und Operatoren mit Funktionen und Aggregaten (ANZAHL, SUMME, AVG, MIN, MAX) behandeln, die für die Abfrage und Verwaltung von Datenbanken von grundlegender Bedeutung sind.

Das ist alles enthalten

3 Lektüren2 Aufgaben1 App-Element

Dieses Modul bietet eine Einführung in Data Warehouse-Konzepte. Data Warehouses basieren auf einem multidimensionalen Modell. Wir werden das multidimensionale Modell und seine Darstellung in Form von Datenwürfeln (auch bekannt als Hyperwürfel) näher betrachten. Wir werden untersuchen, wie verschiedene Aspekte von Daten in Fakten, Maßnahmen und Dimensionen kategorisiert werden. Dimensionen wie "Produkt", "Zeit" und "Kunde" sind innerhalb eines Cubes hierarchisch organisiert, so dass die Daten auf verschiedenen Detailebenen analysiert werden können. Measures wie Menge und Verkaufsbetrag werden in diesen Würfeln gespeichert, und Analysten können mit Hilfe von "Roll-up"- und "Drill-down"-Techniken durch verschiedene Detailstufen navigieren. Außerdem werden wir uns mit Schlüsselkonzepten wie Granularität, Dimensionsschema und Mitgliedshierarchien befassen, die für das Verständnis der Strukturierung und Analyse von Daten in multidimensionalen Modellen von entscheidender Bedeutung sind. Schließlich werden wir lernen, Techniken wie Disjungheit, Vollständigkeit und Korrektheit zu verwenden, um die Genauigkeit und Integrität von Daten bei der Aggregation von Informationen in Datenwürfeln zu gewährleisten, was allgemein als Zusammenfassbarkeit bekannt ist.

Das ist alles enthalten

2 Videos5 Lektüren2 Aufgaben1 App-Element

In diesem Modul werden wir die konzeptionelle Modellierung mit mehrdimensionalen Modellen erkunden, die mit MultiDim visualisiert werden. Dieser Ansatz hilft uns, Daten in Fakten und Dimensionen zu organisieren und die Beziehungen zwischen ihnen zu verstehen, was für die Entwicklung von Data Warehouses unerlässlich ist. Wir werden Themen wie Dimensionen (z. B. Datum, Kunde) und Kennzahlen (z. B. Menge, Gesamtumsatz) genauer untersuchen. Wir werden auch den Unterschied zwischen primären und sekundären Ereignissen erforschen und lernen, wie sie verwendet werden. Schließlich werden wir uns eine weitere Kategorisierung von Measures in Flow ansehen: Level und Unit Measures.

Das ist alles enthalten

2 Videos4 Lektüren3 Aufgaben

In diesem Modul werden wir uns mit der konzeptionellen Modellierung von Hierarchien in Data Warehouses beschäftigen und ihre Definitionen, Merkmale und Bedeutung untersuchen. Ausgewogene Hierarchien haben eine einheitliche Struktur, bei der jedes Kind ein Elternteil hat und alle Verzweigungen gleich lang sind, was die Datenanalyse konsistent und effizient macht. Im Gegensatz dazu weisen unausgewogene Hierarchien unterschiedliche Zweiglängen und fehlende Aggregationsebenen auf und bieten so die Flexibilität, reale Szenarien wie Produktkategorien und geografische Hierarchien zu modellieren. Sie werden auch verallgemeinerte Hierarchien kennen lernen, die "is-a"-Beziehungen zwischen Supertypen und Subtypen beinhalten und eine detaillierte Datendarstellung ermöglichen, aber eine sorgfältige Verwaltung der Aggregation und Spezialisierung erfordern. Wir werden auch alternative Hierarchien erforschen und verschiedene Möglichkeiten zur Organisation derselben Dimension aufzeigen, wie z. B. die kalendarische und die fiskalische Sicht auf die Zeit. Schließlich werden wir uns parallele Hierarchien ansehen, sowohl unabhängige als auch abhängige, als Werkzeuge für die Analyse von Daten aus mehreren Perspektiven, die komplexe Organisationsstrukturen darstellen. Das Verständnis dieser Hierarchietypen ist entscheidend für ein effektives Datenmanagement und die Analyse im Data Warehousing.

Das ist alles enthalten

4 Videos3 Lektüren2 Aufgaben

In diesem Modul befassen Sie sich mit der logischen Modellierung im Data Warehousing, d. h. mit dem Entwurf einer strukturierten, abstrakten Darstellung der zu speichernden Daten, wobei der Schwerpunkt darauf liegt, wie die Daten für eine effiziente Abfrage und Analyse organisiert, verknüpft und optimiert werden. Aufbauend auf den in den vorangegangenen Modulen erworbenen Kenntnissen werden Sie den nächsten Schritt im Data Warehouse-Design vollziehen: die Umsetzung eines konzeptionellen Modells in ein logisches Modell für die Implementierung. Das Modul konzentriert sich auf die relationale Darstellung von Data Warehouses, einschließlich der Untersuchung verschiedener Schema-Implementierungen: Star, Snowflake, Starflake und Constellation. Sie werden auch die Regeln für die Abbildung eines multidimensionalen konzeptionellen Modells auf ein relationales Modell untersuchen und dabei die Rolle und Bedeutung verschiedener Arten von Schlüsseln in diesem Prozess hervorheben. Außerdem werden wir Strategien zur Aufrechterhaltung der Konsistenz in einem Data Warehouse diskutieren. Schließlich werden Sie untersuchen, wie Sie bestimmte Dimensionen, wie z. B. die Zeit, vorbesetzen können, um die Abläufe zu rationalisieren und die Abfrageleistung zu verbessern.

Das ist alles enthalten

6 Videos11 Lektüren2 Aufgaben1 App-Element

Die Entwicklung eines Data Warehouse ist ein komplexer Prozess, der den Übergang von konzeptionellen Modellen auf hoher Ebene zu detaillierten logischen Modellen erfordert. Dieser Übergang ist von entscheidender Bedeutung, da er die Brücke zwischen dem Verständnis der geschäftlichen Anforderungen und deren Umsetzung in ein technisches Framework schlägt, das diese Anforderungen effektiv unterstützt. In diesem Modul wird der logische Modellierungsprozess, der im vorherigen Modul behandelt wurde, vertieft, wobei der Schwerpunkt auf dem Entwurf dimensionaler Modelle und den Feinheiten der Hierarchiemodellierung liegt. Bei der Vertiefung lernen Sie die logische Modellierung für fortgeschrittene Konzepte wie Many-to-Many-Dimensionen, Verknüpfungen zwischen Fakten und Fakten mit mehreren Granularitäten kennen. Wir werden auch das Konzept der Slowly Changing Dimensions (SCDs) erkunden, die für die Verwaltung historischer Daten in Ihrem Warehouse unerlässlich sind. Sie lernen, wie Sie verschiedene SCD-Typen implementieren, um Änderungen in Dimensionsdaten im Laufe der Zeit genau zu verfolgen und zu verwalten. Schließlich werden wir uns mit SQL für OLAP befassen, wobei der Schwerpunkt auf fortgeschrittenen Konzepten wie Aggregation und Fensterfunktionen liegt, und Sie werden lernen, wie Sie SQL zum Abfragen und Analysieren von Data Warehouses einsetzen können.

Das ist alles enthalten

5 Videos11 Lektüren1 Aufgabe

Dozent

Venkat Krishnamurthy
Northeastern University
3 Kurse477 Lernende

von

Mehr von Datenanalyse entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen