Coursera

Spezialisierung „Pipeline Architects: Data Engineering to Lakehouse“

Sparen Sie mit 40% Rabatt auf 3 Monate Coursera Plus bei den Fähigkeiten, die Sie zum Strahlen bringen. Jetzt sparen

spezialisierung ist nicht verfügbar in Deutsch (Deutschland)

Wir übersetzen es in weitere Sprachen.
Coursera

Spezialisierung „Pipeline Architects: Data Engineering to Lakehouse“

Build Data Pipelines That Scale to Production.

Master ingestion, transformation, orchestration, and lakehouse architecture at scale.

Hurix Digital

Dozent: Hurix Digital

Bei Coursera Plus enthalten

Befassen Sie sich eingehend mit einem Thema
Stufe Mittel

Empfohlene Erfahrung

4 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Befassen Sie sich eingehend mit einem Thema
Stufe Mittel

Empfohlene Erfahrung

4 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Design data flow diagrams and configure Airbyte connectors for relational databases, streaming platforms, and REST APIs to unify diverse sources.

  • Build modular ETL pipelines using Python, dbt, and Airflow, and evaluate columnar versus row-oriented storage formats for analytical workloads.

  • Implement incremental warehouse loading, SCD2 historical tracking, and data lake transactions with versioning and schema evolution support.

  • Architect and build lakehouse platforms using Delta Lake, Iceberg, and Hudi, registering external tables and automating ingestion pipelines.

Kompetenzen, die Sie erwerben

  • Kategorie: Cloud Deployment
  • Kategorie: Data Flow Diagrams (DFDs)
  • Kategorie: Data Governance
  • Kategorie: Data Integration
  • Kategorie: Data Management
  • Kategorie: Data Mapping
  • Kategorie: Data Modeling
  • Kategorie: Data Pipelines
  • Kategorie: Data Warehousing
  • Kategorie: Dataflow
  • Kategorie: Diagram Design
  • Kategorie: Extract, Transform, Load
  • Kategorie: Performance Tuning
  • Kategorie: Service Level Agreement
  • Kategorie: SQL
  • Kategorie: Trend Analysis

Werkzeuge, die Sie lernen werden

  • Kategorie: Apache Airflow
  • Kategorie: Apache Kafka
  • Kategorie: Data Lakes
  • Kategorie: Python Programming

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Unterrichtet in Englisch
Kürzlich aktualisiert!

April 2026

91% of learners achieved a positive career outcome

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse.

  • Erlernen Sie gefragte Kompetenzen von Universitäten und Branchenexperten.
  • Erlernen Sie ein Thema oder ein Tool mit echten Projekten.
  • Entwickeln Sie ein fundiertes Verständnisse der Kernkonzepte.
  • Erwerben Sie ein Karrierezertifikat von Coursera.

Spezialisierung - 10 Kursreihen

Map Data Flows Fast

Map Data Flows Fast

KURS 1, 1 Stunde

Was Sie lernen werden

  • Visual data flow docs are key for system clarity and form the base for good pipeline design and team communication.

  • Complete data flow diagrams must show the full journey from sources through transforms to final destinations.

  • Structured diagram creation follows steps: find sources, map processes, set destinations, and check connections.

  • Good data flow visuals connect technical work with business needs, enabling stakeholder alignment and decisions.

Kompetenzen, die Sie erwerben

Kategorie: Data Flow Diagrams (DFDs)
Kategorie: Data Pipelines
Kategorie: Dataflow
Kategorie: Diagram Design
Kategorie: Data Transformation
Kategorie: Data Visualization
Kategorie: Technical Communication
Kategorie: Data Mapping
Kategorie: Data Store
Unify Diverse Data Sources

Unify Diverse Data Sources

KURS 2, 1 Stunde

Was Sie lernen werden

  • Standardized connector configuration patterns apply across different data source types, making integration skills transferable.

  • Authentication and security considerations must be built into every connector setup to ensure enterprise-grade data protection.

  • Proper offset and parameter management in streaming and API connections prevents data loss and ensures complete data capture.

  • Unified staging approaches enable downstream analytics and business intelligence regardless of source system complexity.

Kompetenzen, die Sie erwerben

Kategorie: Enterprise Security
Kategorie: Data Integration
Kategorie: Application Programming Interface (API)
Kategorie: Enterprise Architecture
Kategorie: Database Management
Kategorie: Databases
Kategorie: Real Time Data
Kategorie: Data Infrastructure
Kategorie: Apache Kafka
Kategorie: Authentications
Kategorie: Relational Databases
Kategorie: Restful API
Kategorie: Systems Integration
Evaluate Storage for Data Warehousing Success

Evaluate Storage for Data Warehousing Success

KURS 3, 2 Stunden

Was Sie lernen werden

  • Storage format choice strongly affects query performance and should match workload needs, not general assumptions.

  • Column storage suits read-heavy analytics, while row storage performs better for transactional and write-focused workloads.

  • Benchmarking with real datasets and queries offers the best basis for sound storage architecture decisions.

  • Compression and ingestion speed must be balanced carefully to align performance with business priorities.

Kompetenzen, die Sie erwerben

Kategorie: Data Warehousing
Kategorie: Performance Testing
Kategorie: Data Storage
Kategorie: Performance Tuning
Kategorie: Data Import/Export
Kategorie: Query Languages
Kategorie: Data Storage Technologies
Kategorie: Data Architecture
Kategorie: Analysis
Kategorie: Star Schema
Kategorie: Amazon Redshift
Kategorie: Snowflake Schema
Kategorie: Apache Hive
Kategorie: Data Processing
Kategorie: Data Store
Build & Transform Data Pipelines

Build & Transform Data Pipelines

KURS 4, 2 Stunden

Was Sie lernen werden

  • Modular pipeline design enables maintainable, scalable data systems that can adapt to changing business requirements.

  • Integration of complementary tools (Spark, dbt, Airflow) creates more robust and efficient data processing workflows than single-tool approaches.

  • Proper separation of concerns between ingestion, transformation, and loading stages reduces complexity and improves debugging capabilities.

  • Automation and orchestration are essential for reliable, production-grade data systems that minimize manual intervention and human error.

Kompetenzen, die Sie erwerben

Kategorie: Data Pipelines
Kategorie: Data Integration
Kategorie: Dataflow
Kategorie: Data Infrastructure
Kategorie: Data Processing
Kategorie: Apache Airflow
Kategorie: Cloud Deployment
Kategorie: Data Warehousing
Kategorie: Maintainability
Kategorie: Cloud Computing
Kategorie: Extract, Transform, Load
Update Your Data Warehouse Incrementally

Update Your Data Warehouse Incrementally

KURS 5, 2 Stunden

Was Sie lernen werden

  • Standardized connector configuration patterns apply across different data source types, making integration skills transferable.

  • Authentication and security considerations must be built into every connector setup to ensure enterprise-grade data protection

  • Proper offset and parameter management in streaming and API connections prevents data loss and ensures complete data capture.

  • Unified staging approaches enable downstream analytics and business intelligence regardless of source system complexity.

Kompetenzen, die Sie erwerben

Kategorie: Data Warehousing
Kategorie: Data Processing
Kategorie: Data Pipelines
Kategorie: Extract, Transform, Load
Kategorie: Data Quality
Kategorie: Data Integration
Apply SCD2 to Build Dynamic Data Models

Apply SCD2 to Build Dynamic Data Models

KURS 6, 2 Stunden

Was Sie lernen werden

  • Historical data preservation is essential for accurate business analytics and regulatory compliance - once overwritten, critical context is lost.

  • SCD2 patterns create sustainable data architecture by maintaining complete audit trails through automated versioning than destructive updates.

  • Effective dimensional modeling requires systematic change detection logic that identifies modifications and creates new historical records.

  • Modern data tools like dbt democratize complex SCD2 implementation, making enterprise-grade historical tracking accessible through declarative SQL.

Kompetenzen, die Sie erwerben

Kategorie: Data Modeling
Kategorie: Scalability
Kategorie: Data Integrity
Kategorie: Data Pipelines
Kategorie: SQL
Kategorie: Trend Analysis
Kategorie: Business Intelligence
Kategorie: Data Warehousing
Apply Data Lake Transactions & Versioning

Apply Data Lake Transactions & Versioning

KURS 7, 2 Stunden

Was Sie lernen werden

  • Transactional storage layers ensure data lake reliability, supporting concurrent operations and maintaining integrity.

  • Version control in data lakes enables auditing, compliance, time-travel queries, and error recovery for production systems.

  • Schema evolution strategies help data systems adapt to business changes while maintaining backward compatibility.

  • Converting raw files to transactional formats is a key pattern supporting both analytics and operational reliability.

Kompetenzen, die Sie erwerben

Kategorie: SQL
Kategorie: Data Lakes
Kategorie: Data Pipelines
Build & Analyze Your Data Lakehouse

Build & Analyze Your Data Lakehouse

KURS 8, 2 Stunden

Was Sie lernen werden

  • External tables let query engines access distributed files without duplication, reshaping large-scale analytics design.

  • Choosing Delta, Iceberg, or Hudi requires evaluating schema changes, time travel needs, and performance goals.

  • Lakehouse architecture merges data lake flexibility with warehouse reliability using metadata and ACID support.

  • Automated ingestion with staging and transformation layers ensures consistent, high-quality data across analytics systems.

Kompetenzen, die Sie erwerben

Kategorie: Data Lakes
Kategorie: Data Pipelines
Kategorie: Automation
Kategorie: Data Warehousing
Kategorie: Apache Hive
Kategorie: Analysis
Automate Data Workflows with Airflow Excellence

Automate Data Workflows with Airflow Excellence

KURS 9, 1 Stunde

Was Sie lernen werden

  • Production-grade workflows require proactive failure handling strategies, not reactive troubleshooting approaches.

  • Parameterization and configuration management are essential for workflow reusability across different environments and datasets.

  • Task dependency design and SLA monitoring form the foundation of reliable data pipeline operations.

  • Robust workflow architecture prevents downstream business disruptions and reduces operational overhead.

Kompetenzen, die Sie erwerben

Kategorie: Data Pipelines
Kategorie: Apache Airflow
Kategorie: Service Level
Kategorie: Dependency Analysis
Kategorie: Service Level Agreement
Kategorie: System Monitoring
Kategorie: Scalability
Kategorie: Workflow Management
Unify, Reconcile, and Tune Data Systems

Unify, Reconcile, and Tune Data Systems

KURS 10, 3 Stunden

Was Sie lernen werden

  • SQL MERGE offers atomic sync that maintains consistency in CDC pipelines with minimal overhead.

  • Field-level conflict analysis needs clear business rules and source-of-truth hierarchies for reliable reconciliation.

  • Integration performance improves through measurement, bottleneck detection, and targeted tuning, not large redesigns.

  • Sustainable data systems balance quality, speed, and reliability through ongoing monitoring and iterative improvement.

Kompetenzen, die Sie erwerben

Kategorie: Data Management
Kategorie: Data Manipulation
Kategorie: Operational Databases
Kategorie: SQL
Kategorie: Performance Metric
Kategorie: Performance Measurement
Kategorie: Data Pipelines
Kategorie: Database Design
Kategorie: Consolidation
Kategorie: Application Performance Management
Kategorie: Performance Tuning
Kategorie: Performance Improvement
Kategorie: Data Integrity
Kategorie: Data Cleansing
Kategorie: Data Quality
Kategorie: Systems Integration
Kategorie: Performance Testing
Kategorie: Data Validation
Kategorie: Data Integration
Kategorie: Data Governance

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozent

Hurix Digital
443 Kurse49.953 Lernende

von

Coursera

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen