Coursera

Data Engineering & Pipeline Reliability for Machine Learning

Erweitern Sie Ihre Kenntnisse mit Coursera Plus für 239 $/Jahr (normalerweise 399 $). Jetzt sparen.

kurs ist nicht verfügbar in Deutsch (Deutschland)

Wir übersetzen es in weitere Sprachen.
Coursera

Data Engineering & Pipeline Reliability for Machine Learning

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

9 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

9 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Transform and validate data for machine learning using encoding, cleansing, and data quality techniques

  • Design and orchestrate ML data pipelines that ensure reliability, freshness, and pipeline performance

  • Manage reproducible ML development using version control and environment management tools

Kompetenzen, die Sie erwerben

  • Kategorie: Feature Engineering
  • Kategorie: Extract, Transform, Load
  • Kategorie: Data Pipelines
  • Kategorie: Exploratory Data Analysis
  • Kategorie: Dataflow
  • Kategorie: Data Transformation
  • Kategorie: Package and Software Management
  • Kategorie: Version Control
  • Kategorie: Data Preprocessing
  • Kategorie: Resource Utilization
  • Kategorie: Data Quality
  • Kategorie: MLOps (Machine Learning Operations)
  • Kategorie: Virtual Environment
  • Kategorie: Data Integrity
  • Kategorie: Cost Management
  • Kategorie: Data Cleansing
  • Kategorie: Data Validation
  • Kategorie: Quality Assurance

Werkzeuge, die Sie lernen werden

  • Kategorie: Git (Version Control System)
  • Kategorie: Apache Airflow

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

März 2026

Bewertungen

13 Zuweisungen¹

KI-bewertet siehe Haftungsausschluss
Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung „Machine Learning Made Easy for Software Engineers“
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 10 Module

You will analyze categorical features to determine the optimal encoding strategy based on cardinality and model fit considerations.

Das ist alles enthalten

2 Videos2 Lektüren1 Aufgabe

You will evaluate data quality metrics and document data transformation lineage to ensure transparency and reliability.

Das ist alles enthalten

1 Video1 Lektüre1 Aufgabe

You will apply techniques to impute, flag, and validate missing or null values to produce consistent, model-ready datasets.

Das ist alles enthalten

1 Video1 Lektüre2 Aufgaben

You will apply ETL and ELT pipelines to ingest data from various sources into a feature store using structured transformation workflows.

Das ist alles enthalten

2 Videos1 Lektüre1 Aufgabe

You will analyze upstream schema changes and implement safeguards to maintain data pipeline resilience and downstream compatibility.

Das ist alles enthalten

2 Videos1 Lektüre

You will evaluate data freshness, lag, and pipeline success rates against service level agreements to assess operational reliability.

Das ist alles enthalten

1 Video1 Lektüre3 Aufgaben

You will apply version control branching strategies to manage code, experiments, and project artifacts effectively.

Das ist alles enthalten

3 Videos1 Lektüre2 Aufgaben

You will apply virtual environment tools to configure reproducible project environments with stable dependencies.

Das ist alles enthalten

2 Videos1 Lektüre1 Unbewertetes Labor

You will analyze resource utilization across CPU, GPU, and memory usage to optimize compute costs during experimentation.

Das ist alles enthalten

2 Videos1 Lektüre2 Aufgaben

In this project, you will design and implement a production-style machine learning data pipeline for a financial services risk modeling scenario. The raw dataset contains missing values, inconsistent categorical entries, potential outliers, and simulated schema drift. Your task is to transform this dataset into a validated, model-ready feature store. You will clean and preprocess structured tabular data, select encoding strategies based on feature cardinality, implement data validation using Great Expectations, detect schema changes between pipeline runs, generate SLA metrics to assess reliability, and save processed features in parquet format. Beyond the core pipeline, you will also apply professional development practices that are standard in production ML teams: setting up a virtual environment for reproducibility, using version control branching strategies to manage your work, and analyzing resource utilization to understand compute costs. Your final deliverable is a modular Python script and a structured written engineering explanation that demonstrates your ability to design reliable, production-aligned ML data infrastructure.

Das ist alles enthalten

2 Lektüren1 Aufgabe

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozent

Professionals from the Industry
322 Kurse 46.316 Lernende

von

Coursera

Mehr von Data Management entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Coursera Plus

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen

¹ Einige Aufgaben in diesem Kurs werden mit AI bewertet. Für diese Aufgaben werden Ihre Daten in Übereinstimmung mit Datenschutzhinweis von Courseraverwendet.