Coursera

Parsen und Normalisieren von Daten für ML-Pipelines

Sichern Sie sich eines unserer besten Angebote mit Coursera Plus für 199 $ (normalerweise 399 $). Jetzt sparen.

Coursera

Parsen und Normalisieren von Daten für ML-Pipelines

Aseem Singhal
Starweaver

Dozenten: Aseem Singhal

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

4 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

4 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Erstellen Sie effiziente CSV-Parser mithilfe von Java-Bibliotheken mit Objektzuordnung, Fehlerbehandlung und Streaming für mehr als 100.000 Datensätze.

  • Erstellen Sie Pipelines zur Datenbereinigung mit mehreren Skalierungsalgorithmen, Ausreißerbehandlung und serialisierbaren Parametern, um die Konsistenz zwischen Training und Inferenz zu gewährleisten.

  • Entwerfen Sie modulare Pipelines unter Verwendung von Builder-Mustern, die Operationen miteinander verketten, und integrieren Sie dabei Überwachungsfunktionen sowie ML-Frameworks für große Datenmengen.

Kompetenzen, die Sie erwerben

  • Kategorie: Datenwrangling
  • Kategorie: Bereinigung von Daten
  • Kategorie: Datenzugang
  • Kategorie: Java
  • Kategorie: Datenverarbeitung
  • Kategorie: Daten-Pipelines
  • Kategorie: Integrität der Daten
  • Kategorie: Datenumwandlung
  • Kategorie: Daten importieren/exportieren
  • Kategorie: Qualität der Daten
  • Kategorie: Große Daten
  • Kategorie: Kontinuierliche Überwachung
  • Kategorie: Technische Merkmale
  • Kategorie: Validierung von Daten
  • Kategorie: Vorverarbeitung von Daten
  • Kategorie: Modell Ausbildung

Werkzeuge, die Sie lernen werden

  • Kategorie: Modell-Einsatz
  • Kategorie: Java-Programmierung
  • Kategorie: AI-Arbeitsabläufe

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

Dezember 2025

Bewertungen

1 Aufgabe

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung „Level Up: Java-gestütztes Maschinelles Lernen“
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 3 Module

Dieses Modul legt den Grundstein für eine robuste Datenerfassung, indem es den Lernenden vermittelt, wie sie große, durch Trennzeichen getrennte Dateien mithilfe von branchenüblichen Java-Bibliotheken effizient analysieren können. Die Teilnehmer erlernen die entscheidenden Fähigkeiten zur Umwandlung von CSV-/TSV-Rohdaten in stark typisierte Java-Objekte und lernen dabei, praktische Herausforderungen wie Probleme mit der Zeichenkodierung, fehlende Werte und die Speicheroptimierung für Datensätze mit mehr als 100.000 Datensätzen zu bewältigen.

Das ist alles enthalten

4 Videos3 Lektüren

Im Mittelpunkt dieses Moduls steht die Implementierung umfassender Pipelines zur Datenbereinigung und -transformation, mit denen Rohdaten für eine optimale Leistung von ML-Modellen aufbereitet werden. Die Teilnehmer erstellen statistische Normalisierungswerkzeuge unter Verwendung verschiedener Skalierungsalgorithmen, entwickeln robuste Strategien für den Umgang mit Ausreißern und fehlenden Werten und erstellen serialisierbare Transformationsparameter, die eine konsistente Datenvorverarbeitung zwischen Trainings- und Produktionsumgebungen gewährleisten.

Das ist alles enthalten

3 Videos2 Lektüren

Dieses Modul integriert Parsing- und Normalisierungsfunktionen mithilfe fortschrittlicher Java-Entwurfsmuster in modulare Vorverarbeitungs-Workflows auf Unternehmensniveau. Die Teilnehmer entwerfen produktionsreife Pipelines nach den Prinzipien der funktionalen Programmierung, implementieren umfassende Überwachungs- und Fehlerbehandlungssysteme und integrieren ihre Datenverarbeitungslösungen nahtlos in gängige Java-ML-Frameworks, wobei sie die Leistungseffizienz für groß angelegte Bereitstellungen gewährleisten.

Das ist alles enthalten

4 Videos3 Lektüren1 Aufgabe

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozenten

Aseem Singhal
Coursera
13 Kurse8.876 Lernende

von

Coursera

Mehr von Datenanalyse entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen