Coursera
Parse & Normalize Data for ML Pipelines

Acquérir des compétences de haut niveau avec Coursera Plus pour 199 $ (régulièrement 399 $). Économisez maintenant.

Ce cours n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Parse & Normalize Data for ML Pipelines

Aseem Singhal
Starweaver

Instructeurs : Aseem Singhal

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

4 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

4 heures à compléter
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Create efficient CSV parsers using Java libraries with object mapping, error handling, and streaming for 100K+ records.

  • Build data cleaning pipelines with multiple scaling algorithms, outlier handling, and serializable parameters for train-inference consistency.

  • Architect modular pipelines using builder patterns that chain operations with monitoring and ML framework integration for large-scale data.

Compétences que vous acquerrez

  • Catégorie : Feature Engineering
  • Catégorie : Unit Testing
  • Catégorie : Data Pipelines
  • Catégorie : Data Cleansing
  • Catégorie : Data Transformation
  • Catégorie : Object Oriented Programming (OOP)
  • Catégorie : Java
  • Catégorie : Data Quality
  • Catégorie : Data Processing
  • Catégorie : Continuous Monitoring
  • Catégorie : Data Access
  • Catégorie : Data Validation
  • Catégorie : Data Preprocessing

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

décembre 2025

Évaluations

1 devoir

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Level Up: Java-Powered Machine Learning
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 3 modules dans ce cours

This module establishes the foundation for robust data ingestion by teaching learners to efficiently parse large-scale delimited files using industry-standard Java libraries. Students will master the critical skills of transforming raw CSV/TSV data into strongly-typed Java objects while handling real-world challenges like character encoding issues, missing values, and memory optimization for datasets exceeding 100K records.

Inclus

4 vidéos3 lectures

This module focuses on implementing comprehensive data cleaning and transformation pipelines that prepare raw features for optimal ML model performance. Learners will build statistical normalization utilities using multiple scaling algorithms, develop robust strategies for handling outliers and missing values, and create serializable transformation parameters that ensure consistent data preprocessing between training and production environments.

Inclus

3 vidéos2 lectures

This module integrates parsing and normalization capabilities into enterprise-grade, modular preprocessing workflows using advanced Java design patterns. Students will architect production-ready pipelines with functional programming principles, implement comprehensive monitoring and error handling systems, and seamlessly integrate their data processing solutions with popular Java ML frameworks while maintaining performance efficiency for large-scale deployments.

Inclus

4 vidéos3 lectures1 devoir

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Aseem Singhal
Coursera
9 Cours4 997 apprenants

Offert par

Coursera

En savoir plus sur Data Analysis

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions