Ce cours vous apprend à transformer des ensembles de données réels en ressources analytiques fiables grâce à des techniques pratiques et reproductibles de nettoyage des données. Vous apprendrez à évaluer les caractéristiques catégorielles et à sélectionner les stratégies d’encodage optimales, à mesurer et à documenter la qualité des données, ainsi qu’à appliquer des approches efficaces pour traiter les valeurs manquantes. À l’aide de Python et de pandas, vous vous exercerez à évaluer la cardinalité, à mettre en œuvre l’encodage cible, à valider l’exhaustivité avec Great Expectations et à établir une traçabilité transparente des transformations. Vous nettoierez également des champs hétérogènes tels que les âges, les valeurs aberrantes de salaire et les dates afin de garantir des résultats cohérents et prêts à être utilisés dans des modèles. Conçu pour les analystes, les ingénieurs de données et les professionnels du machine learning, ce cours vous dote des compétences professionnelles nécessaires pour préparer des ensembles de données de haute qualité permettant d’obtenir des informations fiables et de réaliser une modélisation prédictive.

Ingénierie des données et fiabilité des pipelines pour l'apprentissage automatique
Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Ingénierie des données et fiabilité des pipelines pour l'apprentissage automatique
Ce cours fait partie de Spécialisation "L'apprentissage automatique simplifié pour les ingénieurs logiciels"

Instructeur : Professionals from the Industry
Inclus avec
Expérience recommandée
Ce que vous apprendrez
Transformer et valider les données destinées à l'apprentissage automatique à l'aide de techniques d'encodage, de nettoyage et d'assurance qualité des données
Concevoir et coordonner des pipelines de données d'apprentissage automatique garantissant la fiabilité, l'actualité et les performances des pipelines
Gérer le développement reproductible en apprentissage automatique à l'aide d'outils de contrôle de version et de gestion d'environnement
Compétences que vous acquerrez
- Catégorie : Ingénierie des fonctionnalités
- Catégorie : Prétraitement des données
- Catégorie : Qualité des données
- Catégorie : Gestion des paquets et des logiciels
- Catégorie : Intégration des données
- Catégorie : Nettoyage des données
- Catégorie : Gestion des coûts
- Catégorie : Flux de données
- Catégorie : Extraire, transformer, charger
- Catégorie : Environnement virtuel
- Catégorie : Analyse exploratoire des données
- Catégorie : Utilisation des ressources
- Catégorie : Traitement des données
- Catégorie : MLOps (Machine Learning Operations)
- Catégorie : Assurance qualité
- Catégorie : Environnement de développement
- Catégorie : Transformation des données
- Catégorie : Pipelines de données
Outils que vous découvrirez
- Catégorie : Git (système de contrôle de version)
- Catégorie : Flux d'air Apache
Détails à connaître

Ajouter à votre profil LinkedIn
mars 2026
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 10 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeur

Offert par
En savoir plus sur Gestion des données
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuitKodeKloud
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Foire Aux Questions
Plus de questions
Aide financière disponible,
¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.




