Un prétraitement inadéquat des données est à l'origine de 80 % des échecs de production en apprentissage automatique, ce qui rend la qualité des données plus cruciale que le choix de l'algorithme. Cette formation complète permet aux développeurs Java d'acquérir les compétences essentielles pour créer des pipelines de prétraitement de niveau entreprise, capables de transformer des données brutes issues du monde réel en caractéristiques prêtes pour l'apprentissage automatique. Grâce à des travaux pratiques utilisant OpenCSV et Apache Commons CSV, vous maîtriserez les techniques d’analyse de grands ensembles de données tout en mettant en œuvre des stratégies de normalisation, notamment la mise à l’échelle Min-Max et la standardisation par score Z.

Analyse et normalisation des données pour les pipelines de ML
Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Analyse et normalisation des données pour les pipelines de ML
Ce cours fait partie de Spécialisation "Level Up : Apprentissage automatique basé sur Java"


Instructeurs : Aseem Singhal
Inclus avec
Expérience recommandée
Ce que vous apprendrez
Créez des analyseurs CSV performants à l'aide de bibliothèques Java intégrant le mappage d'objets, la gestion des erreurs et le traitement en continu pour plus de 100 000 enregistrements.
Créez des pipelines de nettoyage des données intégrant plusieurs algorithmes de mise à l'échelle, la gestion des valeurs aberrantes et des paramètres sérialisables afin d'assurer la cohérence entre l'entraînement et l'inférence.
Concevoir des pipelines modulaires à l'aide de modèles de construction qui enchaînent les opérations, avec un suivi et l'intégration d'un framework d'apprentissage automatique pour les données à grande échelle.
Compétences que vous acquerrez
- Catégorie : Traitement des données
- Catégorie : Nettoyage des données
- Catégorie : Accès aux données
- Catégorie : Pipelines de données
- Catégorie : Intégrité des données
- Catégorie : Contrôle continu
- Catégorie : Traitement des données
- Catégorie : Importation/exportation de données
- Catégorie : Transformation des données
- Catégorie : Prétraitement des données
- Catégorie : Modèle de formation
- Catégorie : Validation des données
- Catégorie : Qualité des données
- Catégorie : Java
- Catégorie : Big Data
- Catégorie : Ingénierie des fonctionnalités
Outils que vous découvrirez
- Catégorie : Déploiement du modèle
- Catégorie : Programmation Java
- Catégorie : Workflows d'IA
Détails à connaître

Ajouter à votre profil LinkedIn
1 devoir
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 3 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeurs

Offert par
En savoir plus sur Analyse des données
Statut : Essai gratuit
Statut : Essai gratuitCoursera
Statut : Essai gratuit
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Foire Aux Questions
Plus de questions
Aide financière disponible,




