Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable
Il y a un module dans ce cours
Dans ce cours, vous développerez des compétences essentielles pour transformer des données brutes dans des formats prêts pour l'analyse - une base essentielle pour tout flux de travail de science des données. Vous maîtriserez les techniques d'importation de données à partir de diverses sources, la manipulation d'ensembles de données complexes et l'optimisation des structures de données pour l'analyse. En travaillant avec des ensembles de données réelles provenant de nos études de cas EngageMetrics et MediTrack, vous acquerrez une expérience pratique de la préparation des données qui se traduira directement dans des scénarios professionnels. À la fin du cours, vous serez en mesure de : - Importer des données dans Python à partir de fichiers CSV, de feuilles de calcul Excel et d'API - Créer, gérer et manipuler des DataFrames.
- Filtrer, trier, fusionner et grouper des données pour les préparer à l'analyse - Gérer et transformer des données catégorielles et des données date/heure en utilisant Pandas - Créer et manipuler des tableaux NumPy, effectuer des opérations mathématiques et utiliser des fonctions vectorielles - Appliquer les compétences d'importation et de manipulation des données pour construire un pipeline d'intégration multi-source dans un défi noté.
Dans ce module, vous développerez des compétences essentielles pour transformer des données brutes en formats prêts pour l'analyse - une base essentielle pour tout flux de travail de science des données. Vous maîtriserez les techniques d'importation de données à partir de diverses sources, de manipulation d'ensembles de données complexes et d'optimisation des structures de données pour l'analyse. En travaillant avec des ensembles de données du monde réel provenant de nos études de cas EngageMetrics et MediTrack, vous acquerrez une expérience pratique dans la préparation des données qui se traduit directement par des scénarios professionnels.
Inclus
4 vidéos2 lectures2 devoirs1 devoir de programmation4 laboratoires non notés
Afficher les informations sur le contenu du module
4 vidéos•Total 22 minutes
L'essentiel de l'importation de données : CSV, Excel et API•4 minutes
Transformation des données RH avec Pandas•4 minutes
Les bases de la Transformation de données en Python•6 minutes
NumPy Speed Boost : Des boucles aux tableaux rapides comme l'éclair•7 minutes
2 lectures•Total 15 minutes
Aperçu du cours•10 minutes
Félicitations et prochaines étapes•5 minutes
2 devoirs•Total 60 minutes
Contrôle des connaissances : Fonctions d'importation de données•30 minutes
Contrôle des connaissances : Traitement des données non numériques•30 minutes
1 devoir de programmation•Total 180 minutes
Labo noté : Défi d'intégration des données multi-sources•180 minutes
4 laboratoires non notés•Total 240 minutes
Laboratoire d'importation de données•60 minutes
Laboratoire d'opérations sur les DataFrames•60 minutes
Laboratoire de Transformation de données•60 minutes
Laboratoire de calculs numériques•60 minutes
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Coursera rassemble un réseau diversifié d'experts en la matière qui ont démontré leur expertise grâce à leur expérience professionnelle dans l'industrie ou à leur solide formation universitaire. Ces instructeurs conçoivent et enseignent des cours qui permettent aux apprenants du monde entier d'acquérir des compétences pratiques et utiles à leur carrière.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Qu'est-ce que la préparation des données dans ce cours ?
La préparation des données consiste ici à prendre des données brutes et à les transformer en une structure prête à l'analyse en Python. Le cours se concentre sur l'importation de données à partir de sources communes, leur organisation dans des DataFrames et des tableaux, et leur transformation pour que les analyses ultérieures soient fiables.
Quand utiliseriez-vous ce type de préparation des données ?
Vous l'utilisez lorsque les données proviennent de sources ou de formats différents et qu'elles ne sont pas prêtes à être analysées telles quelles. Dans ce cours, il s'agit de vérifier les valeurs manquantes, de normaliser les champs, de combiner les tableaux et de remodeler les données avant d'effectuer des résumés ou des calculs.
Comment la préparation des données s'inscrit-elle dans un flux de travail plus large ?
Il se situe après la collecte des données et avant l'analyse approfondie, lorsque les données brutes sont organisées dans une structure cohérente. Dans ce cours, il s'agit de passer de fichiers et d'enregistrements dispersés à des DataFrames et des tableaux qui peuvent être filtrés, regroupés et analysés.
En quoi la préparation des données en Python diffère-t-elle du nettoyage manuel des données dans les feuilles de calcul ?
Dans ce cours, la préparation des données basée sur Python signifie l'utilisation d'opérations répétables pour charger, nettoyer, remodeler et combiner les données au lieu de résoudre les problèmes une cellule ou une feuille à la fois. L'accent est mis sur un processus réutilisable à travers les fichiers et les sources, et non sur des modifications manuelles ponctuelles.
Faut-il des prérequis avant d'apprendre la préparation des données en Python ?
Il s'agit d'un cours pour débutants, qui ne présuppose donc pas d'expérience technique approfondie. Il est utile d'être à l'aise avec les données tabulaires et de suivre les exemples Python, car le travail est centré sur l'importation, le nettoyage et le remodelage des données plutôt que sur la programmation avancée.
Quels sont les outils, les plateformes ou les méthodes utilisés dans ce cours ?
Le cours est centré sur Python, en particulier Pandas pour travailler avec les DataFrames et NumPy pour les calculs basés sur les tableaux. Il couvre également les méthodes d'importation courantes pour apporter des données à partir de fichiers CSV, de feuilles de calcul Excel et d'API.
Quelles sont les tâches spécifiques que vous allez pratiquer ou accomplir dans le cadre de ce cours ?
Vous vous entraînez à importer des données, à travailler avec des DataFrames, à combiner et à organiser des tableaux, et à normaliser des types de champs courants tels que les catégories et les dates. Vous utilisez également NumPy pour des calculs basés sur des tableaux afin que les données brutes soient propres, structurées et prêtes à être analysées.