Packt
Techniques intermédiaires d'analyse de données avec Pandas

Profitez d'une croissance illimitée avec un an de Coursera Plus pour 199 $ (régulièrement 399 $). Économisez maintenant.

Packt

Techniques intermédiaires d'analyse de données avec Pandas

Ce cours fait partie de Spécialisation Analyse de données avec Pandas et Python

Enseigné en Français (doublage IA)

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
4.9

(13 avis)

niveau Intermédiaire

Expérience recommandée

1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
4.9

(13 avis)

niveau Intermédiaire

Expérience recommandée

1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Utiliser des techniques avancées de sélection de données et d'opérations sur les colonnes dans Pandas.

  • Employer diverses techniques de filtrage pour améliorer la précision de l'extraction des données.

  • Appliquer avec compétence les méthodes Pandas pour nettoyer et préparer efficacement les données.

  • Gestion et manipulation des données MultiIndex et texte dans Pandas pour une manipulation complète des données.

Compétences que vous acquerrez

  • Catégorie : Prétraitement de données
  • Catégorie : Pandas (paquetage Python)
  • Catégorie : Nettoyage des données
  • Catégorie : Logiciel d'analyse des données
  • Catégorie : Exploration de texte
  • Catégorie : Data wrangling
  • Catégorie : Manipulation de données

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

8 devoirs

Enseigné en Français (doublage IA)

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Analyse de données avec Pandas et Python
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 7 modules dans ce cours

Dans ce module, nous explorerons les concepts fondamentaux du travail avec les DataFrames dans Pandas, en commençant par une comparaison des méthodes et attributs Series et DataFrame. Vous apprendrez à sélectionner et à manipuler des colonnes simples et multiples, et à ajouter de nouvelles colonnes à vos DataFrames. Nous couvrirons l'utilisation de value_counts pour l'analyse des colonnes et les stratégies de traitement des valeurs manquantes. En outre, vous maîtriserez les conversions de type de données à l'aide de la méthode astype, le tri des DataFrames avec sort_values et sort_index, et le classement des valeurs dans les colonnes à l'aide de la méthode rank.

Inclus

14 vidéos2 lectures1 devoir

Dans ce module, nous allons nous plonger dans le filtrage des données dans les DataFrames. Vous découvrirez le jeu de données et apprendrez les techniques d'optimisation de la mémoire. Nous aborderons le filtrage des lignes basé sur des conditions et l'utilisation d'opérateurs logiques tels que AND (&) et OR (|). Les méthodes de filtrage avancées telles que isin, isnull et notnull seront explorées. Vous apprendrez également à filtrer les données à l'intérieur d'une plage à l'aide de la méthode between, à identifier et à traiter les doublons à l'aide des méthodes duplicated et drop_duplicates, et à trouver et compter les valeurs uniques à l'aide des méthodes unique et nunique.

Inclus

10 vidéos1 devoir

Dans ce module, nous allons explorer les techniques essentielles d'extraction de données dans Pandas. Vous commencerez par une introduction au jeu de données et apprendrez à définir et à réinitialiser les index à l'aide des méthodes set_index et reset_index. Nous couvrirons l'extraction des lignes par position d'index avec iloc et par étiquettes avec loc, et nous comprendrons les seconds arguments pour une extraction précise des données. Vous apprendrez à écraser des valeurs individuelles et multiples, à renommer des étiquettes d'index ou des colonnes et à supprimer des lignes ou des colonnes. Des techniques d'extraction avancées telles que l'échantillonnage avec la méthode sample, l'extraction de lignes spécifiques avec nsmallest et nlargest, le filtrage conditionnel avec WHERE et l'exécution de fonctions sur des lignes ou des colonnes de DataFrame avec apply, seront également abordées.

Inclus

13 vidéos1 devoir

Dans ce module, nous nous concentrerons sur le travail avec des données textuelles dans Pandas. Vous commencerez par une introduction à l'ensemble de données et apprendrez à utiliser des méthodes de chaîne courantes pour la manipulation de données textuelles. Nous couvrirons le filtrage des lignes de DataFrame à l'aide de méthodes de chaînes et l'application de ces méthodes aux indices et colonnes de DataFrame. Vous maîtriserez la méthode split pour diviser les données textuelles en plusieurs parties et améliorerez vos compétences grâce à des exercices pratiques supplémentaires. Enfin, vous apprendrez à personnaliser la division de texte à l'aide des paramètres expand et n de la méthode split pour une analyse plus détaillée.

Inclus

7 vidéos1 devoir

Dans ce module, nous allons explorer les capacités avancées de MultiIndex dans Pandas, en commençant par une introduction à ses concepts. Vous apprendrez à créer et à gérer des DataFrames MultiIndex pour le regroupement et l'analyse de données complexes. Nous couvrirons les techniques d'extraction et de renommage des valeurs de niveau d'index pour plus de clarté, et la façon de trier et d'extraire des lignes spécifiques pour une meilleure organisation des données. En outre, vous maîtriserez des méthodes telles que la transposition, l'empilage et le dépilage pour remodeler les DataFrames, et vous appliquerez les méthodes pivot, melt et pivot_table pour réorganiser et transformer les données de manière efficace.

Inclus

12 vidéos1 devoir

Dans ce module, nous allons nous plonger dans la fonctionnalité GroupBy de Pandas, en commençant par une introduction à ses concepts essentiels pour l'Agrégation des données. Vous apprendrez à utiliser la méthode groupby pour regrouper des données et récupérer des groupes spécifiques avec la méthode get_group. Nous explorerons les différentes méthodes d'agrégation disponibles sur les objets GROUP BY et nous aborderons les techniques de regroupement des données en fonction de plusieurs colonnes. En outre, vous maîtriserez la méthode agg pour appliquer plusieurs opérations sur des données groupées et apprendrez à itérer à travers les groupes pour un traitement individuel des données.

Inclus

7 vidéos1 devoir

Dans ce module, nous allons explorer les techniques essentielles de fusion des DataFrames dans Pandas. Vous commencerez par une introduction aux différentes méthodes de fusion, suivie d'un examen détaillé de l'utilisation de la fonction pd.concat pour concaténer des DataFrames le long d'un axe spécifié. Nous aborderons les jointures à gauche et l'utilisation des paramètres left_on et right_on pour la correspondance de colonnes spécifiques, ainsi que les jointures internes pour combiner des DataFrames sur la base de clés qui se croisent. En outre, vous apprendrez les jointures OUTER JOIN pour fusionner les DataFrames en incluant toutes les clés des deux frames, et comment fusionner par index en utilisant les paramètres left_index et right_index. Enfin, vous découvrirez la méthode de jointure comme alternative plus simple pour fusionner des DataFrames.

Inclus

10 vidéos1 lecture2 devoirs

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Packt - Course Instructors
Packt
1 280 Cours307 773 apprenants

Offert par

Packt

En savoir plus sur Analyse des Données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions