Ce cours Pandas se concentre sur la maîtrise des fonctionnalités DataFrame, en commençant par des comparaisons approfondies entre les méthodes Series et DataFrame.

Profitez d'une croissance illimitée avec un an de Coursera Plus pour 199 $ (régulièrement 399 $). Économisez maintenant.

Techniques intermédiaires d'analyse de données avec Pandas
Ce cours fait partie de Spécialisation Analyse de données avec Pandas et Python
Enseigné en Français (doublage IA)

Instructeur : Packt - Course Instructors
Inclus avec
(13 avis)
Expérience recommandée
Ce que vous apprendrez
Utiliser des techniques avancées de sélection de données et d'opérations sur les colonnes dans Pandas.
Employer diverses techniques de filtrage pour améliorer la précision de l'extraction des données.
Appliquer avec compétence les méthodes Pandas pour nettoyer et préparer efficacement les données.
Gestion et manipulation des données MultiIndex et texte dans Pandas pour une manipulation complète des données.
Compétences que vous acquerrez
- Catégorie : Prétraitement de données
- Catégorie : Pandas (paquetage Python)
- Catégorie : Nettoyage des données
- Catégorie : Logiciel d'analyse des données
- Catégorie : Exploration de texte
- Catégorie : Data wrangling
- Catégorie : Manipulation de données
Détails à connaître

Ajouter à votre profil LinkedIn
8 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 7 modules dans ce cours
Dans ce module, nous explorerons les concepts fondamentaux du travail avec les DataFrames dans Pandas, en commençant par une comparaison des méthodes et attributs Series et DataFrame. Vous apprendrez à sélectionner et à manipuler des colonnes simples et multiples, et à ajouter de nouvelles colonnes à vos DataFrames. Nous couvrirons l'utilisation de value_counts pour l'analyse des colonnes et les stratégies de traitement des valeurs manquantes. En outre, vous maîtriserez les conversions de type de données à l'aide de la méthode astype, le tri des DataFrames avec sort_values et sort_index, et le classement des valeurs dans les colonnes à l'aide de la méthode rank.
Inclus
14 vidéos2 lectures1 devoir
Dans ce module, nous allons nous plonger dans le filtrage des données dans les DataFrames. Vous découvrirez le jeu de données et apprendrez les techniques d'optimisation de la mémoire. Nous aborderons le filtrage des lignes basé sur des conditions et l'utilisation d'opérateurs logiques tels que AND (&) et OR (|). Les méthodes de filtrage avancées telles que isin, isnull et notnull seront explorées. Vous apprendrez également à filtrer les données à l'intérieur d'une plage à l'aide de la méthode between, à identifier et à traiter les doublons à l'aide des méthodes duplicated et drop_duplicates, et à trouver et compter les valeurs uniques à l'aide des méthodes unique et nunique.
Inclus
10 vidéos1 devoir
Dans ce module, nous allons explorer les techniques essentielles d'extraction de données dans Pandas. Vous commencerez par une introduction au jeu de données et apprendrez à définir et à réinitialiser les index à l'aide des méthodes set_index et reset_index. Nous couvrirons l'extraction des lignes par position d'index avec iloc et par étiquettes avec loc, et nous comprendrons les seconds arguments pour une extraction précise des données. Vous apprendrez à écraser des valeurs individuelles et multiples, à renommer des étiquettes d'index ou des colonnes et à supprimer des lignes ou des colonnes. Des techniques d'extraction avancées telles que l'échantillonnage avec la méthode sample, l'extraction de lignes spécifiques avec nsmallest et nlargest, le filtrage conditionnel avec WHERE et l'exécution de fonctions sur des lignes ou des colonnes de DataFrame avec apply, seront également abordées.
Inclus
13 vidéos1 devoir
Dans ce module, nous nous concentrerons sur le travail avec des données textuelles dans Pandas. Vous commencerez par une introduction à l'ensemble de données et apprendrez à utiliser des méthodes de chaîne courantes pour la manipulation de données textuelles. Nous couvrirons le filtrage des lignes de DataFrame à l'aide de méthodes de chaînes et l'application de ces méthodes aux indices et colonnes de DataFrame. Vous maîtriserez la méthode split pour diviser les données textuelles en plusieurs parties et améliorerez vos compétences grâce à des exercices pratiques supplémentaires. Enfin, vous apprendrez à personnaliser la division de texte à l'aide des paramètres expand et n de la méthode split pour une analyse plus détaillée.
Inclus
7 vidéos1 devoir
Dans ce module, nous allons explorer les capacités avancées de MultiIndex dans Pandas, en commençant par une introduction à ses concepts. Vous apprendrez à créer et à gérer des DataFrames MultiIndex pour le regroupement et l'analyse de données complexes. Nous couvrirons les techniques d'extraction et de renommage des valeurs de niveau d'index pour plus de clarté, et la façon de trier et d'extraire des lignes spécifiques pour une meilleure organisation des données. En outre, vous maîtriserez des méthodes telles que la transposition, l'empilage et le dépilage pour remodeler les DataFrames, et vous appliquerez les méthodes pivot, melt et pivot_table pour réorganiser et transformer les données de manière efficace.
Inclus
12 vidéos1 devoir
Dans ce module, nous allons nous plonger dans la fonctionnalité GroupBy de Pandas, en commençant par une introduction à ses concepts essentiels pour l'Agrégation des données. Vous apprendrez à utiliser la méthode groupby pour regrouper des données et récupérer des groupes spécifiques avec la méthode get_group. Nous explorerons les différentes méthodes d'agrégation disponibles sur les objets GROUP BY et nous aborderons les techniques de regroupement des données en fonction de plusieurs colonnes. En outre, vous maîtriserez la méthode agg pour appliquer plusieurs opérations sur des données groupées et apprendrez à itérer à travers les groupes pour un traitement individuel des données.
Inclus
7 vidéos1 devoir
Dans ce module, nous allons explorer les techniques essentielles de fusion des DataFrames dans Pandas. Vous commencerez par une introduction aux différentes méthodes de fusion, suivie d'un examen détaillé de l'utilisation de la fonction pd.concat pour concaténer des DataFrames le long d'un axe spécifié. Nous aborderons les jointures à gauche et l'utilisation des paramètres left_on et right_on pour la correspondance de colonnes spécifiques, ainsi que les jointures internes pour combiner des DataFrames sur la base de clés qui se croisent. En outre, vous apprendrez les jointures OUTER JOIN pour fusionner les DataFrames en incluant toutes les clés des deux frames, et comment fusionner par index en utilisant les paramètres left_index et right_index. Enfin, vous découvrirez la méthode de jointure comme alternative plus simple pour fusionner des DataFrames.
Inclus
10 vidéos1 lecture2 devoirs
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeur

Offert par
En savoir plus sur Analyse des Données
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?




Foire Aux Questions
Oui, vous pouvez visionner la première vidéo et le syllabus avant de vous inscrire. Vous devez acheter le cours pour accéder au contenu qui n'est pas inclus dans l'aperçu.
Si vous décidez de vous inscrire au cours avant la date de début de la session, vous aurez accès à toutes les vidéos et à toutes les lectures du cours. Vous pourrez soumettre vos travaux dès le début de la session.
Une fois que vous vous serez inscrit et que votre session aura commencé, vous aurez accès à toutes les vidéos et autres ressources, y compris les lectures et le forum de discussion du cours. Vous pourrez consulter et soumettre des évaluations pratiques, et effectuer les devoirs notés requis pour obtenir une note et un certificat de cours.
Plus de questions
Aide financière disponible,





