Développez vos compétences avec Coursera Plus pour 239 $/an (habituellement 399 $). Économisez maintenant.

IBM

Analyse de données avec Python

Joseph Santarcangelo

Instructeur : Joseph Santarcangelo

637 724 déjà inscrits

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

19,669 avis

niveau Intermédiaire

Expérience recommandée

Planning flexible
2 semaines à 10 heures une semaine
Apprenez à votre propre rythme
94%
La plupart des étudiants ont apprécié ce cours
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

19,669 avis

niveau Intermédiaire

Expérience recommandée

Planning flexible
2 semaines à 10 heures une semaine
Apprenez à votre propre rythme
94%
La plupart des étudiants ont apprécié ce cours

Ce que vous apprendrez

  • Construire des programmes Python pour nettoyer et préparer les données pour l'analyse en traitant les valeurs manquantes, les incohérences de formatage, la normalisation et le binning

  • Analyser des ensembles de données du monde réel par le biais de l'analyse exploratoire des données (AED) à l'aide de bibliothèques telles que Pandas, NumPy et SciPy pour découvrir des modèles et des idées

  • Appliquer des techniques d'exploitation des données en utilisant des dataframes pour organiser, résumer et interpréter les distributions de données, l'analyse de corrélation et les pipelines de données

  • Données en cours d'utilisation et évaluation de modèles de régression à l'aide de Scikit-learn, et utilisation de ces modèles pour générer des prédictions et soutenir la prise de décision basée sur les données

Compétences que vous acquerrez

  • Catégorie : Data Science
  • Catégorie : Data Manipulation
  • Catégorie : Data Import/Export
  • Catégorie : Analytics
  • Catégorie : Data Wrangling
  • Catégorie : Predictive Modeling
  • Catégorie : Predictive Analytics
  • Catégorie : Exploratory Data Analysis
  • Catégorie : Model Evaluation
  • Catégorie : Data Transformation
  • Catégorie : Data Cleansing
  • Catégorie : Model Training
  • Catégorie : Data Processing
  • Catégorie : Data Preprocessing
  • Catégorie : Statistical Modeling
  • Catégorie : Model Optimization
  • Catégorie : Data Visualization
  • Catégorie : Data Analysis

Outils que vous découvrirez

  • Catégorie : Python Programming
  • Catégorie : Pandas (Python Package)

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours est disponible dans le cadre de
Lorsque vous vous inscrivez à ce cours, vous devez également sélectionner un programme spécifique.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 6 modules dans ce cours

Ce module présente les compétences fondamentales requises pour commencer l'analyse de données à l'aide de Python. Vous apprendrez à comprendre les structures des ensembles de données, à identifier les variables clés et à importer des données à partir de différentes sources en utilisant des bibliothèques Python telles que Pandas et NumPy. Le module explore également comment récupérer des données à partir de bases de données à l'aide de SQLite et comment effectuer une exploration de base des ensembles de données. Grâce à des travaux pratiques, vous vous entraînerez à importer et à examiner des ensembles de données du monde réel tels que le prix des ordinateurs portables et le prix des voitures d'occasion.

Inclus

6 vidéos3 lectures2 devoirs2 éléments d'application

Ce module se concentre sur la préparation des données pour l'analyse grâce à des techniques essentielles de traitement des données. Vous apprendrez à nettoyer, transformer et formater les ensembles de données en traitant les valeurs manquantes, en convertissant les types de données, en normalisant les valeurs numériques et en créant des cellules pour l'analyse. Le module présente également des méthodes de transformation des variables catégorielles en représentations numériques adaptées à la modélisation. Grâce à des exercices pratiques, vous appliquerez ces techniques à des ensembles de données réels.

Inclus

6 vidéos2 lectures2 devoirs2 éléments d'application

Ce module développe votre capacité à analyser et à comprendre des ensembles de données grâce à des techniques d'analyse exploratoire des données. Vous apprendrez à calculer des statistiques descriptives, à effectuer des analyses de corrélation et à appliquer des techniques de regroupement pour découvrir les relations entre les variables. Le module présente également des méthodes de visualisation des données et des tests statistiques tels que le test du chi-carré pour les variables catégorielles. Grâce à des travaux pratiques, vous analyserez des ensembles de données afin d'identifier des tendances, des modèles et des informations potentielles.

Inclus

5 vidéos3 lectures2 devoirs2 éléments d'application1 plugin

Ce module présente les principes fondamentaux de la construction de modèles prédictifs à l'aide de techniques de régression. Vous apprendrez à construire des modèles de régression linéaire simple, linéaire multiple et polynomiale pour analyser les relations entre les variables. Le module couvre également les méthodes d'évaluation des performances des modèles à l'aide de mesures telles que le R au carré et l'erreur quadratique moyenne. Des techniques de visualisation telles que les diagrammes de résidus et les diagrammes KDE sont utilisées pour évaluer l'adéquation des modèles aux données.

Inclus

6 vidéos3 lectures2 devoirs2 éléments d'application

Ce module se concentre sur l'amélioration des performances des modèles grâce à des techniques d'évaluation et d'optimisation. Vous apprendrez à détecter le surajustement et le sous-ajustement et à appliquer des stratégies pour améliorer la généralisation des modèles. Le module présente la régression ridge et l'ajustement des hyperparamètres en utilisant la recherche par grille pour affiner les modèles prédictifs. Grâce à des travaux pratiques, vous évaluerez et améliorerez les modèles de régression en utilisant des ensembles de données du monde réel.

Inclus

4 vidéos3 lectures2 devoirs2 éléments d'application

Dans ce module, vous appliquerez l'ensemble du processus d'analyse des données appris tout au long du cours. Vous importerez, nettoierez, analyserez et modéliserez des ensembles de données du monde réel afin de générer des idées et des prédictions. Le module comprend un projet pratique et un projet final qui simulent des scénarios d'analyse de données réels. Vous passerez également un examen final pour démontrer votre compréhension des concepts clés de l'analyse de données basée sur Python.

Inclus

7 lectures2 devoirs3 éléments d'application

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Évaluations de l’enseignant
(3,302 évaluations)
Joseph Santarcangelo
IBM
37 Cours2 433 982 apprenants

Offert par

IBM

En savoir plus sur Analyse des données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

  • 5 stars

    76,39 %

  • 4 stars

    18,18 %

  • 3 stars

    3,65 %

  • 2 stars

    0,92 %

  • 1 star

    0,83 %

Affichage de 3 sur 19669

LM

Révisé le 9 mars 2020

BM

Révisé le 16 juil. 2020

MA

Révisé le 30 nov. 2020

Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.