Préparez les données pour l'analyse en traitant les valeurs manquantes, en formatant et en normalisant les données, en les regroupant et en transformant les valeurs catégorielles en valeurs numériques.
Comparer et opposer les modèles prédictifs utilisant les méthodes de régression linéaire simple, linéaire multiple et polynomiale.
Examiner les données à l'aide de statistiques descriptives, de regroupement de données, d'analyse de la variance (ANOVA) et de statistiques de corrélation.
Évaluez un modèle dans des conditions de surajustement et de sous-ajustement et réglez ses performances à l'aide de la régularisation et de la recherche en grille.
Lorsque vous vous inscrivez à ce cours, vous devez également sélectionner un programme spécifique.
Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable
Il y a 6 modules dans ce cours
Le langage de programmation R est spécialement conçu pour l'analyse des données. R est la clé qui ouvre la porte entre les problèmes que vous voulez résoudre avec des données et les réponses dont vous avez besoin pour atteindre vos objectifs. Ce cours part d'une question et vous guide ensuite à travers le processus de réponse à cette question à l'aide de données. Vous apprendrez d'abord des techniques importantes pour préparer (ou manipuler) vos données pour l'analyse. Vous apprendrez ensuite à mieux comprendre vos données grâce à l'analyse exploratoire des données, ce qui vous aidera à résumer vos données et à identifier les relations pertinentes entre les variables qui peuvent mener à une meilleure compréhension. Une fois que vos données sont prêtes à être analysées, vous apprendrez à développer votre modèle et à évaluer et ajuster ses performances. En suivant ce processus, vous pouvez être sûr que votre analyse de données répond aux normes que vous avez fixées, et vous pouvez avoir confiance dans les résultats.
Vous acquerrez une expérience pratique en jouant le rôle d'un analyste de données qui analyse les données de départ et d'arrivée d'une compagnie aérienne afin de prévoir les retards des vols. À l'aide d'un ensemble de données sur la ponctualité des transporteurs aériens, vous vous exercerez à lire des fichiers de données, à prétraiter des données, à créer des modèles, à améliorer des modèles et à les évaluer pour finalement choisir le meilleur modèle.
Regardez les vidéos, travaillez dans les laboratoires et enrichissez votre portfolio. Bonne chance ! Note : Le pré-requis pour ce cours est d'avoir des compétences de base en programmation R. Par exemple, assurez-vous d'avoir suivi un cours comme Introduction à la programmation R pour la science des données d'IBM.
Toute analyse de données commence par un problème à résoudre. La compréhension de vos données et des types de questions auxquelles vous pouvez répondre à leur sujet est un aspect essentiel de cette démarche. Le langage de programmation R vous fournit tous les outils dont vous avez besoin pour réaliser des analyses de données puissantes, en assurant la liaison entre vos données et les problèmes du monde réel que vous souhaitez résoudre.
Dans ce module, vous passerez en revue un type de problème que vous pouvez résoudre avec R et les données sous-jacentes qui forment la base de votre analyse. Vous découvrirez également les packages R pour l'analyse des données, qui fournissent un ensemble d'outils puissants que vous utiliserez probablement dans vos analyses de données quotidiennes. Enfin, vous verrez comment importer des données et obtenir des informations de base à partir de l'ensemble de données.
Afficher les informations sur le contenu du module
6 vidéos•Total 24 minutes
Introduction à l'analyse de données avec R•3 minutes
Le problème•4 minutes
Comprendre les données•4 minutes
Packages R pour la science des données•5 minutes
Importer et exporter des données dans R•6 minutes
Commencer à analyser des données avec R•3 minutes
1 lecture•Total 10 minutes
Résumé et points forts•10 minutes
2 devoirs•Total 20 minutes
Quiz pratique•10 minutes
Quiz noté•10 minutes
1 élément d'application•Total 60 minutes
Travaux pratiques 1 : Introduction à l'analyse des données•60 minutes
1 plugin•Total 15 minutes
Aide-mémoire : fonctions dplyr•15 minutes
Traitement des données
Module 2•2 heures à terminer
Détails du module
La manipulation des données, ou prétraitement des données, est une première étape essentielle pour parvenir à une analyse précise et complète de vos données. Ce processus transforme vos données brutes dans un format qui peut être facilement catégorisé ou mis en correspondance avec d'autres données, créant ainsi des relations prévisibles entre elles et facilitant la construction des modèles dont vous avez besoin pour répondre aux questions concernant vos données.
Ce module présente une introduction au prétraitement des données dans R et vous fournit ensuite les outils dont vous avez besoin pour identifier et traiter les valeurs manquantes dans votre ensemble de données, transformer les formats de données pour les aligner sur d'autres données auxquelles vous souhaitez les comparer, normaliser vos données, créer des catégories d'informations grâce à la classification des données, et convertir les variables catégorielles en valeurs quantitatives qui peuvent ensuite être utilisées dans des analyses basées sur des données numériques.
Afficher les informations sur le contenu du module
6 vidéos•Total 26 minutes
Prétraitement des données dans R•2 minutes
Traitement des valeurs manquantes dans R•8 minutes
Formatage des données dans R•4 minutes
Normalisation des données dans R•5 minutes
L'échantillonnage (Binning) dans R•4 minutes
Transformer des valeurs catégorielles en variables numériques dans R•4 minutes
1 lecture•Total 10 minutes
Résumé et points forts•10 minutes
2 devoirs•Total 22 minutes
Quiz pratique•10 minutes
Quiz noté•12 minutes
1 élément d'application•Total 60 minutes
Travaux pratiques 2 : Traitement des données•60 minutes
1 plugin•Total 15 minutes
Aide-mémoire - Gestion des données avec Tidyverse•15 minutes
Analyse exploratoire des données
Module 3•2 heures à terminer
Détails du module
L'analyse exploratoire des données, ou AED, est une approche de l'analyse des données qui résume leurs principales caractéristiques et vous aide à mieux comprendre l'ensemble des données, à découvrir les relations entre les différentes variables et à extraire les variables importantes pour le problème que vous essayez de résoudre.
La principale question à laquelle vous essayez de répondre dans ce module est la suivante : "Quelles sont les causes des retards des vols ?" Dans ce module, vous apprendrez quelques techniques utiles d'analyse exploratoire des données qui vous aideront à répondre à cette question.
Afficher les informations sur le contenu du module
5 vidéos•Total 27 minutes
Statistiques descriptives•6 minutes
Regrouper des données dans R•5 minutes
Analyse de la variance (ANOVA) dans R•6 minutes
Corrélation dans R•5 minutes
Corrélation - Statistiques•6 minutes
1 lecture•Total 5 minutes
Résumé et points forts•5 minutes
2 devoirs•Total 20 minutes
Quiz pratique•10 minutes
Quiz noté•10 minutes
1 élément d'application•Total 60 minutes
Travaux pratiques 3 : Analyse exploratoire des données•60 minutes
1 plugin•Total 15 minutes
Aide-mémoire : Analyse exploratoire des données•15 minutes
Développement de modèles en R
Module 4•2 heures à terminer
Détails du module
Vous avez identifié le problème que vous essayez de résoudre, vous avez prétraité l'ensemble de données que vous utiliserez dans votre analyse et vous avez effectué une analyse exploratoire des données pour répondre à certaines de vos questions initiales. Il est maintenant temps de développer votre modèle et d'évaluer la solidité de vos hypothèses.
Dans ce module, vous examinerez le développement d'un modèle en essayant de prédire le retard à l'arrivée d'un vol à l'aide de l'ensemble de données des compagnies aériennes. Vous apprendrez les techniques de régression pour déterminer la corrélation entre les variables de votre ensemble de données et évaluerez le résultat à la fois visuellement et par le calcul de métriques.
Afficher les informations sur le contenu du module
7 vidéos•Total 38 minutes
Introduction au développement de modèles•3 minutes
Régression linéaire simple•9 minutes
Régression linéaire multiple•4 minutes
Évaluation visuelle des modèles•9 minutes
Régression polynomiale•4 minutes
Évaluation du modèle•5 minutes
Prédiction et prise de décision•5 minutes
1 lecture•Total 5 minutes
Résumé et points forts•5 minutes
2 devoirs•Total 30 minutes
Quiz pratique•16 minutes
Quiz noté•14 minutes
1 élément d'application•Total 60 minutes
Travaux pratiques 4 : Développement d'un modèle•60 minutes
1 plugin•Total 15 minutes
Aide-mémoire - Développement de modèles•15 minutes
Évaluation du modèle
Module 5•2 heures à terminer
Détails du module
Vous avez une bonne compréhension de vos données et vous les avez prétraitées pour obtenir les meilleurs résultats possibles. Vous avez effectué une analyse exploratoire des données et développé votre modèle. Tout semble bon jusqu'à présent, mais comment pouvez-vous être certain que votre modèle fonctionne dans le monde réel et qu'il offre des performances optimales ?
Dans ce module, vous apprendrez à utiliser le cadre des tidymodèles pour évaluer votre modèle. Tidymodels est une collection de paquets pour la modélisation et l'apprentissage automatique utilisant les principes de tidyverse. À l'aide de ces packages, vous apprendrez à effectuer une validation croisée de vos modèles, à identifier les problèmes potentiels, tels que le surajustement et le sous-ajustement, et à traiter les problèmes de surajustement à l'aide d'une technique appelée régularisation. Vous apprendrez également à ajuster vos modèles à l'aide de la recherche en grille.
Afficher les informations sur le contenu du module
4 vidéos•Total 30 minutes
Évaluation du modèle•10 minutes
Surajustement et sous-ajustement•8 minutes
Régularisation•7 minutes
Recherche par quadrillage•5 minutes
1 lecture•Total 5 minutes
Résumé et points forts•5 minutes
2 devoirs•Total 16 minutes
Quiz pratique•8 minutes
Quiz noté•8 minutes
1 élément d'application•Total 60 minutes
Travaux pratiques 5 : Évaluation du modèle•60 minutes
1 plugin•Total 15 minutes
Aide-mémoire - Évaluation du modèle•15 minutes
Projet
Module 6•4 heures à terminer
Détails du module
Inclus
4 lectures1 devoir1 évaluation par les pairs2 éléments d'application
Afficher les informations sur le contenu du module
4 lectures•Total 14 minutes
Aperçu du travail final•5 minutes
Lecture : Lignes directrices pour la soumission du projet final et éléments livrables•5 minutes
Félicitations et prochaines étapes•2 minutes
Crédits et remerciements•2 minutes
1 devoir•Total 50 minutes
Examen final •50 minutes
1 évaluation par les pairs•Total 60 minutes
Option 2 : Peer-To-Peer - Présentation et évaluation du projet final•60 minutes
2 éléments d'application•Total 120 minutes
Option 1 : notée par l'IA - Présentation et évaluation du projet final•60 minutes
Laboratoire pour le projet final - Analyse de la météo NOAA pour l'aéroport JFK•60 minutes
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeurs
Évaluations de l’enseignant
Évaluations de l’enseignant
Nous avons demandé à tous les étudiants de fournir des commentaires sur nos enseignants au sujet de la qualité de leur pédagogie.
Chez IBM, nous savons à quel point la technologie évolue rapidement et nous reconnaissons le besoin crucial pour les entreprises et les professionnels d'acquérir rapidement des compétences pratiques prêtes à l'emploi. En tant qu'innovateur technologique leader sur le marché, nous nous engageons à vous aider à prospérer dans ce paysage dynamique. Grâce à IBM Skills Network, nos programmes de formation conçus par des experts en IA, développement de logiciels, cybersécurité, science des données, gestion d'entreprise, et plus encore, fournissent les compétences essentielles dont vous avez besoin pour décrocher votre premier emploi, faire progresser votre carrière ou favoriser la réussite de votre entreprise. Que vous vous perfectionniez ou que vous perfectionniez votre équipe, nos cours, nos spécialisations et nos certificats professionnels développent l'expertise technique qui vous assure, ainsi qu'à votre organisation, d'exceller dans un monde compétitif.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Avis des étudiants
4.7
371 avis
5 stars
81,72 %
4 stars
11,02 %
3 stars
2,95 %
2 stars
1,88 %
1 star
2,41 %
Affichage de 3 sur 371
C
CB
5·
Révisé le 2 déc. 2022
Demanding for beginners but rewarding. A lot of extra-curricular study required
D
DG
4·
Révisé le 30 sept. 2023
The only problem for me was understanding that lab practice problems are in Jupyter Notebook, instead of the R script! Strange but dealt with it!
P
PG
5·
Révisé le 24 juil. 2022
One of the best courses for learning R programming and data analysis.
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Qu'est-ce que je recevrai si je m'abonne à ce certificat ?
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours du certificat et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - à partir de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.