Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable
Il y a 11 modules dans ce cours
Le développement d'informations sur votre organisation, votre entreprise ou votre projet de recherche dépend d'une modélisation et d'une analyse efficaces des données que vous collectez. Pour construire des modèles efficaces, il faut comprendre les différents types de questions que vous pouvez poser et la manière de faire correspondre ces questions à vos données. Différentes approches de modélisation peuvent être choisies pour détecter des modèles intéressants dans les données et identifier des relations cachées. Ce cours couvre les types de questions que vous pouvez poser sur les données et les différentes approches de modélisation que vous pouvez appliquer. Les sujets abordés comprennent les tests d'hypothèse, la régression linéaire, la modélisation non linéaire et l'apprentissage automatique. Avec cette collection d'outils à votre disposition, ainsi que les techniques apprises dans les autres cours de cette spécialisation, vous serez en mesure de faire des découvertes clés à partir de vos données pour améliorer la prise de décision dans l'ensemble de votre organisation. Dans cette spécialisation, nous supposons que vous êtes familier avec le langage de programmation R. Si vous n'êtes pas encore familiarisé avec R, nous vous suggérons de suivre d'abord le cours de programmation R avant de suivre ce cours.
Le développement d'informations sur votre organisation, votre entreprise ou votre projet de recherche dépend d'une modélisation et d'une analyse efficaces des données que vous collectez. Pour construire des modèles efficaces, il faut comprendre les différents types de questions que vous pouvez poser et la manière de les faire correspondre à vos données. Différentes approches de modélisation peuvent être choisies pour détecter des modèles intéressants dans les données et identifier des relations cachées.
Inclus
16 lectures1 devoir
Afficher les informations sur le contenu du module
16 lectures•Total 195 minutes
Manuel du cours•10 minutes
L'objectif de la science des données•5 minutes
Types de questions sur la science des données•10 minutes
Besoins en données•5 minutes
Le nombre d'observations est trop faible•5 minutes
L'ensemble de données ne contient pas les variables exactes que vous recherchez•10 minutes
Les variables de l'ensemble de données ne sont pas collectées la même année•5 minutes
L'ensemble de données n'est pas représentatif de la population qui vous intéresse•10 minutes
Certaines variables de l'ensemble de données sont mesurées avec erreur•5 minutes
Les variables sont confondues•10 minutes
Analyse descriptive et exploratoire des données•15 minutes
Valeurs manquantes•10 minutes
Forme•25 minutes
Identifier les valeurs aberrantes•20 minutes
Évaluation des variables•20 minutes
Évaluer les relations•30 minutes
1 devoir•Total 30 minutes
Quiz sur les bases de la modélisation des données•30 minutes
Inférence
Module 2•1 heure à terminer
Détails du module
L'analyse inférentielle est ce que les analystes effectuent après avoir décrit et exploré leur ensemble de données. Après avoir mieux compris votre ensemble de données, les analystes tentent souvent de déduire quelque chose des données. Pour ce faire, ils utilisent des tests statistiques. Nous avons discuté de la manière dont nous pouvons utiliser des modèles pour effectuer des analyses d'inférence et de prédiction. Qu'est-ce que cela signifie ?
Inclus
3 lectures1 devoir
Afficher les informations sur le contenu du module
3 lectures•Total 30 minutes
Inférence•10 minutes
Incertitude•10 minutes
L'échantillonnage aléatoire•10 minutes
1 devoir•Total 30 minutes
Quiz sur l'inférence•30 minutes
Modélisation linéaire
Module 3•2 heures à terminer
Détails du module
Les modèles linéaires sont les modèles les plus couramment utilisés dans l'analyse des données en raison de leur efficacité informatique et de leur facilité d'interprétation. Une bonne compréhension des modèles linéaires et de leur fonctionnement est essentielle pour tout travail dans le domaine de la science des données. Le tidyverse fournit un ensemble d'outils permettant de rendre la modélisation linéaire plus efficace et plus rationnelle.
Inclus
12 lectures1 devoir
Afficher les informations sur le contenu du module
12 lectures•Total 119 minutes
Régression linéaire•15 minutes
Hypothèses•20 minutes
Association•15 minutes
Tests d'association en R•10 minutes
Ajustement du modèle•2 minutes
Diagnostic du modèle•10 minutes
Exemple de hauteur et de circonférence d'un arbre•10 minutes
Interprétation du modèle•10 minutes
Variance expliquée•5 minutes
Utilisation d'un balai•5 minutes
Corrélation n'est pas causalité•7 minutes
Confusion•10 minutes
1 devoir•Total 30 minutes
Quiz sur la régression linéaire•30 minutes
Régression linéaire multiple
Module 4•1 heure à terminer
Détails du module
La régression linéaire multiple est nécessaire lorsque vous souhaitez inclure des facteurs de confusion ou d'autres prédicteurs dans votre modèle de réponse. R fournit un moyen simple de le faire via l'interface de formule de la fonction lm().
Inclus
1 lecture1 devoir
Afficher les informations sur le contenu du module
1 lecture•Total 15 minutes
Régression linéaire multiple•15 minutes
1 devoir•Total 30 minutes
Quiz sur la régression linéaire multiple•30 minutes
Au-delà de la régression linéaire
Module 5•23 minutes à terminer
Détails du module
Bien que nous nous soyons concentrés sur la régression linéaire dans cette leçon sur l'inférence, la régression linéaire n'est pas la seule approche analytique existante. Cependant, on peut dire que c'est la plus couramment utilisée. En outre, il existe de nombreux tests et approches statistiques qui sont de légères variations de la régression linéaire, de sorte qu'une base solide et une bonne compréhension de la régression linéaire simplifient grandement la compréhension de ces autres tests et approches. Par exemple, que se passerait-il si vous ne vouliez pas mesurer la relation linéaire entre deux variables, mais plutôt savoir si la moyenne observée est différente de l'espérance ?
Inclus
3 lectures
Afficher les informations sur le contenu du module
3 lectures•Total 23 minutes
Au-delà de la régression linéaire•3 minutes
Une moyenne différente des attentes ?•5 minutes
Test de la différence moyenne par rapport à l'attente en R•15 minutes
Test d'hypothèse
Module 6•1 heure à terminer
Détails du module
Les tests d'hypothèse décrivent une famille de techniques statistiques permettant de déterminer si les données collectées fournissent des preuves de la valeur d'un paramètre inconnu d'intérêt. L'objectif des tests d'hypothèses est de faire des déductions tout en tenant compte de la variabilité des données qui peut conduire à des résultats erronés.
Inclus
3 lectures1 devoir1 plugin
Afficher les informations sur le contenu du module
3 lectures•Total 27 minutes
Autres tests statistiques•2 minutes
Test d'hypothèse•10 minutes
Le paquet infér•15 minutes
1 devoir•Total 30 minutes
Quiz sur les tests d'hypothèse•30 minutes
1 plugin•Total 15 minutes
Les tests statistiques courants sont des modèles linéaires (ou : comment enseigner les statistiques)•15 minutes
Modélisation de la prédiction
Module 7•3 heures à terminer
Détails du module
La modélisation de la prédiction est une activité essentielle de la science des données et implique la construction de systèmes permettant de faire des prédictions basées sur des données observées précédemment. Ces modèles sont généralement très flexibles et peuvent saisir un éventail de relations différentes.
Inclus
12 lectures1 devoir
Afficher les informations sur le contenu du module
12 lectures•Total 133 minutes
Modélisation de la prédiction•10 minutes
Qu'est-ce que l'apprentissage automatique ?•10 minutes
Étapes de l'apprentissage automatique•10 minutes
Fractionnement des données•10 minutes
Former, tester, valider•10 minutes
Train•3 minutes
Test•5 minutes
Valider•10 minutes
Sélection des variables•15 minutes
Sélection du modèle•5 minutes
Régression et classification•30 minutes
Précision du modèle•15 minutes
1 devoir•Total 30 minutes
Quiz sur la prédiction et l'apprentissage automatique•30 minutes
L'écosystème tidymodels
Module 8•2 heures à terminer
Détails du module
Grâce au travail de RStudio, des packages incroyablement utiles sont disponibles dans R. Comme indiqué plus haut, il existe des centaines d'algorithmes d'apprentissage automatique différents. Les paquets R tidymodels ont rassemblé un grand nombre d'entre eux dans un cadre unique, ce qui vous permet d'utiliser facilement de nombreux modèles d'apprentissage automatique différents.
Inclus
5 lectures1 devoir
Afficher les informations sur le contenu du module
5 lectures•Total 100 minutes
L'écosystème tidymodels•5 minutes
Avantages de tidymodels•5 minutes
Paquets de tidymodels•15 minutes
Exemple de prédiction à partir d'une variable continue•45 minutes
Exemple de prédiction d'une variable catégorielle•30 minutes
1 devoir•Total 30 minutes
tidymodels Quiz•30 minutes
Études de cas
Module 9•5 heures à terminer
Détails du module
Cette étude de cas présente une approche de la construction d'un modèle de prévision des concentrations de pollution de l'air extérieur aux États-Unis.
Inclus
17 lectures1 laboratoire non noté
Afficher les informations sur le contenu du module
17 lectures•Total 305 minutes
Étude de cas n° 1 : Prévision de la pollution atmosphérique annuelle•5 minutes
Les données•5 minutes
Importation de données•5 minutes
Exploration et traitement des données•20 minutes
Évaluer la corrélation•15 minutes
Diviser les données•10 minutes
Élaboration d'une recette•30 minutes
Exécution du prétraitement•30 minutes
Spécification du modèle•20 minutes
Évaluation de l'adéquation du modèle•15 minutes
Performance du modèle : Obtenir des valeurs prédites•15 minutes
Visualisation des performances du modèle•5 minutes
Quantifier les performances du modèle•10 minutes
Évaluation de la performance des modèles sur les plis v à l'aide de tune•30 minutes
Forêts d'arbres décisionnels•30 minutes
Modèle Tuning•30 minutes
Évaluation de la performance du modèle final•30 minutes
1 laboratoire non noté•Total 5 minutes
Étude de cas n° 1 : Prévision de la pollution atmosphérique annuelle•5 minutes
Résumé de tidymodels
Module 10•5 minutes à terminer
Détails du module
La collection de paquets tidymodels peut être écrasante à première vue. Nous vous proposons ici un tableau récapitulatif rapide pour vous aider à vous y retrouver parmi tous les paquets et à savoir quand ils doivent être utilisés.
Inclus
1 lecture
Afficher les informations sur le contenu du module
1 lecture•Total 5 minutes
Résumé de tidymodels•5 minutes
Projet : Modélisation des données dans le Tidyverse
Module 11•2 heures à terminer
Détails du module
Dans ce projet, vous vous entraînerez à construire des modèles avec le tidyverse pour classer les données des plaintes des consommateurs provenant du Consumer Financial Protection Bureau (CFPB). Ce projet comprend à la fois une étape d'évaluation par les pairs au cours de laquelle vous téléchargerez des fichiers R Markdown et HTML tricotés ET une étape de quiz au cours de laquelle vous répondrez à des questions sur les prédictions faites par votre algorithme de classification.
Inclus
1 lecture1 devoir1 évaluation par les pairs
Afficher les informations sur le contenu du module
1 lecture•Total 10 minutes
Informations importantes avant de commencer le quiz•10 minutes
1 devoir•Total 30 minutes
Quiz de prédiction du projet de cours•30 minutes
1 évaluation par les pairs•Total 60 minutes
Modélisation des données dans le projet de cours Tidyverse•60 minutes
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
La mission de l'université Johns Hopkins est d'éduquer ses étudiants et de cultiver leur capacité à apprendre tout au long de leur vie, d'encourager la recherche indépendante et originale et de faire profiter le monde des avantages de la découverte.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Qu'est-ce que je recevrai si je souscris à cette Specializations ?
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Une aide financière est-elle disponible ?
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.