Duke University

Modélisation des données et prédiction avec R

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Duke University

Modélisation des données et prédiction avec R

Mine Çetinkaya-Rundel
Dr. Elijah Meyer

Instructeurs : Mine Çetinkaya-Rundel

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Débutant
Aucune connaissance prérequise
1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Débutant
Aucune connaissance prérequise
1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Ajuster et interpréter des modèles de régression linéaire et logistique afin d'étudier les relations entre les variables prédictives et les résultats.

  • Évaluer les performances du modèle et identifier ses limites, telles que le surapprentissage.

  • Utiliser la méthode du bootstrapping et les tests d'hypothèse pour quantifier et communiquer l'incertitude liée aux résultats des modèles.

Compétences que vous acquerrez

  • Catégorie : Prise de décision fondée sur des données
  • Catégorie : Inférence statistique
  • Catégorie : Modèle de formation
  • Catégorie : Tests d'hypothèses statistiques
  • Catégorie : Probabilités et statistiques
  • Catégorie : Analyse de corrélation
  • Catégorie : Régression logistique
  • Catégorie : Analyse de régression
  • Catégorie : Programmation statistique
  • Catégorie : Statistiques
  • Catégorie : Modélisation des données
  • Catégorie : Méthodes statistiques
  • Catégorie : Modélisation statistique
  • Catégorie : Modélisation prédictive
  • Catégorie : Évaluation du modèle
  • Catégorie : Analyse prédictive

Outils que vous découvrirez

  • Catégorie : R (logiciel)
  • Catégorie : R Programmation

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

4 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation "Science des données avec R"
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 4 modules dans ce cours

Dans ce module, vous apprendrez à décrire les relations entre des variables à l'aide d'une régression linéaire simple. Vous vous exercerez à ajuster des modèles, à interpréter des coefficients et à visualiser des tendances afin de dégager des informations pertinentes à partir des données. À la fin de ce module, vous saurez comment faire des prévisions et identifier les cas où votre modèle pourrait ne pas être aussi bien adapté que vous le pensez.

Inclus

6 vidéos8 lectures1 devoir1 plugin

Les données réelles sont rarement simples. Dans ce module, vous étendrez la modélisation par régression pour y inclure plusieurs variables prédictives et des effets d'interaction. Vous découvrirez comment l'ajout de variables améliore la précision du modèle, comment interpréter des relations complexes et comment éviter le surajustement à mesure que vos modèles gagnent en sophistication.

Inclus

3 vidéos4 lectures1 devoir1 plugin

Les résultats ne sont pas tous numériques. Dans ce module, vous apprendrez à modéliser des résultats catégoriels (par exemple, « oui/non » ou « spam/pas de spam ») à l’aide de la régression logistique. Vous découvrirez comment calculer des probabilités, classer les résultats et évaluer les performances de vos modèles. Au fil de ce module, vous explorerez l’impact du surapprentissage sur la classification et réfléchirez à la manière d’interpréter et de communiquer les prédictions des modèles de manière responsable.

Inclus

5 vidéos6 lectures1 devoir1 plugin

Tout modèle comporte une part d’incertitude, et c’est votre capacité à comprendre et à communiquer cette incertitude qui fait de vous un data scientist avisé. Dans ce dernier module, vous explorerez les méthodes de bootstrapping et de randomisation pour évaluer le niveau de confiance de vos résultats, réaliser des tests d’hypothèses et communiquer vos conclusions en toute transparence. À la fin de ce module, vous mettrez en pratique vos compétences en modélisation et en inférence pour tirer des conclusions claires, fondées sur les données.

Inclus

4 vidéos5 lectures1 devoir1 plugin

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Mine Çetinkaya-Rundel
Duke University
11 Cours432 147 apprenants

Offert par

Duke University

En savoir plus sur Analyse des données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions