Packt
Analyse de régression pour les statistiques et l'Apprentissage automatique en R

Profitez d'une croissance illimitée avec un an de Coursera Plus pour 199 $ (régulièrement 399 $). Économisez maintenant.

Packt

Analyse de régression pour les statistiques et l'Apprentissage automatique en R

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Comprendre les principes de la régression par les moindres carrés ordinaires (MCO) et son application dans R.

  • Analyser et évaluer les modèles de régression statistiques et basés sur le ML pour traiter des questions telles que la multicollinéarité.

  • Appliquer des techniques de sélection des variables et évaluer la précision des modèles à l'aide de méthodes de validation croisée.

  • Créer et interpréter des modèles linéaires généralisés (GLM), en utilisant la régression logistique comme classificateur binaire.

Compétences que vous acquerrez

  • Catégorie : Apprentissage automatique
  • Catégorie : Algorithme de forêt aléatoire
  • Catégorie : Analyse exploratoire des données (AED)
  • Catégorie : R (logiciel)
  • Catégorie : Modélisation statistique
  • Catégorie : Apprentissage automatique
  • Catégorie : Analyse statistique
  • Catégorie : Réduction de dimensionnalité
  • Catégorie : Nettoyage des données
  • Catégorie : La programmation en R
  • Catégorie : Transformation de données
  • Catégorie : Modélisation prédictive
  • Catégorie : Ingénierie des caractéristiques
  • Catégorie : Évaluation de modèles
  • Catégorie : Régression logistique
  • Catégorie : Prétraitement de données
  • Catégorie : Arbre de classification et de régression (CART)

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

9 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Il y a 7 modules dans ce cours

Dans ce module, nous vous présenterons les concepts et outils essentiels pour l'analyse de régression dans R. Vous apprendrez les différences entre l'analyse statistique et l'apprentissage automatique, vous vous familiariserez avec R et R Studio, et vous commencerez à travailler avec des données. Nous vous guiderons à travers les étapes du nettoyage des données et effectuerons une première analyse exploratoire des données afin d'établir une base solide pour votre apprentissage futur.

Inclus

8 vidéos1 lecture1 devoir

Dans ce module, nous allons nous plonger dans la régression par les moindres carrés ordinaires (MCO), en couvrant à la fois la théorie et la mise en œuvre pratique dans R. Vous apprendrez à interpréter les résultats des MCO, à calculer et à appliquer les intervalles de confiance, et à explorer diverses techniques de régression par les MCO, y compris les modèles sans intercepts, l'ANOVA, et la régression linéaire multiple avec des variables d'interaction et des variables fictives. En outre, nous discuterons des conditions essentielles que les modèles MCO doivent remplir pour garantir des résultats précis et fiables.

Inclus

12 vidéos1 devoir

Dans ce module, nous aborderons le problème de la multicollinéarité dans les modèles de régression par les MCO. Vous apprendrez à détecter la multicollinéarité et à gérer les analyses de régression avec des prédicteurs corrélés. Le module couvre des techniques de régression avancées telles que la régression en composantes principales, la régression des moindres carrés partiels, la régression Ridge et la régression LASSO, vous offrant ainsi une boîte à outils complète pour gérer efficacement la multicollinéarité dans R.

Inclus

7 vidéos1 devoir

Dans ce module, nous allons explorer les aspects critiques de la sélection des variables et des modèles dans l'analyse de régression. Vous comprendrez pourquoi la sélection est essentielle, apprendrez à choisir le modèle de régression par MCO le plus approprié et à identifier les sous-ensembles de modèles. Nous aborderons l'évaluation de la précision des modèles de régression du point de vue de l'apprentissage automatique et l'évaluation des performances à l'aide de diverses mesures. En outre, vous mettrez en œuvre la régression LASSO pour la sélection des variables et analyserez la contribution des prédicteurs à l'explication de la variation de la variable de résultat.

Inclus

8 vidéos1 devoir

Dans ce module, nous aborderons les violations courantes des hypothèses du modèle de régression des MCO. Vous apprendrez à appliquer des transformations de données pour corriger les problèmes, à utiliser des méthodes de régression robustes pour gérer les valeurs aberrantes et à traiter l'hétéroscédasticité pour garantir la fiabilité et la validité de vos modèles de régression. Ce module vous dote de techniques essentielles pour affiner votre analyse et améliorer les performances de vos modèles.

Inclus

4 vidéos1 devoir

Dans ce module, nous vous présenterons les modèles linéaires généralisés (GLM) et leurs diverses applications. Vous apprendrez les principes fondamentaux des GLM, notamment la régression logistique pour les variables de réponse binaires, la régression logistique multinomiale et les techniques de régression pour les données de comptage. En outre, nous aborderons les méthodes permettant d'évaluer la qualité de l'ajustement de ces modèles. Ce module vous permettra de mieux comprendre comment les GLM étendent les modèles de régression linéaire traditionnels pour traiter un plus grand nombre de types de données et de distributions.

Inclus

7 vidéos1 devoir

Dans ce module, nous explorerons des méthodes avancées pour travailler avec des données non paramétriques et non linéaires. Vous apprendrez à mettre en œuvre des techniques de régression polynomiale et non linéaire, à utiliser des modèles additifs généralisés (GAM) et leurs versions boostées, et à développer des modèles de splines de régression adaptatifs multivariés (MARS). Nous aborderons également les arbres de régression CART, les arbres d'inférence conditionnelle, les Forêts d'arbres décisionnels et la régression par boosting de gradient. En outre, vous aurez un aperçu de la sélection de modèles d'apprentissage automatique appropriés pour des scénarios de données complexes, améliorant ainsi votre capacité à gérer diverses structures de données dans R.

Inclus

10 vidéos3 devoirs

Instructeur

Packt - Course Instructors
Packt
1 280 Cours304 620 apprenants

Offert par

Packt

En savoir plus sur Apprentissage automatique

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions