Apprentissage statistique

Économisez sur les compétences qui vous font briller avec 40 % de réduction sur 3 mois de Coursera Plus. Économisez maintenant

Apprentissage statistique

Ce cours fait partie de Spécialisation "Introduction aux techniques de la Science des données"

Instructeur : Shahrzad (Sara) Jamshidi

1 897 déjà inscrits

Inclus avec

9 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Intermédiaire

Expérience recommandée

3 mois à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

Préparer un diplôme

9 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Intermédiaire

Expérience recommandée

3 mois à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

Préparer un diplôme

Compétences que vous acquerrez

Catégorie : Analyse des données
Catégorie : Évaluation du modèle
Catégorie : Analyse statistique
Catégorie : Méthodes statistiques
Catégorie : Inférence statistique
Catégorie : Régression logistique
Catégorie : Algorithmes d'apprentissage automatique
Catégorie : Programmation statistique
Catégorie : Modélisation statistique
Catégorie : Statistiques
Catégorie : Apprentissage automatique
Catégorie : Statistiques bayésiennes
Catégorie : Apprentissage supervisé
Catégorie : Analyse de régression
Catégorie : Apprentissage statistique des machines
Catégorie : Modélisation prédictive
Catégorie : Méthodes d'apprentissage automatique
Catégorie : Apprentissage non supervisé
Catégorie : Science des données
Catégorie : Apprentissage automatique appliqué

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

36 devoirs

Enseigné en Anglais

91% of learners achieved a positive career outcome

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation "Introduction aux techniques de la Science des données"

Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.

Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable

Il y a 9 modules dans ce cours

Ce cours offre une plongée profonde dans le monde de l'analyse statistique, équipant les apprenants de techniques de pointe pour comprendre et interpréter les données de manière efficace. Nous explorons un éventail de méthodologies, de la régression et de la classification aux approches avancées telles que les méthodes à noyau et les machines à vecteurs de support, toutes conçues pour améliorer vos compétences en analyse de données. Notre voyage est guidé par le célèbre manuel "The Elements of Statistical Learning" de T. Hastie, R. Tibshirani, et J. Friedman. Ce cours fournit des exemples écrits en Python. Votre système doit disposer de Python 3.8 ou d'une version plus récente, ainsi que de bibliothèques essentielles telles que NumPy, pandas, matplotlib, seaborn, scikit-learn, SciPy et PyTorch. Ces outils ne soutiennent pas seulement le processus d'apprentissage mais vous préparent également à relever les défis de l'analyse de données dans le monde réel. Que vous souhaitiez affiner votre expertise ou que vous débutiez dans le domaine de la science des données, ce cours fournit les connaissances et les outils nécessaires pour transformer votre compréhension et l'application de l'apprentissage statistique. C'est un mélange parfait de théorie et de pratique, idéal pour tous ceux qui cherchent à améliorer leurs compétences en matière d'interprétation et d'analyse des données.

Bienvenue à l'apprentissage statistique ! Dans ce cours, nous couvrirons les sujets suivants : Apprentissage statistique : Terminologie et idées, méthodes de régression linéaire, méthodes de classification linéaire, méthodes d'expansion de base, méthodes de lissage à noyau, évaluation et sélection de modèles, inférence du maximum de vraisemblance et sujets avancés. Le module 1 propose une exploration approfondie de l'apprentissage statistique, en commençant par le raisonnement qui sous-tend le choix d'une famille prédéfinie de fonctions et l'optimisation de l'erreur de prédiction attendue (EPE). Il couvre les éléments essentiels de l'apprentissage statistique, y compris la fonction de perte, le compromis biais-variance dans la sélection des modèles et l'importance de l'évaluation des modèles. Ce module fait également la distinction entre l'apprentissage supervisé et non supervisé, discute des différents types de modèles d'apprentissage statistique et de représentation des données, et approfondit les trois éléments centraux d'un problème d'apprentissage statistique, fournissant ainsi une introduction complète à ce domaine.

Inclus

8 vidéos5 lectures4 devoirs1 sujet de discussion1 laboratoire non noté

8 vidéosTotal 55 minutes

Bienvenue à l'instructeur3 minutes
Aperçu du cours5 minutes
Module 1 Introduction1 minute
Qu'est-ce que l'apprentissage statistique ?6 minutes
Types de données15 minutes
Modèles d'apprentissage statistique7 minutes
SELECT INTO8 minutes
Description formelle de l'apprentissage statistique11 minutes

5 lecturesTotal 105 minutes

Syllabus10 minutes
Qu'est-ce que l'apprentissage statistique ?10 minutes
Terminologie et types de données15 minutes
Description formelle de la lecture d'apprentissage statistique60 minutes
Résumé du module 110 minutes

4 devoirsTotal 38 minutes

Qu'est-ce que l'apprentissage statistique ?3 minutes
Quiz sur la terminologie et les types de données5 minutes
Description formelle de l'apprentissage statistique Quiz15 minutes
Module 1 Évaluation sommative15 minutes

1 sujet de discussionTotal 10 minutes

Rencontre et discussion10 minutes

1 laboratoire non notéTotal 60 minutes

Exercice de codage60 minutes

Bienvenue au module 2 de Math 569 : Apprentissage statistique. Nous explorons ici ce qui est sans doute le modèle fondamental du domaine : la régression linéaire. Ce modèle simple mais très utile nous aide à mieux comprendre le problème de l'apprentissage statistique abordé dans le module 1. Dans la leçon 1, nous examinerons attentivement ce que la régression linéaire vise à faire, comment nous construisons les paramètres du modèle avec un ensemble de données donné, et quels types de tests statistiques nous pouvons effectuer sur nos coefficients estimés. Dans la leçon 2, nous aborderons une méthode connue sous le nom de sélection de sous-ensembles, qui vise à améliorer la régression linéaire en éliminant les variables indépendantes qui n'ont pas d'impact. Dans la leçon 3, nous étudierons l'introduction d'un biais dans le modèle de régression linéaire à l'aide de deux méthodes de régularisation : Ridge Regression et LASSO. Ces méthodes utilisent un hyperparamètre, un concept clé de ce cours, pour limiter la croissance des coefficients. C'est la source du biais et cela nous aidera à comprendre pourquoi un estimateur biaisé peut surpasser notre estimateur sans biais pour les coefficients de la régression linéaire de la leçon 1. Enfin, la leçon 4 introduit le concept de transformation de données, qui permet de traiter les complexités d'un ensemble de données. Elle fournit également un moyen simple de convertir un modèle linéaire en un modèle non linéaire.

Inclus

10 vidéos6 lectures5 devoirs6 laboratoires non notés

10 vidéosTotal 91 minutes

Module 2 Introduction2 minutes
Qu'est-ce que la régression linéaire ? - Partie 18 minutes
Qu'est-ce que la régression linéaire ? - Partie 24 minutes
Régression linéaire11 minutes
Hypothèses de régression linéaire10 minutes
Outils statistiques21 minutes
Sélection de sous-ensembles9 minutes
Régression de la crête10 minutes
LASSO9 minutes
Exemples de Transformation de données et Régressions linéaires7 minutes

6 lecturesTotal 290 minutes

Module 2 Introduction Lecture5 minutes
Régression linéaire et lecture des moindres carrés30 minutes
Modification de la régression linéaire : Lectures sur la sélection de sous-ensembles120 minutes
Coefficient de régression linéaire : Régression Ridge et LASSO Lectures120 minutes
Transformation de données et Régression linéaire Lecture5 minutes
Résumé du module 210 minutes

5 devoirsTotal 90 minutes

Quiz sur la régression linéaire et les moindres carrés10 minutes
Modification de la Régression linéaire : Quiz sur la sélection des sous-ensembles5 minutes
Coefficient de régression linéaire : Régression Ridge et LASSO Quiz10 minutes
Transformation de données et Régression linéaire Quiz5 minutes
Module 2 Évaluation sommative60 minutes

6 laboratoires non notésTotal 360 minutes

Exemple de codage60 minutes
Exercice de codage60 minutes
Exemple de codage60 minutes
Exercice de codage60 minutes
Exemple de codage60 minutes
Exercice de codage60 minutes

Bienvenue au module 3 de Math 569 : Apprentissage statistique, où nous nous penchons sur la classification linéaire. Dans la leçon 1, nous avons exploré comment la régression linéaire, généralement utilisée pour prédire des résultats continus, peut être adaptée aux tâches de classification, c'est-à-dire à la prédiction de catégories discrètes. Nous aborderons la conversion des données catégoriques en un format numérique adapté à la classification et présenterons des mesures de classification essentielles telles que l'exactitude, la précision et le rappel. Dans la leçon 2, nous explorerons l'analyse discriminante linéaire (LDA) en tant que méthode alternative pour construire des classifications linéaires. Cette méthode introduit la notion selon laquelle la classification maximise la probabilité d'une catégorie étant donné un point de données, un cadre sur lequel nous reviendrons plus tard dans le cours. La maximisation de la probabilité de classification, compte tenu de certaines hypothèses simplificatrices, conduit à un modèle linéaire qui peut également réduire la dimensionnalité du problème. Enfin, dans la leçon 3, nous aborderons la régression logistique, qui est construite en supposant que les log-vraisemblances sont des modèles linéaires. Le résultat, similaire à la LDA, produit une limite de décision linéaire.

Inclus

5 vidéos6 lectures4 devoirs6 laboratoires non notés

5 vidéosTotal 38 minutes

Module 3 Introduction2 minutes
Classification avec Régression linéaire11 minutes
Régression linéaire et matrices indicatrices8 minutes
Analyse discriminante linéaire (LDA)10 minutes
Régression logistique8 minutes

6 lecturesTotal 175 minutes

Module 3 Introduction Lecture15 minutes
Régression linéaire d'un indicateur Lecture de la matrice20 minutes
Lectures sur l'analyse discriminante linéaire (LDA)45 minutes
Lectures sur la régression logistique75 minutes
Résumé du module 310 minutes
Les points de vue d'un leader de l'industrie : En savoir plus sur notre programme10 minutes

4 devoirsTotal 210 minutes

Régression linéaire d'une matrice d'indicateurs Quiz10 minutes
Quiz sur l'analyse discriminante linéaire (LDA)10 minutes
Quiz sur la régression logistique10 minutes
Module 3 Évaluation sommative180 minutes

6 laboratoires non notésTotal 480 minutes

Exemple de codage120 minutes
Exercice de codage60 minutes
Exemple de codage120 minutes
Exercice de codage60 minutes
Exemple de codage60 minutes
Exercice de codage60 minutes

Bienvenue au module 4 de Math 569 : Apprentissage statistique, qui se concentre sur les méthodes avancées de modélisation statistique. Ce module commence par une introduction aux méthodes d'expansion de base, explorant comment ces techniques améliorent les modèles linéaires en incorporant des relations non linéaires. Nous nous penchons ensuite sur les polynômes par morceaux, en discutant de leur utilité pour capturer les tendances variables à travers différents segments de données. Dans la leçon 2, nous explorons les splines de lissage, en soulignant leur rôle dans l'équilibre efficace entre l'ajustement et la complexité du modèle. Enfin, la leçon 3 traite de la régularisation et des fonctions noyaux, en expliquant comment ces concepts contribuent à la construction de modèles plus complexes sans augmenter de manière significative la complexité algorithmique.

Inclus

5 vidéos5 lectures4 devoirs6 laboratoires non notés

5 vidéosTotal 26 minutes

Module 4 Introduction2 minutes
Quelles sont les méthodes d'expansion de base ?3 minutes
Polynômes par morceaux, méthode et théorie6 minutes
Lissage des splines6 minutes
Régularisation et fonctions du noyau9 minutes

5 lecturesTotal 330 minutes

Module 4 Introduction Lecture20 minutes
Lectures sur les polynômes paramétriques60 minutes
Lectures sur les splines de lissage60 minutes
Régularisation via les espaces de Hilbert à noyau reproductif Lectures180 minutes
Résumé du module 410 minutes

4 devoirsTotal 90 minutes

Polynômes par morceaux Quiz10 minutes
Quiz sur les splines de lissage10 minutes
Régularisation via les espaces hilbertiens à noyau reproducteur Quiz10 minutes
Module 4 Évaluation sommative60 minutes

6 laboratoires non notésTotal 360 minutes

Exemple de codage60 minutes
Exercice de codage60 minutes
Exemple de codage60 minutes
Exercice de codage60 minutes
Exemple de codage60 minutes
Exercice de codage60 minutes

Bienvenue au module 5 de Math 569 : Apprentissage statistique, consacré aux techniques avancées de modélisation des données non linéaires. Dans la leçon 1, nous nous penchons sur les lisseurs à noyau, en explorant la façon dont ils font des prédictions basées sur des données locales et leur comparaison avec les modèles kNN (plus proches voisins). La leçon 2 se concentre sur la régression locale, en particulier la régression linéaire locale (LLR) et la régression polynomiale locale (LPR). Nous examinerons comment la LLR surmonte certaines limitations du lissage du noyau et comment la LPR offre une flexibilité dans la capture de la structure des données locales. Le module met l'accent sur l'adaptabilité de ces techniques aux relations de données complexes et aborde les défis liés à la sélection des hyperparamètres et aux exigences de calcul, en particulier pour les grands ensembles de données.

Inclus

3 vidéos4 lectures3 devoirs4 laboratoires non notés

3 vidéosTotal 14 minutes

Module 5 Introduction1 minute
Lisseurs à noyau et kNN7 minutes
Régression locale7 minutes

4 lecturesTotal 140 minutes

Module 5 Introduction Lecture10 minutes
Lectures des lisseurs de noyaux60 minutes
Lecture de la régression locale60 minutes
Résumé du module 510 minutes

3 devoirsTotal 80 minutes

Quiz sur les lisseurs de noyaux10 minutes
Quiz sur la régression locale10 minutes
Module 5 Évaluation sommative60 minutes

4 laboratoires non notésTotal 240 minutes

Exemple de codage60 minutes
Exercice de codage60 minutes
Exemple de codage60 minutes
Exercice de codage60 minutes

Le module 6 de Math 569 : Apprentissage statistique se penche sur l'évaluation de modèles et la sélection de modèles via le choix d'hyperparamètres. Il commence par une compréhension de la décomposition biais-variance, en soulignant le compromis entre la simplicité et la précision du modèle. Le module explore ensuite la complexité des modèles et propose des stratégies pour équilibrer cette complexité avec la performance prédictive. En s'appuyant sur l'importance de l'équilibre entre la complexité et la performance des modèles, nous abordons ensuite les mesures de sélection des modèles, à savoir : AIC, BIC et MDL. Il s'agit de mesures fondées sur la théorie de l'information qui permettent d'équilibrer l'erreur avec la complexité du modèle, comme le nombre de paramètres. Enfin, le module se termine par des leçons sur l'estimation de l'erreur de test sans ensemble de test, en utilisant des concepts tels que VC Dimension, la validation croisée et le Bootstrap. Ce module est essentiel pour maîtriser l'évaluation et la sélection des modèles en apprentissage statistique.

Inclus

8 vidéos7 lectures6 devoirs9 laboratoires non notés

8 vidéosTotal 54 minutes

Module 6 Introduction2 minutes
Biais, variance et complexité du modèle10 minutes
La décomposition biais-variance9 minutes
AIC et BIC4 minutes
Longueur minimale de description (MDL)7 minutes
Dimension de Vapnik-Chervonenkis (VC)6 minutes
Validation croisée K-fold8 minutes
Bootstrapping9 minutes

7 lecturesTotal 700 minutes

Module 6 Introduction Lectures15 minutes
Biais, variance et complexité des modèles Lectures75 minutes
Approche bayésienne et BIC Lectures360 minutes
Lecture de la dimension Vapnik-Chervonenkis (VC)60 minutes
Lectures de validation croisée120 minutes
Lectures sur le Bootstrap60 minutes
Résumé du module 610 minutes

6 devoirsTotal 340 minutes

Biais, variance et complexité du modèle10 minutes
Quiz sur l'approche bayésienne et le BIC10 minutes
Quiz sur la dimension Vapnik-Chervonenkis (VC)10 minutes
Quiz sur la validation croisée180 minutes
Quiz sur le Bootstrap10 minutes
Module 6 Évaluation sommative120 minutes

9 laboratoires non notésTotal 540 minutes

Exemple de codage60 minutes
Exemple de codage60 minutes
Exercice de codage60 minutes
Exemple de codage60 minutes
Exercice de codage60 minutes
Exemple de codage60 minutes
Exercice de codage60 minutes
Exemple de codage60 minutes
Exercice de codage60 minutes

Le module 7 de Math 569 : Statistiques déductives introduit des techniques déductives avancées. La leçon 1 se concentre sur l'inférence du maximum de vraisemblance, expliquant comment trouver les paramètres optimaux du modèle en maximisant la fonction de vraisemblance. Cette méthode est essentielle pour estimer les paramètres pour lesquels un ensemble de données est le plus probable. La leçon 2 se penche sur l'inférence bayésienne, en l'opposant aux approches fréquentistes. Elle aborde le théorème de Bayes, qui intègre les croyances antérieures aux nouvelles données afin de mettre à jour les croyances de manière dynamique. Le module aborde en détail le processus de modélisation bayésienne, y compris la construction et la mise à jour de modèles utilisant des distributions a priori et a posteriori. Ce module est essentiel pour comprendre les méthodes d'inférence complexes dans l'apprentissage statistique.

Inclus

4 vidéos4 lectures4 devoirs2 laboratoires non notés

4 vidéosTotal 23 minutes

Module 7 Introduction1 minute
Inférence du maximum de vraisemblance - Partie 16 minutes
Inférence du maximum de vraisemblance - Partie 27 minutes
Inférence bayésienne9 minutes

4 lecturesTotal 120 minutes

Module 7 Introduction Lecture5 minutes
Inférence du maximum de vraisemblance Lecture45 minutes
Lectures sur l'inférence bayésienne60 minutes
Résumé du module 710 minutes

4 devoirsTotal 260 minutes

Quiz sur l'inférence du maximum de vraisemblance - Partie 110 minutes
Quiz sur l'inférence du maximum de vraisemblance - Partie 260 minutes
Quiz sur l'inférence bayésienne10 minutes
Module 7 Évaluation sommative180 minutes

2 laboratoires non notésTotal 120 minutes

Exemple de codage60 minutes
Exercice de codage60 minutes

Le module 8 de Math 569 : Apprentissage statistique couvre diverses techniques avancées d'apprentissage automatique. Il commence par les Arbres décisionnels, en se concentrant sur leur structure et leur application dans les tâches de classification et de régression. Ensuite, il explore les machines à vecteurs de support (SVM), en détaillant leur fonction dans la création de limites de décision optimales. Le module examine ensuite le K-moyennes Clustering, une méthode d'apprentissage non supervisée pour le regroupement des données. Enfin, il se termine par les Réseaux de neurones, dont il examine l'architecture et le rôle dans la reconnaissance de formes complexes. Chaque leçon propose une plongée en profondeur dans ces techniques, mettant en évidence leurs avantages uniques et leurs applications dans l'apprentissage statistique.

Inclus

6 vidéos5 lectures5 devoirs8 laboratoires non notés

6 vidéosTotal 46 minutes

Module 8 Introduction2 minutes
Modèles d'arbres - Partie 17 minutes
Modèles d'arbres - Partie 27 minutes
Machines à vecteurs de support10 minutes
Regroupement par K-means6 minutes
Réseaux de neurones15 minutes

5 lecturesTotal 610 minutes

Modèles additifs et arbres Lectures120 minutes
Machine à vecteurs de support (SVM) Lectures120 minutes
lectures sur le regroupement K-moyennes60 minutes
Lectures sur les réseaux de neurones300 minutes
Résumé du module 810 minutes

5 devoirsTotal 100 minutes

Modèles additifs et arbres Quiz10 minutes
Quiz sur les machines à vecteurs de support10 minutes
quiz sur le regroupement K-moyennes10 minutes
Quiz sur les réseaux neuronaux10 minutes
Module 8 Évaluation sommative60 minutes

8 laboratoires non notésTotal 480 minutes

Exemple de codage60 minutes
Exercice de codage60 minutes
Exemple de codage60 minutes
Exercice de codage60 minutes
Exemple de codage60 minutes
Exercice de codage60 minutes
Exemple de codage60 minutes
Exercice de codage60 minutes

Ce module contient l'évaluation sommative du cours qui a été conçue pour évaluer votre compréhension du matériel du cours et votre capacité à appliquer les connaissances que vous avez acquises tout au long du cours. Veillez à bien réviser le matériel de cours avant de passer l'évaluation.

Inclus

1 devoir

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Préparer un diplôme

Ce site cours fait partie du (des) programme(s) diplômant(s) suivant(s) proposé(s) par Illinois Tech. Si vous êtes admis et que vous vous inscrivez, les cours que vous avez suivis peuvent compter pour l'apprentissage de votre diplôme et vos progrès peuvent être transférés avec vous.¹

Instructeur

Évaluations de l’enseignant

(7 évaluations)

Shahrzad (Sara) Jamshidi

Illinois Tech

2 Cours2 584 apprenants

Offert par

Illinois Tech

En savoir plus sur Probabilités et statistiques

Northeastern University
Statistical Learning for Engineering Part 1
Cours
Edureka
Python and Statistics Foundations
Cours
Packt
NumPy, Matplotlib & Pandas – Data Science Prerequisites
Cours
Northeastern University
Statistical Learning for Engineering Part 2
Cours

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.

Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.

Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.

Plus de questions

Visitez le Centre d'Aide pour les Étudiants

Aide financière disponible,