Acquérir des compétences de haut niveau avec Coursera Plus pour 199 $ (régulièrement 399 $). Économisez maintenant.

Illinois Tech

Apprentissage statistique

1 712 déjà inscrits

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

3 mois à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Préparer un diplôme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

3 mois à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Préparer un diplôme

Compétences que vous acquerrez

  • Catégorie : Modélisation statistique
  • Catégorie : Arbre de décision
  • Catégorie : Algorithmes de classification
  • Catégorie : Régression logistique
  • Catégorie : Analyse des Données
  • Catégorie : Évaluation de modèles
  • Catégorie : Ingénierie des caractéristiques
  • Catégorie : Analyse de régression
  • Catégorie : Modélisation prédictive
  • Catégorie : Inférence statistique
  • Catégorie : Analyse statistique
  • Catégorie : Apprentissage non supervisé
  • Catégorie : Apprentissage supervisé
  • Catégorie : Apprentissage statistique des machines
  • Catégorie : Apprentissage automatique
  • Catégorie : Statistiques bayésiennes
  • Catégorie : Programmation Statistique

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

36 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Introduction aux techniques de la Science des données
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 9 modules dans ce cours

Bienvenue à l'apprentissage statistique ! Dans ce cours, nous couvrirons les sujets suivants : Apprentissage statistique : Terminologie et idées, méthodes de régression linéaire, méthodes de classification linéaire, méthodes d'expansion de base, méthodes de lissage à noyau, évaluation et sélection de modèles, inférence du maximum de vraisemblance et sujets avancés. Le module 1 propose une exploration approfondie de l'apprentissage statistique, en commençant par le raisonnement qui sous-tend le choix d'une famille prédéfinie de fonctions et l'optimisation de l'erreur de prédiction attendue (EPE). Il couvre les éléments essentiels de l'apprentissage statistique, y compris la fonction de perte, le compromis biais-variance dans la sélection des modèles et l'importance de l'évaluation des modèles. Ce module fait également la distinction entre l'apprentissage supervisé et non supervisé, discute des différents types de modèles d'apprentissage statistique et de représentation des données, et approfondit les trois éléments centraux d'un problème d'apprentissage statistique, fournissant ainsi une introduction complète à ce domaine.

Inclus

8 vidéos5 lectures4 devoirs1 sujet de discussion1 laboratoire non noté

Bienvenue au module 2 de Math 569 : Apprentissage statistique. Nous explorons ici ce qui est sans doute le modèle fondamental du domaine : la régression linéaire. Ce modèle simple mais très utile nous aide à mieux comprendre le problème de l'apprentissage statistique abordé dans le module 1. Dans la leçon 1, nous examinerons attentivement ce que la régression linéaire vise à faire, comment nous construisons les paramètres du modèle avec un ensemble de données donné, et quels types de tests statistiques nous pouvons effectuer sur nos coefficients estimés. Dans la leçon 2, nous aborderons une méthode connue sous le nom de sélection de sous-ensembles, qui vise à améliorer la régression linéaire en éliminant les variables indépendantes qui n'ont pas d'impact. Dans la leçon 3, nous étudierons l'introduction d'un biais dans le modèle de régression linéaire à l'aide de deux méthodes de régularisation : Ridge Regression et LASSO. Ces méthodes utilisent un hyperparamètre, un concept clé de ce cours, pour limiter la croissance des coefficients. C'est la source du biais et cela nous aidera à comprendre pourquoi un estimateur biaisé peut surpasser notre estimateur sans biais pour les coefficients de la régression linéaire de la leçon 1. Enfin, la leçon 4 introduit le concept de transformation de données, qui permet de traiter les complexités d'un ensemble de données. Elle fournit également un moyen simple de convertir un modèle linéaire en un modèle non linéaire.

Inclus

10 vidéos6 lectures5 devoirs6 laboratoires non notés

Bienvenue au module 3 de Math 569 : Apprentissage statistique, où nous nous penchons sur la classification linéaire. Dans la leçon 1, nous avons exploré comment la régression linéaire, généralement utilisée pour prédire des résultats continus, peut être adaptée aux tâches de classification, c'est-à-dire à la prédiction de catégories discrètes. Nous aborderons la conversion des données catégoriques en un format numérique adapté à la classification et présenterons des mesures de classification essentielles telles que l'exactitude, la précision et le rappel. Dans la leçon 2, nous explorerons l'analyse discriminante linéaire (LDA) en tant que méthode alternative pour construire des classifications linéaires. Cette méthode introduit la notion selon laquelle la classification maximise la probabilité d'une catégorie étant donné un point de données, un cadre sur lequel nous reviendrons plus tard dans le cours. La maximisation de la probabilité de classification, compte tenu de certaines hypothèses simplificatrices, conduit à un modèle linéaire qui peut également réduire la dimensionnalité du problème. Enfin, dans la leçon 3, nous aborderons la régression logistique, qui est construite en supposant que les log-vraisemblances sont des modèles linéaires. Le résultat, similaire à la LDA, produit une limite de décision linéaire.

Inclus

5 vidéos6 lectures4 devoirs6 laboratoires non notés

Bienvenue au module 4 de Math 569 : Apprentissage statistique, qui se concentre sur les méthodes avancées de modélisation statistique. Ce module commence par une introduction aux méthodes d'expansion de base, explorant comment ces techniques améliorent les modèles linéaires en incorporant des relations non linéaires. Nous nous penchons ensuite sur les polynômes par morceaux, en discutant de leur utilité pour capturer les tendances variables à travers différents segments de données. Dans la leçon 2, nous explorons les splines de lissage, en soulignant leur rôle dans l'équilibre efficace entre l'ajustement et la complexité du modèle. Enfin, la leçon 3 traite de la régularisation et des fonctions noyaux, en expliquant comment ces concepts contribuent à la construction de modèles plus complexes sans augmenter de manière significative la complexité algorithmique.

Inclus

5 vidéos5 lectures4 devoirs6 laboratoires non notés

Bienvenue au module 5 de Math 569 : Apprentissage statistique, consacré aux techniques avancées de modélisation des données non linéaires. Dans la leçon 1, nous nous penchons sur les lisseurs à noyau, en explorant la façon dont ils font des prédictions basées sur des données locales et leur comparaison avec les modèles kNN (plus proches voisins). La leçon 2 se concentre sur la régression locale, en particulier la régression linéaire locale (LLR) et la régression polynomiale locale (LPR). Nous examinerons comment la LLR surmonte certaines limitations du lissage du noyau et comment la LPR offre une flexibilité dans la capture de la structure des données locales. Le module met l'accent sur l'adaptabilité de ces techniques aux relations de données complexes et aborde les défis liés à la sélection des hyperparamètres et aux exigences de calcul, en particulier pour les grands ensembles de données.

Inclus

3 vidéos4 lectures3 devoirs4 laboratoires non notés

Le module 6 de Math 569 : Apprentissage statistique se penche sur l'évaluation de modèles et la sélection de modèles via le choix d'hyperparamètres. Il commence par une compréhension de la décomposition biais-variance, en soulignant le compromis entre la simplicité et la précision du modèle. Le module explore ensuite la complexité des modèles et propose des stratégies pour équilibrer cette complexité avec la performance prédictive. En s'appuyant sur l'importance de l'équilibre entre la complexité et la performance des modèles, nous abordons ensuite les mesures de sélection des modèles, à savoir : AIC, BIC et MDL. Il s'agit de mesures fondées sur la théorie de l'information qui permettent d'équilibrer l'erreur avec la complexité du modèle, comme le nombre de paramètres. Enfin, le module se termine par des leçons sur l'estimation de l'erreur de test sans ensemble de test, en utilisant des concepts tels que VC Dimension, la validation croisée et le Bootstrap. Ce module est essentiel pour maîtriser l'évaluation et la sélection des modèles en apprentissage statistique.

Inclus

8 vidéos7 lectures6 devoirs9 laboratoires non notés

Le module 7 de Math 569 : Statistiques déductives introduit des techniques déductives avancées. La leçon 1 se concentre sur l'inférence du maximum de vraisemblance, expliquant comment trouver les paramètres optimaux du modèle en maximisant la fonction de vraisemblance. Cette méthode est essentielle pour estimer les paramètres pour lesquels un ensemble de données est le plus probable. La leçon 2 se penche sur l'inférence bayésienne, en l'opposant aux approches fréquentistes. Elle aborde le théorème de Bayes, qui intègre les croyances antérieures aux nouvelles données afin de mettre à jour les croyances de manière dynamique. Le module aborde en détail le processus de modélisation bayésienne, y compris la construction et la mise à jour de modèles utilisant des distributions a priori et a posteriori. Ce module est essentiel pour comprendre les méthodes d'inférence complexes dans l'apprentissage statistique.

Inclus

4 vidéos4 lectures4 devoirs2 laboratoires non notés

Le module 8 de Math 569 : Apprentissage statistique couvre diverses techniques avancées d'apprentissage automatique. Il commence par les Arbres décisionnels, en se concentrant sur leur structure et leur application dans les tâches de classification et de régression. Ensuite, il explore les machines à vecteurs de support (SVM), en détaillant leur fonction dans la création de limites de décision optimales. Le module examine ensuite le K-moyennes Clustering, une méthode d'apprentissage non supervisée pour le regroupement des données. Enfin, il se termine par les Réseaux de neurones, dont il examine l'architecture et le rôle dans la reconnaissance de formes complexes. Chaque leçon propose une plongée en profondeur dans ces techniques, mettant en évidence leurs avantages uniques et leurs applications dans l'apprentissage statistique.

Inclus

6 vidéos5 lectures5 devoirs8 laboratoires non notés

Ce module contient l'évaluation sommative du cours qui a été conçue pour évaluer votre compréhension du matériel du cours et votre capacité à appliquer les connaissances que vous avez acquises tout au long du cours. Veillez à bien réviser le matériel de cours avant de passer l'évaluation.

Inclus

1 devoir

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Préparer un diplôme

Ce site cours fait partie du (des) programme(s) diplômant(s) suivant(s) proposé(s) par Illinois Tech. Si vous êtes admis et que vous vous inscrivez, les cours que vous avez suivis peuvent compter pour l'apprentissage de votre diplôme et vos progrès peuvent être transférés avec vous.¹

 

Instructeur

Évaluations de l’enseignant
3.6 (7 évaluations)
Shahrzad (Sara) Jamshidi
Illinois Tech
2 Cours2 295 apprenants

Offert par

Illinois Tech

En savoir plus sur Probabilités et Statistiques

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions