Ce cours vous donne une introduction complète à la fois à la théorie et à la pratique de l'apprentissage automatique. Vous apprendrez à utiliser Python ainsi que des bibliothèques et des outils standard, notamment Pandas, Scikit-learn et Tensorflow, pour ingérer, explorer et préparer des données pour la modélisation, puis former et évaluer des modèles en utilisant une grande variété de techniques. Ces techniques incluent la régression linéaire avec les moindres carrés ordinaires, la régression logistique, les machines à vecteurs de support, les arbres et ensembles de décision, le clustering, l'analyse en composantes principales, les modèles de Markov cachés et l'apprentissage profond. Une caractéristique clé de ce cours est que vous n'apprenez pas seulement à appliquer ces techniques, vous apprenez également la base conceptuelle qui les sous-tend afin de comprendre comment elles fonctionnent, pourquoi vous faites ce que vous faites et ce que signifient vos résultats. Le cours présente également des ensembles de données du monde réel, provenant principalement du domaine des politiques publiques. Il est basé sur un cours d'introduction à l'apprentissage automatique proposé aux étudiants diplômés de l'Université de Chicago et servira de base solide pour des études plus approfondies et plus spécialisées.
Dans ce module, vous serez initié au pipeline d'apprentissage automatique et apprendrez le travail initial sur vos données que vous devez faire avant la modélisation. Vous apprendrez à ingérer des données à l'aide de Pandas, une bibliothèque Python standard pour l'exploration et la préparation des données. Ensuite, nous aborderons la première approche de la modélisation que nous explorerons dans ce cours, la régression linéaire avec les moindres carrés ordinaires.
Inclus
6 vidéos2 devoirs3 laboratoires non notés
Afficher les informations sur le contenu du module
6 vidéos•Total 50 minutes
Introduction au cours•6 minutes
Le pipeline de la science des données•16 minutes
Ingestion et exploration de données•4 minutes
Visite du laboratoire : Exploration de données avec Pandas•11 minutes
Apprentissage supervisé, modèles linéaires et moindres carrés•11 minutes
Visite guidée du laboratoire : Régression linéaire•3 minutes
2 devoirs•Total 60 minutes
Travailler avec des données•30 minutes
Introduction à la régression linéaire•30 minutes
3 laboratoires non notés•Total 180 minutes
Notions de base sur les données : Numpy et Pandas•60 minutes
Exploration de données avec Pandas•60 minutes
Régression linéaire•60 minutes
Estimation des moindres carrés et du maximum de vraisemblance
Module 2•5 heures à terminer
Détails du module
Dans ce module, vous poursuivrez le travail que nous avons commencé dans le dernier module avec les régressions linéaires. Vous en apprendrez davantage sur la manière d'évaluer ces modèles et de sélectionner les caractéristiques importantes et d'exclure celles qui ne sont pas statistiquement significatives. Vous découvrirez également l'estimation du maximum de vraisemblance, une approche probabiliste de l'estimation de vos modèles.
Inclus
4 vidéos2 devoirs1 devoir de programmation2 laboratoires non notés
Afficher les informations sur le contenu du module
4 vidéos•Total 17 minutes
Régression linéaire et moindres carrés•5 minutes
Visite de laboratoire : Régression linéaire sur l'ensemble de données du cancer de la prostate•4 minutes
Estimation du maximum de vraisemblance•5 minutes
Visite du laboratoire : Régression linéaire et estimation du maximum de vraisemblance•2 minutes
2 devoirs•Total 60 minutes
Régression linéaire•30 minutes
Estimation du maximum de vraisemblance•30 minutes
1 devoir de programmation•Total 120 minutes
Quiz noté : Manipulation des données et régressions linéaires•120 minutes
2 laboratoires non notés•Total 120 minutes
Régression linéaire sur l'ensemble des données relatives au cancer de la prostate•60 minutes
Régression linéaire et estimation du maximum de vraisemblance•60 minutes
Fonctions de base et régularisation
Module 3•3 heures à terminer
Détails du module
Ce module vous présente les fonctions de base et les expansions polynomiales en particulier, ce qui vous permettra d'utiliser les mêmes techniques de régression linéaire que nous avons étudiées jusqu'à présent pour modéliser des relations non linéaires. Ensuite, nous découvrons le compromis biais-variance, une relation clé dans l'apprentissage automatique. Des méthodes telles que l'expansion polynomiale peuvent vous aider à former des modèles qui capturent assez bien la relation dans vos données d'apprentissage, mais ces mêmes modèles peuvent donner de mauvais résultats sur de nouvelles données. Vous découvrirez différentes méthodes de régularisation qui permettent d'équilibrer ce compromis et de créer des modèles qui évitent l'ajustement excessif.
Inclus
4 vidéos2 devoirs2 laboratoires non notés
Afficher les informations sur le contenu du module
4 vidéos•Total 25 minutes
Fonctions de base•6 minutes
Visite du laboratoire : Caractéristiques et fonctions de base•4 minutes
Régularisation et compromis biais-variance•11 minutes
Visite guidée du laboratoire : Régression linéaire : Régularisation•5 minutes
2 devoirs•Total 60 minutes
Expansion polynomiale des caractéristiques•30 minutes
Régularisation•30 minutes
2 laboratoires non notés•Total 120 minutes
Caractéristiques et fonctions de base•60 minutes
Régression linéaire : Régularisation•60 minutes
Sélection de modèles et régression logistique
Module 4•3 heures à terminer
Détails du module
Dans ce module, vous en apprendrez d'abord davantage sur l'évaluation et le réglage de vos modèles. Nous examinons les techniques de validation croisée qui vous aideront à obtenir des mesures plus précises des performances de votre modèle, puis vous verrez comment les utiliser avec les pipelines et GridSearch pour ajuster vos modèles. Enfin, nous examinerons la théorie et la pratique de notre première technique de classification, la régression logistique.
Inclus
4 vidéos2 devoirs2 laboratoires non notés
Afficher les informations sur le contenu du module
4 vidéos•Total 24 minutes
Sélection des modèles et validation croisée•7 minutes
Visite du laboratoire : Sélection de modèles et pipelines•6 minutes
Régression logistique•7 minutes
Guide de laboratoire : Régression logistique•3 minutes
2 devoirs•Total 60 minutes
Mise au point et sélection des modèles•30 minutes
Régression logistique•30 minutes
2 laboratoires non notés•Total 120 minutes
Sélection de modèles et pipelines•60 minutes
Régression logistique•60 minutes
Plus de classificateurs : SVM et Naive Bayes
Module 5•5 heures à terminer
Détails du module
Dans ce module, vous découvrirez deux autres techniques de classification : tout d'abord, les machines à vecteurs de support (SVM) et ensuite Naive Bayes, une approche rapide et très interprétable qui utilise le théorème de Bayes.
Inclus
4 vidéos3 devoirs3 laboratoires non notés
Afficher les informations sur le contenu du module
4 vidéos•Total 24 minutes
Machines à vecteurs de support•9 minutes
Visite du laboratoire : Machines à vecteurs de support•3 minutes
Classification Naive Bayes•8 minutes
Exemple de classification Naive Bayes•4 minutes
3 devoirs•Total 150 minutes
Classification avec les SVM•30 minutes
Classificateurs Naive Bayes•30 minutes
Quiz noté : Évaluation du modèle•90 minutes
3 laboratoires non notés•Total 120 minutes
SVM•60 minutes
Exemple de classification Naive Bayes•60 minutes
Code de départ pour le Quiz•0 minutes
Modèles arborescents, méthodes d'ensemble et évaluation
Module 6•6 heures à terminer
Détails du module
Dans ce module, vous découvrirez tout d'abord la classification à l'aide d'arbres de décision. Nous verrons comment créer des modèles qui utilisent des arbres de décision individuels, puis des modèles d'ensemble, qui utilisent de nombreux arbres, tels que le bagging, le boosting et les forêts aléatoires. Ensuite, nous verrons comment évaluer les performances des classificateurs.
Inclus
5 vidéos3 devoirs3 laboratoires non notés
Afficher les informations sur le contenu du module
5 vidéos•Total 31 minutes
Modèles arborescents•8 minutes
Ensembles, bagging et boosting•7 minutes
Visite du laboratoire : Arbres et forêts•4 minutes
Mesures d'évaluation•8 minutes
Visite du laboratoire : Évaluation•3 minutes
3 devoirs•Total 180 minutes
Arbres et ensembles•30 minutes
Évaluation des modèles•30 minutes
Quiz sur les arbres et les forêts•120 minutes
3 laboratoires non notés•Total 120 minutes
Arbres et forêts•60 minutes
Évaluation•60 minutes
Code de départ pour le Quiz•0 minutes
Méthodes de regroupement
Module 7•3 heures à terminer
Détails du module
Jusqu'à présent, nous nous sommes concentrés sur l'apprentissage supervisé et la formation de modèles qui estiment une variable cible que vous avez spécifiée. Dans ce module, nous jetons un premier coup d'œil à l'apprentissage non supervisé, un domaine de l'apprentissage automatique qui utilise des techniques pour trouver des modèles et des relations dans les données sans que vous n'ayez jamais défini de cible. En particulier, nous examinons une variété de techniques de regroupement, en commençant par les k-moyennes et le regroupement hiérarchique, puis le regroupement basé sur la distribution et la densité.
Inclus
4 vidéos2 devoirs2 laboratoires non notés
Afficher les informations sur le contenu du module
4 vidéos•Total 27 minutes
Apprentissage non supervisé (K-Means, hiérarchique)•12 minutes
Visite du laboratoire : Regroupement•2 minutes
Regroupement (KDE, Meanshift, DBSCAN)•11 minutes
Visite du laboratoire : Regroupement basé sur la densité et la distribution•2 minutes
2 devoirs•Total 60 minutes
K-Means et regroupement hiérarchique•30 minutes
Regroupement II•30 minutes
2 laboratoires non notés•Total 120 minutes
Clustering•60 minutes
Regroupement basé sur la densité et la distribution•60 minutes
Réduction de la dimensionnalité et modèles temporels
Module 8•3 heures à terminer
Détails du module
Vous étudierez deux nouvelles techniques dans ce module. La première est l'analyse en composantes principales, une technique puissante de réduction de la dimensionnalité que vous pouvez utiliser pour projeter des caractéristiques de haute dimension dans des espaces de dimension inférieure. Cette technique peut être utilisée à diverses fins, notamment pour la sélection des caractéristiques, la prévention de l'ajustement excessif, la visualisation dans des espaces bidimensionnels ou tridimensionnels de données de plus grande dimension, etc. Ensuite, vous étudierez les modèles de Markov cachés, une technique que vous pouvez utiliser pour modéliser des séquences d'états, où chaque état dépend de celui qui le précède.
Inclus
4 vidéos2 devoirs2 laboratoires non notés
Afficher les informations sur le contenu du module
4 vidéos•Total 27 minutes
Analyse en composantes principales (ACP)•7 minutes
Visite du laboratoire : Analyse en composantes principales•5 minutes
Modèles temporels et modèles de Markov cachés•14 minutes
Lab Walkthrough : Modèles de Markov cachés•2 minutes
2 devoirs•Total 60 minutes
Analyse en composantes principales (ACP)•30 minutes
HMMs•30 minutes
2 laboratoires non notés•Total 120 minutes
Analyse en composantes principales (ACP)•60 minutes
Modèles de Markov cachés sur les trajets à vélo de Divvy•60 minutes
Apprentissage profond
Module 9•3 heures à terminer
Détails du module
Ce module vous présente l'un des sujets les plus en vogue dans le domaine de l'apprentissage automatique, l'apprentissage profond avec les réseaux neuronaux feed-forward et les réseaux neuronaux convolutifs. Vous apprendrez comment ces techniques fonctionnent et où elles peuvent être très efficaces - ou très inefficaces. Nous étudierons comment concevoir, mettre en œuvre et évaluer de tels modèles à l'aide de Python et de Keras.
Inclus
4 vidéos2 devoirs2 laboratoires non notés
Afficher les informations sur le contenu du module
4 vidéos•Total 25 minutes
Réseaux neuronaux ascendants•11 minutes
Visite du laboratoire : Réseaux neuronaux à avance directe•3 minutes
Réseaux neuronaux convolutifs•9 minutes
Visite du laboratoire : Réseaux neuronaux convolutifs•2 minutes
2 devoirs•Total 60 minutes
Réseaux neuronaux•30 minutes
Réseaux neuronaux convolutionnels•30 minutes
2 laboratoires non notés•Total 120 minutes
Réseaux neuronaux de type feed-forward•60 minutes
Réseaux neuronaux convolutionnels•60 minutes
Instructeur
Évaluations de l’enseignant
Évaluations de l’enseignant
Nous avons demandé à tous les étudiants de fournir des commentaires sur nos enseignants au sujet de la qualité de leur pédagogie.
L'Université de Chicago, l'un des plus grands établissements d'enseignement et de recherche au monde, est à l'origine de nouveaux modes de pensée depuis sa fondation en 1890. Aujourd'hui, l'UChicago est une destination intellectuelle qui attire des chercheurs inspirés sur son campus de Hyde Park et ses campus internationaux, ce qui lui permet de rester au cœur des idées qui défient et changent le monde.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Que recevrai-je si j'achète le certificat ?
Lorsque vous achetez un certificat, vous avez accès à tous les supports de cours, y compris les devoirs notés. Une fois le cours terminé, votre certificat électronique sera ajouté à votre page de réalisations. Vous pourrez alors l'imprimer ou l'ajouter à votre profil LinkedIn.
Une aide financière est-elle disponible ?
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.