Apprentissage automatique avec Petites données Partie 1

Apprentissage automatique avec Petites données Partie 1

Instructeur : Sarah Ostadabbas

Inclus avec En savoir plus

Demander à Coursera

7 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

1 semaine à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

7 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

1 semaine à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

Compétences que vous acquerrez

Catégorie : Apprentissage automatique appliqué
Catégorie : Apprentissage par transfert
Catégorie : Apprentissage supervisé
Catégorie : Apprentissage profond
Catégorie : Méthodes d'apprentissage automatique
Catégorie : Mise au point
Catégorie : Modèle de formation
Catégorie : Apprentissage automatique
Catégorie : Apprentissage non supervisé
Catégorie : Petites données
Catégorie : Synthèse des données

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

8 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Il y a 7 modules dans ce cours

Ce cours aborde le défi de l'Apprentissage Automatique (AAM) dans le contexte de Petites données, un problème important dû aux demandes croissantes de données de l'AAM. Malgré le succès de l'apprentissage automatique dans divers domaines, de nombreux secteurs ne peuvent pas fournir de grands ensembles de données étiquetées en raison des coûts, de la protection de la vie privée ou des lois sur la sécurité. Le serveur d'authentification Big data devenant la norme, l'apprentissage efficace à partir d'ensembles de données plus petits est crucial. Ce cours, idéal pour les étudiants diplômés ayant une certaine expérience en ML, se concentre sur les techniques modernes d'apprentissage profond pour les applications de petites données pertinentes dans les soins de santé, l'armée et divers secteurs industriels. Les prérequis incluent la familiarité avec le ML et la maîtrise de Python. L'expérience de l'apprentissage profond n'est pas nécessaire mais bénéfique.

Dans ce module, nous allons explorer le rôle central des données comme fondement des algorithmes d'apprentissage automatique. Nous commencerons par discuter de l'importance des grands ensembles de données dans la formation des modèles d'apprentissage profond, car ces ensembles de données sont cruciaux pour l'application réussie et l'efficacité des modèles. Nous nous plongerons également dans les défis associés aux petits ensembles de données, en particulier dans les domaines sensibles tels que la santé et la défense, où l'acquisition de données est souvent difficile, coûteuse ou soumise à des réglementations strictes en matière de confidentialité et de sécurité. Pour relever ces défis, le cours présentera diverses stratégies pour tirer le meilleur parti des données limitées, y compris des techniques d'apprentissage automatique économes en données et l'utilisation de l'augmentation des données synthétiques. En outre, nous présenterons la structure du cours et discuterons d'une sélection curatée de documents de recherche qui s'alignent sur nos sujets de cours et les enrichissent.

Inclus

2 vidéos13 lectures1 devoir

2 vidéosTotal 16 minutes

Les données comptent8 minutes
Configuration de l'environnement local8 minutes

13 lecturesTotal 81 minutes

Aperçu du cours1 minute
Syllabus - Apprentissage automatique pour les Petites données10 minutes
Intégrité académique1 minute
Les données sont importantes, en particulier pour le Deep learning2 minutes
Modélisation des données, des paramètres et de la puissance dans le modèle IA5 minutes
Croissance exponentielle des données d'entraînement10 minutes
Croissance exponentielle de la complexité des modèles5 minutes
Croissance exponentielle des ressources informatiques5 minutes
Le paradoxe de l'échelle : quand les petits modèles de ML surpassent les géants5 minutes
De grands ensembles de données pour le Deep learning10 minutes
Qu'est-ce que les Petites données ?2 minutes
Installation de PyTorch5 minutes
Grands et petits ensembles de données dans l'Apprentissage automatique20 minutes

1 devoirTotal 10 minutes

Quiz du module 110 minutes

Dans ce module, nous allons plonger dans les aspects fondamentaux de l'apprentissage automatique en mettant l'accent sur l'importance des données, en particulier dans les applications d'apprentissage profond. Nous commencerons par souligner à quel point les grands ensembles de données sont essentiels pour former efficacement les modèles d'apprentissage profond, car ils permettent aux modèles de capturer et d'apprendre à partir de modèles complexes, améliorant ainsi leurs performances globales. En outre, nous explorerons l'intersection de la disponibilité des données, de la puissance de calcul et de la capacité des modèles, en soulignant comment ces éléments interagissent pour affiner la précision et l'efficacité des modèles. En outre, le module couvrira les avancées informatiques au-delà de la loi de Moore et leur impact sur l'apprentissage automatique, en illustrant comment le matériel moderne comme les CPU, les GPU et les TPU améliorent les capacités de calcul essentielles à l'entraînement de modèles sophistiqués. Nous approfondirons également les lois de mise à l'échelle dans le Deep learning, en discutant des résultats empiriques qui montrent comment les performances des modèles s'améliorent de manière prévisible avec l'augmentation de la taille des ensembles de données et de la complexité des modèles, bien qu'avec des rendements décroissants. Pour fournir une base théorique plus profonde, nous examinerons la théorie de Vapnik-Chervonenkis (VC), qui offre un aperçu de la façon dont les courbes d'apprentissage et la complexité du modèle sont liées à la capacité d'un modèle à généraliser à partir des données d'entraînement. Cette discussion s'étendra aux applications pratiques et aux limitations théoriques, aidant à cadrer les défis de l'apprentissage automatique en termes de suffisance des données, d'ajustement des modèles et d'équilibre entre le biais et la variance. À la fin de ce module, les étudiants auront une compréhension approfondie de l'interaction dynamique entre ces facteurs et de leurs implications pour la pratique et la recherche en apprentissage automatique.

Inclus

1 vidéo19 lectures2 devoirs1 élément d'application

1 vidéoTotal 9 minutes

Performance des modèles d'apprentissage automatique9 minutes

19 lecturesTotal 144 minutes

Ingrédients Relation10 minutes
Puissance de calcul : Croissance au-delà de la loi de Moore10 minutes
Lois d'échelle5 minutes
Courbes d'apprentissage15 minutes
Capacité de modélisation requise pour l'ajustement des données3 minutes
Performance du modèle et taille de l'ensemble de données2 minutes
Performance et capacité des modèles2 minutes
Compromis biais-variance15 minutes
Du point de vue de l'algèbre linéaire2 minutes
Problèmes sous-déterminés et modèles surparamétrés8 minutes
Réexamen de la variance des biais avec la double descente8 minutes
Comparaison des paradigmes d'apprentissage15 minutes
Un apprentissage automatique2 minutes
Comment caractériser la complexité des modèles ?1 minute
Dimension Vapnik-Chervonenkis (VC) - Éclatement10 minutes
Notions de dimension de la CV10 minutes
Exemples d'éclatement et de dimension VC10 minutes
La dimension VC dans les réseaux neurones15 minutes
Ressources1 minute

2 devoirsTotal 60 minutes

Quiz du module 230 minutes
Calcul de la dimension VC des modèles SVM30 minutes

1 élément d'applicationTotal 10 minutes

Exemples d'apprentissage automatique10 minutes

Dans ce module, nous allons explorer l'apprentissage par transfert et son rôle dans l'apprentissage automatique efficace en termes de données, où les modèles exploitent les connaissances des tâches précédentes pour améliorer les performances sur de nouvelles tâches connexes. Nous aborderons également les différents types d'Apprentissage par transfert, y compris les méthodes transductives, inductives et non supervisées, chacune répondant à des défis et des applications différents. Nous discuterons de certaines étapes pratiques pour la mise en œuvre de l'apprentissage par transfert, telles que la sélection et le réglage fin de modèles pré-entraînés, afin de réduire la dépendance à l'égard des grands ensembles de données. Nous examinerons également les simulations basées sur les données et la physique pour l'augmentation des données, en soulignant leur utilisation pour améliorer l'entraînement dans des conditions contraignantes. Enfin, nous passerons en revue les principaux articles sur les techniques d'apprentissage par transfert afin de remédier à la pénurie de données et d'améliorer les performances des modèles.

Inclus

1 vidéo15 lectures1 devoir

1 vidéoTotal 6 minutes

Apprentissage par transfert6 minutes

15 lecturesTotal 72 minutes

Apprentissage automatique efficace sur le plan des données10 minutes
Exploiter les modèles pré-entraînés pour un apprentissage automatique efficace2 minutes
Apprentissage par transfert à la vanille2 minutes
Types d'Apprentissage par transfert2 minutes
Algorithmes d'apprentissage par transfert transductif10 minutes
Algorithmes d'Apprentissage par transfert inductif10 minutes
Exemples transductifs I5 minutes
Exemples transductifs II5 minutes
Exemples transductifs III5 minutes
Exemples inductifs5 minutes
Apprentissage multitâche et Meta-Learning5 minutes
Augmentation des données synthétiques2 minutes
Simulation basée sur les données3 minutes
Simulation basée sur la physique2 minutes
Exemples de simulations basées sur la physique4 minutes

1 devoirTotal 15 minutes

Quiz du module 315 minutes

Dans ce module, vous explorerez le concept d'adaptation au domaine, un aspect clé de l'apprentissage par transfert transductif. L'adaptation au domaine vous aide à former des modèles performants dans un domaine cible, même si la distribution des données diffère de celle du domaine source. Vous découvrirez les défis liés au changement de domaine et à la rareté des données étiquetées, ainsi que leur impact sur les performances des modèles. Nous couvrirons les différents types d'adaptation de domaine, y compris les approches non supervisées, semi-supervisées et supervisées. Vous plongerez également dans des techniques telles que Deep Domain Confusion (DDC), qui intègre la perte de confusion de domaine dans les réseaux neurones pour créer des caractéristiques invariantes par rapport au domaine. En outre, vous découvrirez des méthodes avancées telles que les réseaux neurones orientés domaine (DANN), l'alignement des corrélations (CORAL) et les réseaux d'adaptation en profondeur (DAN) qui s'appuient sur la DDC pour améliorer l'adaptation au domaine en alignant les distributions de caractéristiques et en capturant les dépendances complexes à travers les couches du réseau.

Inclus

1 vidéo10 lectures1 devoir

1 vidéoTotal 6 minutes

Adaptation du domaine6 minutes

10 lecturesTotal 143 minutes

Adaptation du domaine : Contexte1 minute
Non supervisé, semi-supervisé et supervisé10 minutes
Confusion dans les domaines profonds8 minutes
Travaux connexes basés sur le DDC2 minutes
Architecture de confusion dans les domaines profonds10 minutes
Mise en œuvre et architecture10 minutes
Formulation mathématique5 minutes
Un exemple d'ensemble de données : Office-312 minutes
Un exemple d'expérience DDC5 minutes
Apprentissage par transfert Activité pratique90 minutes

1 devoirTotal 10 minutes

Quiz du module 410 minutes

Dans ce module, nous allons explorer la supervision faible, une technique pour former des modèles d'apprentissage automatique avec des étiquettes limitées, bruyantes ou imprécises. Vous découvrirez les différents types de supervision faible et les raisons pour lesquelles ils sont essentiels dans les domaines de petites données. Nous couvrirons des techniques telles que l'apprentissage semi-supervisé, l'apprentissage auto-supervisé et l'apprentissage actif, ainsi que des méthodes avancées telles que l'ensembliste temporel et l'approche de l'enseignant moyen. En outre, vous découvrirez l'apprentissage profond bayésien et les stratégies d'apprentissage actif pour améliorer l'efficacité de la formation. Enfin, vous verrez des applications du monde réel dans des domaines tels que l'imagerie médicale, le NLP, la détection des fraudes, la conduite autonome et la biologie.

Inclus

1 vidéo8 lectures1 devoir

1 vidéoTotal 7 minutes

Qu'est-ce qu'une supervision insuffisante ?7 minutes

8 lecturesTotal 54 minutes

Types de supervision insuffisante6 minutes
Apprentissage supervisé10 minutes
Apprentissage supervisé15 minutes
Apprentissage actif6 minutes
Applications de la supervision faible2 minutes
Étude de cas : Imagerie médicale5 minutes
Étude de cas : Conduite autonome5 minutes
Étude de cas : Traitement du langage naturel (NLP)5 minutes

1 devoirTotal 30 minutes

Quiz du module 530 minutes

Dans ce module, vous découvrirez comment l'Apprentissage zéro coup (ZSL) permet aux modèles de reconnaître de nouvelles catégories sans avoir vu d'exemples de ces catégories au cours de la formation. Pour ce faire, on exploite les descriptions sémantiques intermédiaires, telles que les attributs, partagées entre les classes vues et non vues. Vous découvrirez également l'importance de la régularisation pour éviter le surajustement et améliorer la généralisation, ainsi que la façon dont les modèles génératifs tels que les GAN et les VAE améliorent le ZSL en synthétisant des données de classes inédites. En outre, nous examinerons l'Apprentissage zéro coup généralisé (GZSL), qui teste les modèles sur les classes vues et non vues, rendant la tâche plus difficile et plus réaliste. À la fin de ce module, vous aurez une solide compréhension de la façon dont ZSL et ses extensions peuvent être appliquées à diverses tâches d'apprentissage automatique.

Inclus

1 vidéo9 lectures1 devoir

1 vidéoTotal 5 minutes

Apprentissage zéro coup généralisé5 minutes

9 lecturesTotal 71 minutes

Introduction à l'Apprentissage zéro coup3 minutes
ZSL : Notation et résolution de problèmes3 minutes
Apprentissage d'un prédicteur linéaire pour des classes séparées10 minutes
Extension du problème pour ZSL : des classes visibles aux classes invisibles15 minutes
Une approche d'une simplicité embarrassante pour ZSL10 minutes
ZSL avec des modèles génératifs10 minutes
Apprentissage zéro coup généralisé (GZSL)10 minutes
Apprentissage zéro coup : Autoencodeurs sémantiques5 minutes
ZSL généralisé avec des modèles génératifs5 minutes

1 devoirTotal 30 minutes

Quiz du module 630 minutes

Ce module se concentre sur l'Apprentissage en quelques coups (FSL), un paradigme critique de l'apprentissage automatique qui permet aux modèles de classer de nouveaux exemples avec seulement un petit nombre d'instances étiquetées. Contrairement aux modèles d'apprentissage profond traditionnels qui nécessitent de grandes quantités de données étiquetées, le FSL imite la capacité humaine à généraliser à partir d'exemples limités, ce qui le rend très utile pour des tâches telles que la classification d'images, la détection d'objets et le traitement du langage naturel (NLP). Le cours présente les réseaux de correspondance, une approche d'apprentissage basée sur des métriques conçue pour résoudre les problèmes d'apprentissage à partir d'une seule fois en apprenant une fonction de similarité qui met en correspondance de nouveaux exemples avec des instances étiquetées déjà vues. Les étudiants acquerront une compréhension approfondie de la façon dont les approches du plus proche voisin, les fonctions d'intégration différentiables et les mécanismes d'attention aident à optimiser les modèles d'apprentissage en quelques coups. À travers des discussions, des formulations théoriques et des applications du monde réel, ce cours permet aux étudiants d'acquérir des connaissances pratiques sur la manière dont l'IA peut fonctionner efficacement dans des environnements où les données sont rares.

Inclus

1 vidéo7 lectures1 devoir

1 vidéoTotal 6 minutes

Introduction à l'Apprentissage en quelques coups6 minutes

7 lecturesTotal 46 minutes

Qu'est-ce que l'Apprentissage en quelques coups ?10 minutes
Introduction à l'apprentissage en une seule fois2 minutes
Réseaux de correspondance : Une approche de l'apprentissage ponctuel10 minutes
Formation de réseaux de correspondance3 minutes
Amélioration de la classification visuelle de quelques clichés10 minutes
Amélioration de la classification d'images peu nombreuses à l'aide d'exemples non étiquetés10 minutes
Félicitations1 minute

1 devoirTotal 30 minutes

Quiz du module 730 minutes

Instructeur

Sarah Ostadabbas

Northeastern University

2 Cours328 apprenants

Offert par

Northeastern University

En savoir plus sur Apprentissage automatique

Northeastern University
Machine Learning with Small Data Part 2
Cours
Catégorie : Prévisualisation
O.P. Jindal Global University
Machine Learning
Cours
Catégorie : Prévisualisation
Pearson
Learning Deep Learning: Unit 1
Cours
Statut : Essai gratuit
Edureka
Practical Deep Learning with Python
Cours
Statut : Essai gratuit

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Débloquez l'accès à plus de 10 000 cours grâce à un abonnement
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez les 4 700 entreprises internationales qui ont choisi Coursera for Business.

Foire Aux Questions

Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.

Lorsque vous achetez un certificat, vous avez accès à tous les supports de cours, y compris les devoirs notés. Une fois le cours terminé, votre certificat électronique sera ajouté à votre page de réalisations. Vous pourrez alors l'imprimer ou l'ajouter à votre profil LinkedIn.

Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.