Ce cours aborde le défi de l'Apprentissage Automatique (AAM) dans le contexte de Petites données, un problème important dû aux demandes croissantes de données de l'AAM. Malgré le succès de l'apprentissage automatique dans divers domaines, de nombreux secteurs ne peuvent pas fournir de grands ensembles de données étiquetées en raison des coûts, de la protection de la vie privée ou des lois sur la sécurité. Le serveur d'authentification Big data devenant la norme, l'apprentissage efficace à partir d'ensembles de données plus petits est crucial. Ce cours, idéal pour les étudiants diplômés ayant une certaine expérience en ML, se concentre sur les techniques modernes d'apprentissage profond pour les applications de petites données pertinentes dans les soins de santé, l'armée et divers secteurs industriels. Les prérequis incluent la familiarité avec le ML et la maîtrise de Python. L'expérience de l'apprentissage profond n'est pas nécessaire mais bénéfique.

Apprentissage automatique avec Petites données Partie 1
Économisez sur les compétences qui vous font briller avec 40 % de réduction sur 3 mois de Coursera Plus. Économisez maintenant

Compétences que vous acquerrez
- Catégorie : Apprentissage automatique appliquéApprentissage automatique appliqué
- Catégorie : Apprentissage profondApprentissage profond
- Catégorie : Apprentissage par transfertApprentissage par transfert
- Catégorie : Synthèse des donnéesSynthèse des données
- Catégorie : Modèle de formationModèle de formation
- Catégorie : Apprentissage automatiqueApprentissage automatique
- Catégorie : Méthodes d'apprentissage automatiqueMéthodes d'apprentissage automatique
- Catégorie : Apprentissage non superviséApprentissage non supervisé
- Catégorie : Apprentissage superviséApprentissage supervisé
- Catégorie : Petites donnéesPetites données
Détails à connaître

Ajouter à votre profil LinkedIn
8 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Il y a 7 modules dans ce cours
Dans ce module, nous allons explorer le rôle central des données comme fondement des algorithmes d'apprentissage automatique. Nous commencerons par discuter de l'importance des grands ensembles de données dans la formation des modèles d'apprentissage profond, car ces ensembles de données sont cruciaux pour l'application réussie et l'efficacité des modèles. Nous nous plongerons également dans les défis associés aux petits ensembles de données, en particulier dans les domaines sensibles tels que la santé et la défense, où l'acquisition de données est souvent difficile, coûteuse ou soumise à des réglementations strictes en matière de confidentialité et de sécurité. Pour relever ces défis, le cours présentera diverses stratégies pour tirer le meilleur parti des données limitées, y compris des techniques d'apprentissage automatique économes en données et l'utilisation de l'augmentation des données synthétiques. En outre, nous présenterons la structure du cours et discuterons d'une sélection curatée de documents de recherche qui s'alignent sur nos sujets de cours et les enrichissent.
Inclus
2 vidéos13 lectures1 devoir
2 vidéos•Total 16 minutes
- Les données comptent•8 minutes
- Configuration de l'environnement local•8 minutes
13 lectures•Total 81 minutes
- Aperçu du cours•1 minute
- Syllabus - Apprentissage automatique pour les Petites données•10 minutes
- Intégrité académique•1 minute
- Les données sont importantes, en particulier pour le Deep learning•2 minutes
- Modélisation des données, des paramètres et de la puissance dans le modèle IA•5 minutes
- Croissance exponentielle des données d'entraînement•10 minutes
- Croissance exponentielle de la complexité des modèles•5 minutes
- Croissance exponentielle des ressources informatiques•5 minutes
- Le paradoxe de l'échelle : quand les petits modèles de ML surpassent les géants•5 minutes
- De grands ensembles de données pour le Deep learning•10 minutes
- Qu'est-ce que les Petites données ?•2 minutes
- Installation de PyTorch•5 minutes
- Grands et petits ensembles de données dans l'Apprentissage automatique•20 minutes
1 devoir•Total 10 minutes
- Quiz du module 1•10 minutes
Dans ce module, nous allons plonger dans les aspects fondamentaux de l'apprentissage automatique en mettant l'accent sur l'importance des données, en particulier dans les applications d'apprentissage profond. Nous commencerons par souligner à quel point les grands ensembles de données sont essentiels pour former efficacement les modèles d'apprentissage profond, car ils permettent aux modèles de capturer et d'apprendre à partir de modèles complexes, améliorant ainsi leurs performances globales. En outre, nous explorerons l'intersection de la disponibilité des données, de la puissance de calcul et de la capacité des modèles, en soulignant comment ces éléments interagissent pour affiner la précision et l'efficacité des modèles. En outre, le module couvrira les avancées informatiques au-delà de la loi de Moore et leur impact sur l'apprentissage automatique, en illustrant comment le matériel moderne comme les CPU, les GPU et les TPU améliorent les capacités de calcul essentielles à l'entraînement de modèles sophistiqués. Nous approfondirons également les lois de mise à l'échelle dans le Deep learning, en discutant des résultats empiriques qui montrent comment les performances des modèles s'améliorent de manière prévisible avec l'augmentation de la taille des ensembles de données et de la complexité des modèles, bien qu'avec des rendements décroissants. Pour fournir une base théorique plus profonde, nous examinerons la théorie de Vapnik-Chervonenkis (VC), qui offre un aperçu de la façon dont les courbes d'apprentissage et la complexité du modèle sont liées à la capacité d'un modèle à généraliser à partir des données d'entraînement. Cette discussion s'étendra aux applications pratiques et aux limitations théoriques, aidant à cadrer les défis de l'apprentissage automatique en termes de suffisance des données, d'ajustement des modèles et d'équilibre entre le biais et la variance. À la fin de ce module, les étudiants auront une compréhension approfondie de l'interaction dynamique entre ces facteurs et de leurs implications pour la pratique et la recherche en apprentissage automatique.
Inclus
1 vidéo19 lectures2 devoirs1 élément d'application
1 vidéo•Total 9 minutes
- Performance des modèles d'apprentissage automatique•9 minutes
19 lectures•Total 144 minutes
- Ingrédients Relation•10 minutes
- Puissance de calcul : Croissance au-delà de la loi de Moore•10 minutes
- Lois d'échelle•5 minutes
- Courbes d'apprentissage•15 minutes
- Capacité de modélisation requise pour l'ajustement des données•3 minutes
- Performance du modèle et taille de l'ensemble de données•2 minutes
- Performance et capacité des modèles•2 minutes
- Compromis biais-variance•15 minutes
- Du point de vue de l'algèbre linéaire•2 minutes
- Problèmes sous-déterminés et modèles surparamétrés•8 minutes
- Réexamen de la variance des biais avec la double descente•8 minutes
- Comparaison des paradigmes d'apprentissage•15 minutes
- Un apprentissage automatique•2 minutes
- Comment caractériser la complexité des modèles ?•1 minute
- Dimension Vapnik-Chervonenkis (VC) - Éclatement•10 minutes
- Notions de dimension de la CV•10 minutes
- Exemples d'éclatement et de dimension VC•10 minutes
- La dimension VC dans les réseaux neurones•15 minutes
- Ressources•1 minute
2 devoirs•Total 60 minutes
- Calcul de la dimension VC des modèles SVM•30 minutes
- Quiz du module 2•30 minutes
1 élément d'application•Total 10 minutes
- Exemples d'apprentissage automatique•10 minutes
Dans ce module, nous allons explorer l'apprentissage par transfert et son rôle dans l'apprentissage automatique efficace en termes de données, où les modèles exploitent les connaissances des tâches précédentes pour améliorer les performances sur de nouvelles tâches connexes. Nous aborderons également les différents types d'Apprentissage par transfert, y compris les méthodes transductives, inductives et non supervisées, chacune répondant à des défis et des applications différents. Nous discuterons de certaines étapes pratiques pour la mise en œuvre de l'apprentissage par transfert, telles que la sélection et le réglage fin de modèles pré-entraînés, afin de réduire la dépendance à l'égard des grands ensembles de données. Nous examinerons également les simulations basées sur les données et la physique pour l'augmentation des données, en soulignant leur utilisation pour améliorer l'entraînement dans des conditions contraignantes. Enfin, nous passerons en revue les principaux articles sur les techniques d'apprentissage par transfert afin de remédier à la pénurie de données et d'améliorer les performances des modèles.
Inclus
1 vidéo15 lectures1 devoir
1 vidéo•Total 6 minutes
- Apprentissage par transfert•6 minutes
15 lectures•Total 72 minutes
- Apprentissage automatique efficace sur le plan des données•10 minutes
- Exploiter les modèles pré-entraînés pour un apprentissage automatique efficace•2 minutes
- Apprentissage par transfert à la vanille•2 minutes
- Types d'Apprentissage par transfert•2 minutes
- Algorithmes d'apprentissage par transfert transductif•10 minutes
- Algorithmes d'Apprentissage par transfert inductif•10 minutes
- Exemples transductifs I•5 minutes
- Exemples transductifs II•5 minutes
- Exemples transductifs III•5 minutes
- Exemples inductifs•5 minutes
- Apprentissage multitâche et Meta-Learning•5 minutes
- Augmentation des données synthétiques•2 minutes
- Simulation basée sur les données•3 minutes
- Simulation basée sur la physique•2 minutes
- Exemples de simulations basées sur la physique•4 minutes
1 devoir•Total 15 minutes
- Quiz du module 3•15 minutes
Dans ce module, vous explorerez le concept d'adaptation au domaine, un aspect clé de l'apprentissage par transfert transductif. L'adaptation au domaine vous aide à former des modèles performants dans un domaine cible, même si la distribution des données diffère de celle du domaine source. Vous découvrirez les défis liés au changement de domaine et à la rareté des données étiquetées, ainsi que leur impact sur les performances des modèles. Nous couvrirons les différents types d'adaptation de domaine, y compris les approches non supervisées, semi-supervisées et supervisées. Vous plongerez également dans des techniques telles que Deep Domain Confusion (DDC), qui intègre la perte de confusion de domaine dans les réseaux neurones pour créer des caractéristiques invariantes par rapport au domaine. En outre, vous découvrirez des méthodes avancées telles que les réseaux neurones orientés domaine (DANN), l'alignement des corrélations (CORAL) et les réseaux d'adaptation en profondeur (DAN) qui s'appuient sur la DDC pour améliorer l'adaptation au domaine en alignant les distributions de caractéristiques et en capturant les dépendances complexes à travers les couches du réseau.
Inclus
1 vidéo10 lectures1 devoir
1 vidéo•Total 6 minutes
- Adaptation du domaine•6 minutes
10 lectures•Total 143 minutes
- Adaptation du domaine : Contexte•1 minute
- Non supervisé, semi-supervisé et supervisé•10 minutes
- Confusion dans les domaines profonds•8 minutes
- Travaux connexes basés sur le DDC•2 minutes
- Architecture de confusion dans les domaines profonds•10 minutes
- Mise en œuvre et architecture•10 minutes
- Formulation mathématique•5 minutes
- Un exemple d'ensemble de données : Office-31•2 minutes
- Un exemple d'expérience DDC•5 minutes
- Apprentissage par transfert Activité pratique•90 minutes
1 devoir•Total 10 minutes
- Quiz du module 4•10 minutes
Dans ce module, nous allons explorer la supervision faible, une technique pour former des modèles d'apprentissage automatique avec des étiquettes limitées, bruyantes ou imprécises. Vous découvrirez les différents types de supervision faible et les raisons pour lesquelles ils sont essentiels dans les domaines de petites données. Nous couvrirons des techniques telles que l'apprentissage semi-supervisé, l'apprentissage auto-supervisé et l'apprentissage actif, ainsi que des méthodes avancées telles que l'ensembliste temporel et l'approche de l'enseignant moyen. En outre, vous découvrirez l'apprentissage profond bayésien et les stratégies d'apprentissage actif pour améliorer l'efficacité de la formation. Enfin, vous verrez des applications du monde réel dans des domaines tels que l'imagerie médicale, le NLP, la détection des fraudes, la conduite autonome et la biologie.
Inclus
1 vidéo8 lectures1 devoir
1 vidéo•Total 7 minutes
- Qu'est-ce qu'une supervision insuffisante ?•7 minutes
8 lectures•Total 54 minutes
- Types de supervision insuffisante•6 minutes
- Apprentissage supervisé•10 minutes
- Apprentissage supervisé•15 minutes
- Apprentissage actif•6 minutes
- Applications de la supervision faible•2 minutes
- Étude de cas : Imagerie médicale•5 minutes
- Étude de cas : Conduite autonome•5 minutes
- Étude de cas : Traitement du langage naturel (NLP)•5 minutes
1 devoir•Total 30 minutes
- Quiz du module 5•30 minutes
Dans ce module, vous découvrirez comment l'Apprentissage zéro coup (ZSL) permet aux modèles de reconnaître de nouvelles catégories sans avoir vu d'exemples de ces catégories au cours de la formation. Pour ce faire, on exploite les descriptions sémantiques intermédiaires, telles que les attributs, partagées entre les classes vues et non vues. Vous découvrirez également l'importance de la régularisation pour éviter le surajustement et améliorer la généralisation, ainsi que la façon dont les modèles génératifs tels que les GAN et les VAE améliorent le ZSL en synthétisant des données de classes inédites. En outre, nous examinerons l'Apprentissage zéro coup généralisé (GZSL), qui teste les modèles sur les classes vues et non vues, rendant la tâche plus difficile et plus réaliste. À la fin de ce module, vous aurez une solide compréhension de la façon dont ZSL et ses extensions peuvent être appliquées à diverses tâches d'apprentissage automatique.
Inclus
1 vidéo9 lectures1 devoir
1 vidéo•Total 5 minutes
- Apprentissage zéro coup généralisé•5 minutes
9 lectures•Total 71 minutes
- Introduction à l'Apprentissage zéro coup•3 minutes
- ZSL : Notation et résolution de problèmes•3 minutes
- Apprentissage d'un prédicteur linéaire pour des classes séparées•10 minutes
- Extension du problème pour ZSL : des classes visibles aux classes invisibles•15 minutes
- Une approche d'une simplicité embarrassante pour ZSL•10 minutes
- ZSL avec des modèles génératifs•10 minutes
- Apprentissage zéro coup généralisé (GZSL)•10 minutes
- Apprentissage zéro coup : Autoencodeurs sémantiques•5 minutes
- ZSL généralisé avec des modèles génératifs•5 minutes
1 devoir•Total 30 minutes
- Quiz du module 6•30 minutes
Ce module se concentre sur l'Apprentissage en quelques coups (FSL), un paradigme critique de l'apprentissage automatique qui permet aux modèles de classer de nouveaux exemples avec seulement un petit nombre d'instances étiquetées. Contrairement aux modèles d'apprentissage profond traditionnels qui nécessitent de grandes quantités de données étiquetées, le FSL imite la capacité humaine à généraliser à partir d'exemples limités, ce qui le rend très utile pour des tâches telles que la classification d'images, la détection d'objets et le traitement du langage naturel (NLP). Le cours présente les réseaux de correspondance, une approche d'apprentissage basée sur des métriques conçue pour résoudre les problèmes d'apprentissage à partir d'une seule fois en apprenant une fonction de similarité qui met en correspondance de nouveaux exemples avec des instances étiquetées déjà vues. Les étudiants acquerront une compréhension approfondie de la façon dont les approches du plus proche voisin, les fonctions d'intégration différentiables et les mécanismes d'attention aident à optimiser les modèles d'apprentissage en quelques coups. À travers des discussions, des formulations théoriques et des applications du monde réel, ce cours permet aux étudiants d'acquérir des connaissances pratiques sur la manière dont l'IA peut fonctionner efficacement dans des environnements où les données sont rares.
Inclus
1 vidéo7 lectures1 devoir
1 vidéo•Total 6 minutes
- Introduction à l'Apprentissage en quelques coups•6 minutes
7 lectures•Total 46 minutes
- Qu'est-ce que l'Apprentissage en quelques coups ?•10 minutes
- Introduction à l'apprentissage en une seule fois•2 minutes
- Réseaux de correspondance : Une approche de l'apprentissage ponctuel•10 minutes
- Formation de réseaux de correspondance•3 minutes
- Amélioration de la classification visuelle de quelques clichés•10 minutes
- Amélioration de la classification d'images peu nombreuses à l'aide d'exemples non étiquetés•10 minutes
- Félicitations•1 minute
1 devoir•Total 30 minutes
- Quiz du module 7•30 minutes
Instructeur

Offert par

Offert par

Fondée en 1898, Northeastern est une université de recherche internationale qui se distingue par une approche de l'éducation et de la découverte axée sur l'expérience. L'université est un leader en matière d'apprentissage par l'expérience, grâce au programme d'éducation coopérative le plus étendu au monde. L'esprit de collaboration guide une entreprise de recherche inspirée par l'utilisation et axée sur la résolution des défis mondiaux en matière de santé, de sécurité et de durabilité.
En savoir plus sur Apprentissage automatique
NNortheastern University
Cours
PPearson
Cours
OO.P. Jindal Global University
Cours
EEdge Impulse
Cours
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Foire Aux Questions
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous achetez un certificat, vous avez accès à tous les supports de cours, y compris les devoirs notés. Une fois le cours terminé, votre certificat électronique sera ajouté à votre page de réalisations. Vous pourrez alors l'imprimer ou l'ajouter à votre profil LinkedIn.
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.
Plus de questions
Aide financière disponible,


