Maschinelles Lernen mit Small Data Teil 1

Sichern Sie sich eines unserer besten Angebote mit Coursera Plus für 199 $ (normalerweise 399 $). Jetzt sparen.

Maschinelles Lernen mit Small Data Teil 1

Dozent: Sarah Ostadabbas

Bei Mehr erfahren enthalten

Fragen Sie Coursera

7 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

1 Woche zu vervollständigen

unter 10 Stunden pro Woche

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

7 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

1 Woche zu vervollständigen

unter 10 Stunden pro Woche

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

Kompetenzen, die Sie erwerben

Kategorie: Angewandtes maschinelles Lernen
Kategorie: Lernen übertragen
Kategorie: Überwachtes Lernen
Kategorie: Tiefes Lernen
Kategorie: Maschinelles Lernen
Kategorie: Modell Ausbildung
Kategorie: Feinabstimmung
Kategorie: Kleine Daten
Kategorie: Daten-Synthese
Kategorie: Unüberwachtes Lernen
Kategorie: Methoden des maschinellen Lernens

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

8 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Weitere Informationen zu Coursera für Unternehmen

Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

In diesem Kurs gibt es 7 Module

Dieser Kurs befasst sich mit der Herausforderung des Maschinellen Lernens (ML) im Zusammenhang mit kleinen Datensätzen, ein wichtiges Thema aufgrund des steigenden Datenbedarfs von ML. Trotz des Erfolgs von ML in verschiedenen Bereichen können in vielen Bereichen aus Kosten-, Datenschutz- oder Sicherheitsgründen keine großen markierten Datensätze bereitgestellt werden. Da Big Data zum Standard wird, ist effizientes Lernen aus kleineren Datensätzen von entscheidender Bedeutung. Dieser Kurs, der ideal für Studenten mit ML-Erfahrung ist, konzentriert sich auf moderne Deep Learning-Techniken für Small Data-Anwendungen, die im Gesundheitswesen, im Militär und in verschiedenen Industriezweigen relevant sind. Zu den Voraussetzungen gehören ML-Kenntnisse und Python-Kenntnisse. Deep Learning-Erfahrung ist nicht erforderlich, aber von Vorteil.

In diesem Modul werden wir die zentrale Rolle von Daten als Grundlage für Algorithmen des Maschinellen Lernens untersuchen. Zunächst wird die Bedeutung großer Datensätze für das Training von Deep Learning-Modellen erörtert, da diese Datensätze entscheidend für die erfolgreiche Anwendung und Effektivität der Modelle sind. Wir werden uns auch mit den Herausforderungen befassen, die mit kleinen Datensätzen verbunden sind, insbesondere in sensiblen Bereichen wie dem Gesundheitswesen und der Verteidigung, wo die Datenerfassung oft schwierig und kostspielig ist oder strengen Datenschutz- und Sicherheitsvorschriften unterliegt. Um diese Herausforderungen zu bewältigen, werden im Kurs verschiedene Strategien zur optimalen Nutzung begrenzter Datenmengen vorgestellt, darunter dateneffiziente Techniken des Maschinellen Lernens und die Verwendung synthetischer Datenerweiterungen. Darüber hinaus werden wir die Kursstruktur vorstellen und eine kuratierte Auswahl von Forschungsarbeiten diskutieren, die mit unseren Kursthemen übereinstimmen und diese bereichern.

Das ist alles enthalten

2 Videos13 Lektüren1 Aufgabe

2 VideosInsgesamt 16 Minuten

Daten sind wichtig8 Minuten
Einrichten Ihrer lokalen Umgebung8 Minuten

13 LektürenInsgesamt 81 Minuten

Überblick über den Kurs1 Minute
Syllabus - Maschinelles Lernen für Small Data10 Minuten
Akademische Integrität1 Minute
Daten sind wichtig - vor allem für Deep Learning2 Minuten
Daten-Parameter-Leistungsskalierung im KI-Modell5 Minuten
Exponentiales Wachstum der Trainingsdaten10 Minuten
Exponentielles Wachstum der Komplexität von Modellen5 Minuten
Exponentielles Wachstum der Computerressourcen5 Minuten
Das Skalierungsparadoxon: Wenn kleinere ML-Modelle besser abschneiden als große5 Minuten
Große Datensätze für Deep Learning10 Minuten
Was sind Small Data?2 Minuten
Installation von PyTorch5 Minuten
Große vs. kleine Datensätze beim Maschinellen Lernen20 Minuten

1 AufgabeInsgesamt 10 Minuten

Modul 1 Quiz10 Minuten

In diesem Modul werden wir uns mit den Kernaspekten des Maschinellen Lernens befassen, wobei der Schwerpunkt auf der Bedeutung von Daten liegt, insbesondere bei Deep Learning-Anwendungen. Wir beginnen damit, dass wir betonen, wie wichtig große Datensätze für ein effektives Training von Deep Learning-Modellen sind, da sie es den Modellen ermöglichen, komplexe Muster zu erfassen und daraus zu lernen, was ihre Gesamtleistung verbessert. Darüber hinaus werden wir die Überschneidung von Datenverfügbarkeit, Rechenleistung und Modellkapazität untersuchen und aufzeigen, wie diese Elemente zusammenwirken, um die Genauigkeit und Effizienz des Modells zu verbessern. Darüber hinaus werden in diesem Modul die Fortschritte bei der Datenverarbeitung jenseits des Mooreschen Gesetzes und ihre Auswirkungen auf das Maschinelle Lernen behandelt. Es wird aufgezeigt, wie moderne Hardware wie CPUs, GPUs und TPUs die Rechenkapazitäten verbessern, die für das Training anspruchsvoller Modelle entscheidend sind. Wir werden uns auch mit den Skalierungsgesetzen im Deep Learning befassen und empirische Ergebnisse diskutieren, die zeigen, wie sich die Modellleistung mit zunehmender Datenmenge und Modellkomplexität vorhersehbar verbessert, wenn auch mit abnehmender Rendite. Um eine tiefere theoretische Grundlage zu schaffen, werden wir die Vapnik-Chervonenkis (VC)-Theorie untersuchen, die Einblicke in die Beziehung zwischen Lernkurven und Modellkomplexität und der Fähigkeit eines Modells zur Verallgemeinerung aus Trainingsdaten bietet. Diese Diskussion wird sich auf praktische Anwendungen und theoretische Grenzen erstrecken und dazu beitragen, die Herausforderungen des Maschinellen Lernens in Bezug auf Datenausreichend, Modellanpassung und das Gleichgewicht zwischen Bias und Abweichung zu formulieren. Am Ende dieses Moduls werden die Studierenden ein gründliches Verständnis des dynamischen Zusammenspiels dieser Faktoren und ihrer Auswirkungen auf die Praxis des Maschinellen Lernens und die Forschung haben.

Das ist alles enthalten

1 Video19 Lektüren2 Aufgaben1 App-Element

1 VideoInsgesamt 9 Minuten

Leistung des Modells für Maschinelles Lernen9 Minuten

19 LektürenInsgesamt 144 Minuten

Zutaten Verhältnis10 Minuten
Rechenleistung: Wachstum jenseits des Mooreschen Gesetzes10 Minuten
Skalierungsgesetze5 Minuten
Lernkurven15 Minuten
Erforderliche Modellkapazität zur Anpassung der Daten3 Minuten
Modellleistung und Datensatzgröße2 Minuten
Modellleistung und Modellkapazität2 Minuten
Verzerrung-Varianz-Kompromiss15 Minuten
FROM eine Perspektive der linearen Algebra2 Minuten
Unterbestimmte Probleme und überparametrisierte Modelle8 Minuten
Überprüfung der Bias-Varianz mit Double Descent8 Minuten
Vergleich von Lernparadigmen15 Minuten
Eine lernende Maschine2 Minuten
Wie charakterisieren wir die Komplexität von Modellen?1 Minute
Vapnik-Chervonenkis (VC) Dimension - Zertrümmerung10 Minuten
Begriffe der VC-Dimension10 Minuten
Beispiele für Shattering und VC Dimension10 Minuten
VC-Dimension in Neuronalen Netzen15 Minuten
Ressourcen1 Minute

2 AufgabenInsgesamt 60 Minuten

Berechnung der VC-Dimension von SVM-Modellen30 Minuten
Modul 2 Quiz30 Minuten

1 App-ElementInsgesamt 10 Minuten

Beispiele für lernende Maschinen10 Minuten

In diesem Modul werden wir uns mit Transfer Learning und seiner Rolle beim dateneffizienten Maschinellen Lernen beschäftigen, bei dem Modelle das Wissen aus früheren Aufgaben nutzen, um die Leistung bei neuen, verwandten Aufgaben zu verbessern. Wir werden auch verschiedene Arten von Transfer Learning behandeln, darunter transduktive, induktive und unüberwachte Methoden, die jeweils unterschiedliche Herausforderungen und Anwendungen adressieren. Wir werden einige praktische Schritte zur Implementierung von Transfer Learning besprechen, wie z.B. die Auswahl und das Fine-Tuning von Pre-Training-Modellen, um die Abhängigkeit von großen Datensätzen zu verringern. Wir werden auch datengesteuerte und physikbasierte Simulationen zur Datenerweiterung untersuchen und deren Einsatz zur Verbesserung des Trainings unter eingeschränkten Bedingungen hervorheben. Abschließend werden wir die wichtigsten Arbeiten über Transfer Learning-Techniken zur Bewältigung von Datenknappheit und zur Verbesserung der Modellleistung besprechen.

Das ist alles enthalten

1 Video15 Lektüren1 Aufgabe

1 VideoInsgesamt 6 Minuten

Lernen übertragen6 Minuten

15 LektürenInsgesamt 72 Minuten

Dateneffizientes Maschinelles Lernen10 Minuten
Nutzung von Pre-Training-Modellen für effizientes Maschinelles Lernen2 Minuten
Vanilla Transfer Learning2 Minuten
Arten von Transfer Learning2 Minuten
Transduktive Transfer Learning Algorithmen10 Minuten
Induktive Transfer Learning Algorithmen10 Minuten
Transduktive Beispiele I5 Minuten
Transduktive Beispiele II5 Minuten
Transduktive Beispiele III5 Minuten
Induktive Beispiele5 Minuten
Multi-Task-Lernen & Meta-Learning5 Minuten
Synthetische Datenerweiterung2 Minuten
Datengestützte Simulation3 Minuten
Physik-basierte Simulation2 Minuten
Physik-basierte Simulation Beispiele4 Minuten

1 AufgabeInsgesamt 15 Minuten

Modul 3 Quiz15 Minuten

In diesem Modul lernen Sie das Konzept der Domänenanpassung kennen, ein Schlüsselaspekt des transduktiven Transfer Learning. Mithilfe der Domänenanpassung können Sie Modelle trainieren, die in einer Zieldomäne gut funktionieren, auch wenn sich die Verteilung der Daten von der Quelldomäne unterscheidet. Sie lernen die Herausforderungen der Domänenverschiebung und der Knappheit an gelabelten Daten kennen und erfahren, wie sich diese auf die Leistung des Modells auswirken können. Wir werden verschiedene Arten der Domänenanpassung behandeln, darunter unüberwachte, halbüberwachte und überwachte Ansätze. Sie werden auch in Techniken wie Deep Domain Confusion (DDC) eintauchen, die den Verlust der Domänenkonfusion in neuronale Netzwerke integriert, um domäneninvariante Merkmale zu erstellen. Darüber hinaus lernen Sie fortgeschrittene Methoden wie Domain-Adversarial Neural Networks (DANNs), Correlation Alignment (CORAL) und Deep Adaptation Networks (DANs) kennen, die auf DDC aufbauen, um die Domänenanpassung zu verbessern, indem sie die Verteilung von Merkmalen abgleichen und komplexe Abhängigkeiten über Netzwerkschichten hinweg erfassen.

Das ist alles enthalten

1 Video10 Lektüren1 Aufgabe

1 VideoInsgesamt 6 Minuten

Anpassung der Bereiche6 Minuten

10 LektürenInsgesamt 143 Minuten

Bereichsanpassung: Hintergrund1 Minute
Unbeaufsichtigt, halb-beaufsichtigt und beaufsichtigt10 Minuten
Tiefe Domänenverwirrung8 Minuten
Verwandte Arbeiten auf Basis von DDC2 Minuten
Deep Domain Konfusion Architektur10 Minuten
Implementierung und Architektur10 Minuten
Mathematische Formulierung5 Minuten
Ein Beispieldatensatz: Büro-312 Minuten
Ein Beispiel für ein DDC-Experiment5 Minuten
Transfer Learning Praxisaktivität90 Minuten

1 AufgabeInsgesamt 10 Minuten

Modul 4 Quiz10 Minuten

In diesem Modul werden wir uns mit der schwachen Überwachung befassen, einer Technik zum Training von Modellen des Maschinellen Lernens mit begrenzten, verrauschten oder ungenauen Beschriftungen. Sie lernen verschiedene Arten von schwacher Überwachung kennen und erfahren, warum sie in Bereichen mit kleinen Datenmengen entscheidend sind. Wir werden Techniken wie halbüberwachtes Lernen, selbstüberwachtes Lernen und aktives Lernen sowie fortgeschrittene Methoden wie Temporal Ensembling und den Mean Teacher-Ansatz behandeln. Darüber hinaus lernen Sie Bayesian Deep Learning und aktive Lernstrategien zur Verbesserung der Trainingseffizienz kennen. Schließlich werden Sie reale Anwendungen in Bereichen wie medizinische Bildgebung, NLP, Betrugserkennung, autonomes Fahren und Biologie kennenlernen.

Das ist alles enthalten

1 Video8 Lektüren1 Aufgabe

1 VideoInsgesamt 7 Minuten

Was ist schwache Aufsicht?7 Minuten

8 LektürenInsgesamt 54 Minuten

Arten von schwacher Supervision6 Minuten
Semi-überwachtes Lernen10 Minuten
Selbstüberwachtes Lernen15 Minuten
Aktives Lernen6 Minuten
Anwendungen der schwachen Aufsicht2 Minuten
Fallstudie: Medizinische Bildgebung5 Minuten
Fallstudie: Autonomes Fahren5 Minuten
Fallstudie: Verarbeitung natürlicher Sprache5 Minuten

1 AufgabeInsgesamt 30 Minuten

Modul 5 Quiz30 Minuten

In diesem Modul erfahren Sie, wie Zero-Shot Learning (ZSL) Modelle in die Lage versetzt, neue Kategorien zu erkennen, ohne dass sie während des Trainings Beispiele für diese Kategorien gesehen haben. Dies wird erreicht, indem semantische Zwischenbeschreibungen, wie z. B. Attribute, genutzt werden, die von gesehenen und ungesehenen Klassen gemeinsam genutzt werden. Sie werden auch erfahren, wie wichtig die Regularisierung ist, um Überanpassung zu verhindern und die Generalisierung zu verbessern, und wie generative Modelle wie GANs und VAEs ZSL verbessern, indem sie ungesehene Klassendaten synthetisieren. Darüber hinaus werden wir uns mit Generalized Zero-Shot Learning (GZSL) beschäftigen, bei dem Modelle sowohl auf gesehene als auch auf ungesehene Klassen getestet werden, was die Aufgabe anspruchsvoller und realistischer macht. Am Ende dieses Moduls werden Sie ein solides Verständnis dafür haben, wie ZSL und seine Erweiterungen auf verschiedene Aufgaben des Maschinellen Lernens angewendet werden können.

Das ist alles enthalten

1 Video9 Lektüren1 Aufgabe

1 VideoInsgesamt 5 Minuten

Verallgemeinertes Zero-Shot Learning5 Minuten

9 LektürenInsgesamt 71 Minuten

Einführung in Zero-Shot Learning3 Minuten
ZSL: Notation und Problemstellung3 Minuten
Lernen eines linearen Prädiktors für gesehene Klassen10 Minuten
Problemerweiterung für ZSL: Von gesehenen zu ungesehenen Klassen15 Minuten
Eine peinlich einfache Herangehensweise an die ZSL10 Minuten
ZSL mit generativen Modellen10 Minuten
Verallgemeinertes Zero-Shot Learning (GZSL)10 Minuten
Zero-Shot Learning: Semantische Autoencoder5 Minuten
Verallgemeinerte ZSL mit generativen Modellen5 Minuten

1 AufgabeInsgesamt 30 Minuten

Modul 6 Quiz30 Minuten

Dieses Modul befasst sich mit Few-Shot Learning (FSL), einem wichtigen Paradigma des Maschinellen Lernens, das Modelle in die Lage versetzt, neue Beispiele mit nur einer kleinen Anzahl von markierten Instanzen zu klassifizieren. Im Gegensatz zu traditionellen Deep Learning-Modellen, die riesige Mengen beschrifteter Daten benötigen, ahmt FSL die menschliche Fähigkeit nach, aus begrenzten Beispielen zu verallgemeinern, was es für Aufgaben wie Bildklassifizierung, Objekterkennung und Verarbeitung natürlicher Sprache (NLP) äußerst nützlich macht. In der Vorlesung werden Matching-Netzwerke vorgestellt, ein metrikbasierter Lernansatz zur Lösung von One-Shot-Lernproblemen durch das Erlernen einer Ähnlichkeitsfunktion, die neue Beispiele auf zuvor gesehene markierte Instanzen abbildet. Die Studenten erhalten ein tiefes Verständnis dafür, wie Nearest-Neighbor-Ansätze, differenzierbare Einbettungsfunktionen und Aufmerksamkeitsmechanismen bei der Optimierung von Few-Shot Learning Modellen helfen. Durch Diskussionen, theoretische Formulierungen und reale Anwendungen vermittelt diese Vorlesung den Studierenden praktische Erkenntnisse darüber, wie KI in datenarmen Umgebungen effektiv funktionieren kann.

Das ist alles enthalten

1 Video7 Lektüren1 Aufgabe

1 VideoInsgesamt 6 Minuten

Einführung in Few-Shot Learning6 Minuten

7 LektürenInsgesamt 46 Minuten

Was ist Few-Shot Learning?10 Minuten
Einführung in One-Shot Learning2 Minuten
VERGLEICH von Netzwerken: Ein Ansatz für One-Shot-Learning10 Minuten
Training Verglichene Netzwerke3 Minuten
Verbesserung der visuellen Klassifizierung von Few-Shots10 Minuten
Verbesserung der Klassifizierung von Bildern mit wenigen Aufnahmen anhand von unbeschrifteten Beispielen10 Minuten
Herzlichen Glückwunsch1 Minute

1 AufgabeInsgesamt 30 Minuten

Modul 7 Quiz30 Minuten

Dozent

Sarah Ostadabbas

Northeastern University

2 Kurse329 Lernende

von

Northeastern University

Mehr von Maschinelles Lernen entdecken

Status: Vorschau
Northeastern University
Machine Learning with Small Data Part 2
Kurs
Status: Vorschau
O.P. Jindal Global University
Machine Learning
Kurs
Status: Kostenloser Testzeitraum
Pearson
Learning Deep Learning: Unit 1
Kurs
Status: Kostenloser Testzeitraum
Edureka
Practical Deep Learning with Python
Kurs

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018

„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020

„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021

„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen

Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.

Wenn Sie ein Zertifikat erwerben, erhalten Sie Zugang zu allen Kursmaterialien, einschließlich der benoteten Aufgaben. Nach Abschluss des Kurses wird Ihr elektronisches Zertifikat zu Ihrer Erfolgsseite hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen.

Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.