Ein vollständiges System zum Verstärkungslernen (Capstone)

Ein vollständiges System zum Verstärkungslernen (Capstone)

Dieser Kurs ist Teil von Spezialisierung „Reinforcement Learning“

Dozenten: Martha White

25.740 bereits angemeldet

Bei Mehr erfahren enthalten

Fragen Sie Coursera

6 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

2 Wochen zu vervollständigen

unter 10 Stunden pro Woche

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

6 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

2 Wochen zu vervollständigen

unter 10 Stunden pro Woche

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

Kompetenzen, die Sie erwerben

Kategorie: Agentische Systeme
Kategorie: Leistungsoptimierung
Kategorie: Maschinelles Lernen
Kategorie: Methoden des maschinellen Lernens
Kategorie: Architektur der Lösung
Kategorie: Technische Merkmale
Kategorie: Modell Ausbildung
Kategorie: Reinforcement Learning
Kategorie: Markov-Modell
Kategorie: Bewertung des Modells
Kategorie: Modell-Optimierung
Kategorie: Entwicklung von Systemen
Kategorie: Algorithmen für maschinelles Lernen
Kategorie: Künstliche neuronale Netze
Kategorie: Algorithmen

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

2 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Weitere Informationen zu Coursera für Unternehmen

Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung „Reinforcement Learning“

Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.

Lernen Sie neue Konzepte von Branchenexperten
Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 6 Module

In diesem letzten Kurs werden Sie Ihr Wissen aus den Kursen 1, 2 und 3 zusammenführen, um eine vollständige RL-Lösung für ein Problem zu implementieren. In dieser Abschlussarbeit werden Sie sehen, wie die einzelnen Komponenten - Problemformulierung, Auswahl des Algorithmus, Auswahl der Parameter und Entwurf der Repräsentation - zu einer vollständigen Lösung zusammenpassen und wie Sie beim Einsatz von RL in der realen Welt die richtigen Entscheidungen treffen. Im Rahmen dieses Projekts müssen Sie sowohl die Umgebung zur Stimulierung Ihres Problems als auch einen Kontrollagenten mit der Funktionsannäherung eines Neuronalen Netzes implementieren. Darüber hinaus werden Sie eine wissenschaftliche Studie über Ihr Lernsystem durchführen, um Ihre Fähigkeit zu entwickeln, die Robustheit von RL-Agenten zu beurteilen. Für den Einsatz von RL in der realen Welt ist es von entscheidender Bedeutung, (a) das Problem angemessen als MDP zu formalisieren, (b) geeignete Algorithmen auszuwählen, (c) festzustellen, welche Entscheidungen in Ihrer Implementierung große Auswirkungen auf die Leistung haben werden und (d) das erwartete Verhalten Ihrer Algorithmen zu validieren. Dieser Abschlusskurs ist für jeden wertvoll, der RL zur Lösung realer Probleme einsetzen möchte. Um diesen Kurs erfolgreich zu absolvieren, müssen Sie die Kurse 1, 2 und 3 dieser Specializations oder einen gleichwertigen Kurs abgeschlossen haben. Am Ende dieses Kurses werden Sie in der Lage sein:

Willkommen zum Abschlusskurs der Reinforcement Learning Specialization!!

Das ist alles enthalten

2 Videos2 Lektüren1 Diskussionsthema

In dieser Woche werden Sie eine Problembeschreibung lesen und diese in ein MDP übersetzen. Sie vervollständigen den Skelettcode für diese Umgebung, um ein vollständiges MDP zu erhalten, das Sie in diesem Abschlussprojekt verwenden können.

Das ist alles enthalten

4 Videos1 Programmieraufgabe

4 VideosInsgesamt 23 Minuten

Erstes Projekttreffen mit Martha: Formalisierung des Problems4 Minuten
Andy Barto zu Was sind Eligibility Traces und warum werden sie so genannt?9 Minuten
Lassen Sie uns einen Blick darauf werfen: Markov-Entscheidungsprozesse7 Minuten
Lassen Sie uns zurückblicken: Beispiele für episodische und fortlaufende Aufgaben3 Minuten

1 ProgrammieraufgabeInsgesamt 180 Minuten

MoonShot Technologien180 Minuten

In dieser Woche werden Sie aus drei Algorithmen auswählen, um eine Richtlinie für die Umwelt zu lernen. Sie werden über die Angemessenheit jedes Algorithmus für diese Umgebung nachdenken und diskutieren.

Das ist alles enthalten

7 Videos1 Aufgabe

7 VideosInsgesamt 40 Minuten

Treffen mit Niko: Auswahl des Lernalgorithmus3 Minuten
Lassen Sie uns zurückblicken: Erwartetes Sarsa4 Minuten
Lassen Sie uns zurückblicken: Was ist Q-learning?3 Minuten
Lassen Sie uns zurückblicken: Average Reward - Eine neue Art der Formulierung von Kontrollproblemen10 Minuten
Rückblick: Schauspieler-Kritik-Algorithmus5 Minuten
Csaba Szepesvari über Problemlandschaften9 Minuten
Andy und Rich: Ratschläge für Studenten5 Minuten

1 Aufgabe

Die Wahl des richtigen Algorithmus0 Minuten

In dieser Woche werden Sie die wichtigsten Parameter identifizieren, die die Leistung Ihres Agenten beeinflussen. Das Ziel ist es, den Raum der Möglichkeiten zu verstehen, damit Sie später entscheiden können, welchen Parameter Sie für Ihren Agenten eingehend untersuchen wollen.

Das ist alles enthalten

4 Videos1 Aufgabe

4 VideosInsgesamt 25 Minuten

Agentenarchitektur-Meeting mit Martha: Überblick über die Design-Entscheidungen6 Minuten
Lassen Sie uns nachlesen: Nichtlineare Approximation mit neuronalen Netzen4 Minuten
Drew Bagnell über System ID + Optimale Kontrolle7 Minuten
Susan Murphy über RL in Mobile Health8 Minuten

1 AufgabeInsgesamt 40 Minuten

Auswirkung von Parameterwahlen in RL40 Minuten

In dieser Woche werden Sie Ihren Agenten mit Expected Sarsa oder Q-learning mit RMSProp und Neuronalen Netzen implementieren. Um NNs zu verwenden, müssen Sie eine sorgfältigere Strategie zur Auswahl der Schrittgröße anwenden, weshalb Sie RMSProp verwenden werden. Sie werden auch die Korrektheit Ihres Agenten überprüfen.

Das ist alles enthalten

6 Videos1 Programmieraufgabe

6 VideosInsgesamt 29 Minuten

Treffen mit Adam: Die richtigen Details für den Agenten5 Minuten
Lassen Sie uns zurückblicken: Optimierungsstrategien für NNs5 Minuten
Lassen Sie uns einen Blick darauf werfen: Erwartete Sarsa mit Funktionsapproximation2 Minuten
Lassen Sie uns zurückblicken: Dyna & Q-learning in einem einfachen Labyrinth5 Minuten
Treffen mit Martha: Vertiefung der Erfahrungen - Wiederholung5 Minuten
Martin Riedmiller zu Das 'Collect and Infer'-Framework für dateneffizientes RL7 Minuten

1 ProgrammieraufgabeInsgesamt 480 Minuten

Implementieren Sie Ihren Agenten480 Minuten

In dieser Woche werden Sie einen Parameter für Ihren Agenten auswählen, den Sie untersuchen möchten. Sobald Sie den zu untersuchenden Parameter ausgewählt haben, werden wir Ihnen eine Reihe von Werten und spezifische Werte für andere Parameter zur Verfügung stellen. Sie werden ein Skript schreiben, mit dem Sie Ihren Agenten und Ihre Umgebung mit diesen Parametern laufen lassen, um die Leistung über diese Parameter hinweg zu bestimmen. Sie werden einen Einblick in die Auswirkungen der Parameter auf die Leistung des Agenten erhalten. Außerdem können Sie die Agenten, die Sie lernen, visualisieren. Ihre Parameterstudie wird aus einem Array von Werten bestehen, die wir auf ihre Korrektheit überprüfen werden.

Das ist alles enthalten

6 Videos1 Programmieraufgabe

6 VideosInsgesamt 29 Minuten

Treffen mit Adam: Parameterstudien in RL6 Minuten
Lassen Sie uns zurückblicken: TD und Monte Carlo im Vergleich6 Minuten
Joelle Pineau über RL, das wichtig ist9 Minuten
Treffen mit Martha: Besprechen Sie Ihre Ergebnisse2 Minuten
Nachbereitung des Kurses2 Minuten
Specializations Wrap-up3 Minuten

1 ProgrammieraufgabeInsgesamt 60 Minuten

Fertigstellung der Parameterstudie60 Minuten

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozenten

Martha White

University of Alberta

4 Kurse116.452 Lernende

Adam White

University of Alberta

4 Kurse116.452 Lernende

von

University of Alberta

Alberta Machine Intelligence Institute

Mehr von Maschinelles Lernen entdecken

Status: Kostenloser Testzeitraum
Packt
Deep Reinforcement Learning Hands-On
Spezialisierung
Status: Kostenloser Testzeitraum
University of Alberta
Fundamentals of Reinforcement Learning
Kurs
Status: Vorschau
Simplilearn
Fundamental of Reinforcement Training
Kurs
Status: Kostenloser Testzeitraum
University of Colorado Boulder
Mastering Classic Reinforcement Learning Algorithms
Kurs

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018

„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020

„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021

„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Schalten Sie den Zugang zu mehr als 10.000 Kursen mit einem Abonnement frei
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich den über 4.700 globalen Unternehmen an, die Coursera for Business wählen

Häufig gestellte Fragen

Um auf Kursmaterialien und Aufgaben zugreifen zu können und ein Zertifikat zu erwerben, müssen Sie bei der Anmeldung zu einem Kurs die Option „Zertifikat“ erwerben. Berechtigte Lernende haben möglicherweise auch die Möglichkeit, mit einer kostenlosen Testphase zu beginnen. Bei einigen Kursen wird möglicherweise auch die Option „Vollständiger Kurs, kein Zertifikat“ angeboten. Damit haben Sie Zugriff auf die Kursmaterialien, können die erforderlichen Prüfungen einreichen und erhalten eine Abschlussnote, können jedoch kein Zertifikat erwerben oder erhalten.

Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzufügen.

Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.