Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
Lernen Sie neue Konzepte von Branchenexperten
Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
Erwerben Sie ein Berufszertifikat zur Vorlage
In diesem Kurs gibt es 6 Module
In diesem letzten Kurs werden Sie Ihr Wissen aus den Kursen 1, 2 und 3 zusammenführen, um eine vollständige RL-Lösung für ein Problem zu implementieren. In dieser Abschlussarbeit werden Sie sehen, wie die einzelnen Komponenten - Problemformulierung, Auswahl des Algorithmus, Auswahl der Parameter und Entwurf der Repräsentation - zu einer vollständigen Lösung zusammenpassen und wie Sie beim Einsatz von RL in der realen Welt die richtigen Entscheidungen treffen. Im Rahmen dieses Projekts müssen Sie sowohl die Umgebung zur Stimulierung Ihres Problems als auch einen Kontrollagenten mit der Funktionsannäherung eines Neuronalen Netzes implementieren. Darüber hinaus werden Sie eine wissenschaftliche Studie über Ihr Lernsystem durchführen, um Ihre Fähigkeit zu entwickeln, die Robustheit von RL-Agenten zu beurteilen. Für den Einsatz von RL in der realen Welt ist es von entscheidender Bedeutung, (a) das Problem angemessen als MDP zu formalisieren, (b) geeignete Algorithmen auszuwählen, (c) festzustellen, welche Entscheidungen in Ihrer Implementierung große Auswirkungen auf die Leistung haben werden und (d) das erwartete Verhalten Ihrer Algorithmen zu validieren. Dieser Abschlusskurs ist für jeden wertvoll, der RL zur Lösung realer Probleme einsetzen möchte. Um diesen Kurs erfolgreich zu absolvieren, müssen Sie die Kurse 1, 2 und 3 dieser Specializations oder einen gleichwertigen Kurs abgeschlossen haben. Am Ende dieses Kurses werden Sie in der Lage sein:
Eine RL-Lösung für ein Problem zu erstellen, beginnend mit der Problemformulierung, der Auswahl eines geeigneten Algorithmus, der Implementierung und der empirischen Untersuchung der Effektivität der Lösung.
Willkommen zum Abschlusskurs der Reinforcement Learning Specialization!!
Das ist alles enthalten
2 Videos2 Lektüren1 Diskussionsthema
Infos zu Modulinhalt anzeigen
2 Videos•Insgesamt 10 Minuten
Kurs 4 Einführung•2 Minuten
Treffen Sie Ihre Ausbilder!•8 Minuten
2 Lektüren•Insgesamt 20 Minuten
Reinforcement Learning Lehrbuch•10 Minuten
Voraussetzungen und Lernziele•10 Minuten
1 Diskussionsthema•Insgesamt 10 Minuten
Treffen und Begrüßung•10 Minuten
Meilenstein 1: Formalisierung des Wortproblems als MDP
Modul 2•3 Stunden abzuschließen
Moduldetails
In dieser Woche werden Sie eine Problembeschreibung lesen und diese in ein MDP übersetzen. Sie vervollständigen den Skelettcode für diese Umgebung, um ein vollständiges MDP zu erhalten, das Sie in diesem Abschlussprojekt verwenden können.
Das ist alles enthalten
4 Videos1 Programmieraufgabe
Infos zu Modulinhalt anzeigen
4 Videos•Insgesamt 23 Minuten
Erstes Projekttreffen mit Martha: Formalisierung des Problems•4 Minuten
Andy Barto zu Was sind Eligibility Traces und warum werden sie so genannt?•9 Minuten
Lassen Sie uns einen Blick darauf werfen: Markov-Entscheidungsprozesse•7 Minuten
Lassen Sie uns zurückblicken: Beispiele für episodische und fortlaufende Aufgaben•3 Minuten
1 Programmieraufgabe•Insgesamt 180 Minuten
MoonShot Technologien•180 Minuten
Meilenstein 2: Die Wahl des richtigen Algorithmus
Modul 3•1 Stunde abzuschließen
Moduldetails
In dieser Woche werden Sie aus drei Algorithmen auswählen, um eine Richtlinie für die Umwelt zu lernen. Sie werden über die Angemessenheit jedes Algorithmus für diese Umgebung nachdenken und diskutieren.
Das ist alles enthalten
7 Videos1 Aufgabe
Infos zu Modulinhalt anzeigen
7 Videos•Insgesamt 40 Minuten
Treffen mit Niko: Auswahl des Lernalgorithmus•3 Minuten
Lassen Sie uns zurückblicken: Erwartetes Sarsa•4 Minuten
Lassen Sie uns zurückblicken: Was ist Q-learning?•3 Minuten
Lassen Sie uns zurückblicken: Average Reward - Eine neue Art der Formulierung von Kontrollproblemen•10 Minuten
Csaba Szepesvari über Problemlandschaften•9 Minuten
Andy und Rich: Ratschläge für Studenten•5 Minuten
1 Aufgabe
Die Wahl des richtigen Algorithmus•0 Minuten
Meilenstein 3: Identifizieren der wichtigsten Leistungsparameter
Modul 4•1 Stunde abzuschließen
Moduldetails
In dieser Woche werden Sie die wichtigsten Parameter identifizieren, die die Leistung Ihres Agenten beeinflussen. Das Ziel ist es, den Raum der Möglichkeiten zu verstehen, damit Sie später entscheiden können, welchen Parameter Sie für Ihren Agenten eingehend untersuchen wollen.
Das ist alles enthalten
4 Videos1 Aufgabe
Infos zu Modulinhalt anzeigen
4 Videos•Insgesamt 25 Minuten
Agentenarchitektur-Meeting mit Martha: Überblick über die Design-Entscheidungen•6 Minuten
Lassen Sie uns nachlesen: Nichtlineare Approximation mit neuronalen Netzen•4 Minuten
Drew Bagnell über System ID + Optimale Kontrolle•7 Minuten
Susan Murphy über RL in Mobile Health•8 Minuten
1 Aufgabe•Insgesamt 40 Minuten
Auswirkung von Parameterwahlen in RL•40 Minuten
Meilenstein 4: Implementieren Sie Ihren Agenten
Modul 5•8 Stunden abzuschließen
Moduldetails
In dieser Woche werden Sie Ihren Agenten mit Expected Sarsa oder Q-learning mit RMSProp und Neuronalen Netzen implementieren. Um NNs zu verwenden, müssen Sie eine sorgfältigere Strategie zur Auswahl der Schrittgröße anwenden, weshalb Sie RMSProp verwenden werden. Sie werden auch die Korrektheit Ihres Agenten überprüfen.
Das ist alles enthalten
6 Videos1 Programmieraufgabe
Infos zu Modulinhalt anzeigen
6 Videos•Insgesamt 29 Minuten
Treffen mit Adam: Die richtigen Details für den Agenten•5 Minuten
Lassen Sie uns zurückblicken: Optimierungsstrategien für NNs•5 Minuten
Lassen Sie uns einen Blick darauf werfen: Erwartete Sarsa mit Funktionsapproximation•2 Minuten
Lassen Sie uns zurückblicken: Dyna & Q-learning in einem einfachen Labyrinth•5 Minuten
Treffen mit Martha: Vertiefung der Erfahrungen - Wiederholung•5 Minuten
Martin Riedmiller zu Das 'Collect and Infer'-Framework für dateneffizientes RL•7 Minuten
1 Programmieraufgabe•Insgesamt 480 Minuten
Implementieren Sie Ihren Agenten•480 Minuten
Meilenstein 5: Reichen Sie Ihre Parameterstudie ein!
Modul 6•1 Stunde abzuschließen
Moduldetails
In dieser Woche werden Sie einen Parameter für Ihren Agenten auswählen, den Sie untersuchen möchten. Sobald Sie den zu untersuchenden Parameter ausgewählt haben, werden wir Ihnen eine Reihe von Werten und spezifische Werte für andere Parameter zur Verfügung stellen. Sie werden ein Skript schreiben, mit dem Sie Ihren Agenten und Ihre Umgebung mit diesen Parametern laufen lassen, um die Leistung über diese Parameter hinweg zu bestimmen. Sie werden einen Einblick in die Auswirkungen der Parameter auf die Leistung des Agenten erhalten. Außerdem können Sie die Agenten, die Sie lernen, visualisieren. Ihre Parameterstudie wird aus einem Array von Werten bestehen, die wir auf ihre Korrektheit überprüfen werden.
Das ist alles enthalten
6 Videos1 Programmieraufgabe
Infos zu Modulinhalt anzeigen
6 Videos•Insgesamt 29 Minuten
Treffen mit Adam: Parameterstudien in RL•6 Minuten
Lassen Sie uns zurückblicken: TD und Monte Carlo im Vergleich•6 Minuten
Joelle Pineau über RL, das wichtig ist•9 Minuten
Treffen mit Martha: Besprechen Sie Ihre Ergebnisse•2 Minuten
Nachbereitung des Kurses•2 Minuten
Specializations Wrap-up•3 Minuten
1 Programmieraufgabe•Insgesamt 60 Minuten
Fertigstellung der Parameterstudie•60 Minuten
Erwerben Sie ein Karrierezertifikat.
Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
Dozenten
Lehrkraftbewertungen
Lehrkraftbewertungen
Wir haben alle Lernenden um Feedback zu unseren Dozenten gebeten, ausgehend von der Qualität ihres Unterrichtsstils.
Die University of Alberta gilt als eine der weltweit führenden öffentlichen forschungs- und lehrintensiven Universitäten, die für ihre Exzellenz in den Bereichen Geisteswissenschaften, Naturwissenschaften, kreative Künste, Wirtschaft, Ingenieurwesen und Gesundheitswissenschaften bekannt ist. Als eine der besten Universitäten Kanadas investieren wir in eine zielgerichtete postsekundäre Online-Ausbildung, die sich auf innovative digitale Pädagogik, erstklassige Dozenten, ein außergewöhnliches Design und ein hervorragendes Studentenerlebnis stützt.
Das Alberta Machine Intelligence Institute (Amii) beherbergt einige der weltbesten Talente im Bereich der maschinellen Intelligenz. Wir sind ein in Alberta ansässiges Forschungsinstitut, das die Grenzen des akademischen Wissens verschiebt und das Verständnis der Wirtschaft für künstliche Intelligenz und maschinelles Lernen fördert.
Warum entscheiden sich Menschen für Coursera für ihre Karriere?
Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Bewertungen von Lernenden
4.7
653 Bewertungen
5 stars
78,10 %
4 stars
15,77 %
3 stars
5,05 %
2 stars
0,61 %
1 star
0,45 %
Zeigt 3 von 653 an
M
MI
5·
Geprüft am 26. März 2020
Thanks a lot for offering this specialization! I really enjoyed watching the videos and working on the assignments while exploring various topics of RL.
M
MS
4·
Geprüft am 3. Feb. 2021
Good project as a capstone. Wish there would have been more work needed from our side of things in terms of coding, but very solid final course for RL.
R
RR
5·
Geprüft am 2. Aug. 2020
One of the most amazing set of courses that I have ever been through. This neither makes the stuff look difficult nor does it compromise on quality, absolutely the best.
Wann werde ich Zugang zu den Vorlesungen und Aufgaben haben?
Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Was bekomme ich, wenn ich mich für diese Specialization einschreibe?
Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzufügen.
Ist finanzielle Hilfe verfügbar?
Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.