Dieser Kurs ist eine Einführung in die sequentielle Entscheidungsfindung und das Verstärkungslernen. Wir beginnen mit einer Diskussion der Nutzentheorie, um zu lernen, wie Präferenzen für die Entscheidungsfindung dargestellt und modelliert werden können. Wir modellieren zunächst einfache Entscheidungsprobleme als mehrarmige Bandit-Probleme und diskutieren verschiedene Ansätze zur Bewertung von Feedback. Anschließend modellieren wir Entscheidungsprobleme als endliche Markov-Entscheidungsprozesse (MDPs) und erörtern deren Lösungen durch dynamische Programmieralgorithmen. Wir gehen auf den Begriff der partiellen Beobachtbarkeit in realen Problemen ein, die durch POMDPs modelliert und dann durch Online-Planungsmethoden gelöst werden. Schließlich führen wir das Problem des Verstärkungslernens ein und diskutieren zwei Paradigmen: Monte-Carlo-Methoden und zeitliches Differenzlernen. Wir schließen den Kurs mit der Feststellung, dass die beiden Paradigmen auf einem Spektrum von n-schrittigen temporalen Differenzmethoden liegen. Die Betonung von Algorithmen und Beispielen wird ein wichtiger Bestandteil dieses Kurses sein.

Entscheidungsfindung und Reinforcement Learning
Nutzen Sie die Ersparnis! Erhalten Sie 40% Rabatt auf 3 Monate Coursera Plus und vollen Zugang zu Tausenden von Kursen.

Entscheidungsfindung und Reinforcement Learning

Dozent: Tony Dear
4.419 bereits angemeldet
Bei enthalten
22 Bewertungen
Empfohlene Erfahrung
Was Sie lernen werden
Zuordnung zwischen qualitativen Präferenzen und geeigneten quantitativen Hilfsmitteln.
Modellieren Sie nicht-assoziative und assoziative sequentielle Entscheidungsprobleme mit mehrarmigen Bandit-Problemen bzw. Markov-Entscheidungsprozessen
Implementierung von Algorithmen zur dynamischen Programmierung, um optimale Strategien zu finden
Implementierung grundlegender Algorithmen zum Verstärkungslernen unter Verwendung von Monte-Carlo- und Zeitdifferenzmethoden
Kompetenzen, die Sie erwerben
- Kategorie: Reinforcement Learning
- Kategorie: Machine Learning
- Kategorie: Simulations
- Kategorie: Decision Support Systems
- Kategorie: Deep Learning
- Kategorie: Data-Driven Decision-Making
- Kategorie: Artificial Intelligence and Machine Learning (AI/ML)
- Kategorie: Probability Distribution
- Kategorie: Algorithms
- Kategorie: Markov Model
- Kategorie: Statistical Methods
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
8 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

In diesem Kurs gibt es 8 Module
Dozent

Mehr von Algorithmen entdecken
Status: Kostenloser TestzeitraumUniversity of Alberta
Status: Kostenloser TestzeitraumNew York University
Status: VorschauSimplilearn
Status: Kostenloser TestzeitraumUniversity of Alberta
Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Bewertungen von Lernenden
- 5 stars
63,63 %
- 4 stars
22,72 %
- 3 stars
0 %
- 2 stars
9,09 %
- 1 star
4,54 %
Zeigt 3 von 22 an
Geprüft am 20. Jan. 2024
Very good introductory and basic to Reinforcement Learning. But programming assignments need more careful compilation and more attention to detail!
Geprüft am 9. Juli 2023
Well-structured course that provides a great introduction to methodologies used in reinforcement learning. I am now eager to experiment more in my own time, to consolidate what I have learned.

Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Weitere Fragen
Finanzielle Unterstützung verfügbar,

