Packt

Cutting-Edge Topics in Deep Reinforcement Learning

Save on skills that make you shine with 40% off 3 months of Coursera Plus. Save now

kurs ist nicht verfügbar in Deutsch (Deutschland)

Wir übersetzen es in weitere Sprachen.
Packt

Cutting-Edge Topics in Deep Reinforcement Learning

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Fortgeschritten

Empfohlene Erfahrung

7 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Fortgeschritten

Empfohlene Erfahrung

7 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Understand continuous action spaces and their applications in deep reinforcement learning

  • Master trust region methods for stable policy optimization in RL

  • Explore black-box optimization techniques to solve complex RL problems

Kompetenzen, die Sie erwerben

  • Kategorie: Fine-tuning
  • Kategorie: Machine Learning Methods
  • Kategorie: Model Optimization
  • Kategorie: Deep Learning
  • Kategorie: Machine Learning Algorithms
  • Kategorie: Reinforcement Learning
  • Kategorie: Data Analysis
  • Kategorie: Artificial Neural Networks
  • Kategorie: Machine Learning
  • Kategorie: Model Training
  • Kategorie: Artificial Intelligence and Machine Learning (AI/ML)
  • Kategorie: Agentic systems

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

April 2026

Bewertungen

8 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung „Deep Reinforcement Learning Hands-On“
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 8 Module

This module introduces advanced reinforcement learning techniques for environments with continuous action spaces. Learners will explore the A2C method, analyze its performance, and implement practical solutions for training agents in such domains. Hands-on coding examples and experimental results will deepen understanding of policy gradient methods in continuous settings.

Das ist alles enthalten

1 Video5 Lektüren1 Aufgabe

This module explores advanced techniques for stabilizing policy gradient methods in deep reinforcement learning. Learners will compare and contrast Proximal Policy Optimization (PPO), Trust Region Policy Optimization (TRPO), and ACKTR, examining their theoretical foundations and practical performance. By the end, you will understand how these methods improve training stability and efficiency.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

This module introduces black-box optimization techniques in reinforcement learning, highlighting their principles and recent applications to complex environments. Learners will explore practical implementations using evolutionary strategies and genetic algorithms, and analyze performance results on benchmark tasks such as CartPole and HalfCheetah.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

This module delves into advanced exploration strategies in reinforcement learning, highlighting the exploration/exploitation dilemma and presenting alternative methods such as random exploration, noisy networks, and network distillation. Learners will experiment with these techniques in the MountainCar environment and compare their effectiveness using both DQN and PPO algorithms.

Das ist alles enthalten

1 Video6 Lektüren1 Aufgabe

This module introduces reinforcement learning with human feedback (RLHF), a technique for training agents when explicit reward functions are difficult to define. Learners will explore the RLHF pipeline, including data labeling, reward model training, and integration with reinforcement learning algorithms. Real-world applications, such as training large language models, are also discussed.

Das ist alles enthalten

1 Video6 Lektüren1 Aufgabe

This module explores advanced model-based reinforcement learning techniques through the lens of AlphaGo Zero and MuZero. Learners will examine Monte Carlo Tree Search (MCTS), neural network architectures, and the process of training agents for board games like Connect 4. Practical implementation details and evaluation strategies are also covered.

Das ist alles enthalten

1 Video11 Lektüren1 Aufgabe

This module explores how deep reinforcement learning techniques can be applied to discrete optimization problems, using the example of solving cubes. Learners will examine neural network architectures, training processes, and experimental results, gaining insight into both implementation and evaluation of RL-based solvers.

Das ist alles enthalten

1 Video5 Lektüren1 Aufgabe

This module introduces the fundamentals of multi-agent reinforcement learning (MARL), exploring how multiple agents interact and learn within shared environments. Learners will examine the application of deep Q-networks to groups of agents and analyze the resulting behaviors. Practical examples illustrate how agent strategies evolve in multi-agent scenarios.

Das ist alles enthalten

1 Video2 Lektüren1 Aufgabe

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozent

Packt - Course Instructors
Packt
1.763 Kurse506.652 Lernende

von

Packt

Mehr von Software Development entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Coursera Plus

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen