University of Colorado Boulder

Spécialisation "Foundations of Reinforcement Learning"

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
University of Colorado Boulder

Spécialisation "Foundations of Reinforcement Learning"

Master Reinforcement Learning.

Build foundations in classical RL, deep RL, and reward design.

Ashutosh Trivedi

Instructeur : Ashutosh Trivedi

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Explain the mathematical foundations of reinforcement learning.

  • Analyze and compare tabular, approximate, and deep reinforcement learning algorithms .

  • Explain how function approximation and neural networks extend reinforcement learning beyond finite tabular settings

  • Design, infer, and assess reward structures and specification-based objectives that align learned behavior with intended task goals.

Compétences que vous acquerrez

  • Catégorie : Model Optimization
  • Catégorie : Agentic systems
  • Catégorie : Artificial Intelligence and Machine Learning (AI/ML)
  • Catégorie : Artificial Intelligence
  • Catégorie : Reinforcement Learning
  • Catégorie : Decision Intelligence
  • Catégorie : Machine Learning Algorithms
  • Catégorie : Theoretical Computer Science
  • Catégorie : Machine Learning
  • Catégorie : Statistical Machine Learning
  • Catégorie : Model Evaluation
  • Catégorie : Computational Logic
  • Catégorie : Responsible AI
  • Catégorie : Markov Model
  • Catégorie : Applied Mathematics
  • Catégorie : Deep Learning
  • Catégorie : Machine Learning Methods
  • Catégorie : Algorithms
  • Catégorie : Artificial Neural Networks

Outils que vous découvrirez

  • Catégorie : AI Workflows

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

juillet 2026

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de University of Colorado Boulder

Spécialisation - série de 3 cours

Mastering Classic Reinforcement Learning Algorithms

Mastering Classic Reinforcement Learning Algorithms

COURS 1, 14 heures

Ce que vous apprendrez

  • Formulate sequential decision-making problems as deterministic decision processes, Markov chains, and finite Markov decision processes.

  • Explain and apply core reinforcement-learning concepts, including discounting, value functions, policies, Bellman equations, and optimality.

  • Implement planning algorithms for finite Markov decision processes, including value iteration, policy iteration, and linear programming formulations.

  • Compare tabular reinforcement-learning algorithms, including bandits, Monte Carlo methods, temporal-difference learning, SARSA, and Q-learning.

Compétences que vous acquerrez

Catégorie : Reinforcement Learning
Catégorie : Markov Model
Catégorie : Model Optimization
Catégorie : Probability Distribution
Catégorie : Machine Learning
Catégorie : Algorithms
Catégorie : Machine Learning Algorithms
Catégorie : Statistical Machine Learning
Catégorie : Probability & Statistics
Catégorie : Artificial Intelligence and Machine Learning (AI/ML)
Catégorie : Sampling (Statistics)
Catégorie : Decision Intelligence
Catégorie : Applied Mathematics
Deep Reinforcement Learning: From Theory to Practice

Deep Reinforcement Learning: From Theory to Practice

COURS 2, 14 heures

Ce que vous apprendrez

  • Explain how neural-network-based function approximation extends reinforcement learning beyond finite tabular settings.

  • Implement and evaluate value-based deep reinforcement learning algorithms, including Deep Q-Networks and stabilizing techniques.

  • Derive and implement policy-gradient methods, including REINFORCE, baselines, and advantage-based updates.

  • Explain and analyze actor–critic methods that combine policy optimization with value estimation.

Compétences que vous acquerrez

Catégorie : Reinforcement Learning
Catégorie : Deep Learning
Catégorie : System Design and Implementation
Catégorie : Machine Learning
Catégorie : Artificial Intelligence
Catégorie : Applied Machine Learning
Catégorie : Machine Learning Algorithms
Catégorie : Model Training
Catégorie : Model Evaluation
Catégorie : Artificial Neural Networks
Catégorie : Algorithms
Catégorie : Model Optimization
Catégorie : Machine Learning Methods
Catégorie : Agentic systems

Ce que vous apprendrez

  • Identify limitations of standard scalar reward formulations, including reward hacking, specification gaming, and brittle proxies.

  • Express structured learning objectives using formal tools such as temporal logic, automata, and reward machines.

  • Construct and analyze reward mechanisms based on temporal logic, automata, product MDPs, reward machines, and reward shaping.

  • Model reward-programming problems under hidden state, memory, hierarchy, multiagent interaction, and continuous-time dynamics

Compétences que vous acquerrez

Catégorie : Reinforcement Learning
Catégorie : Safety and Security
Catégorie : Machine Learning
Catégorie : Theoretical Computer Science
Catégorie : Model Evaluation
Catégorie : Machine Learning Methods
Catégorie : Agentic systems
Catégorie : Computational Logic
Catégorie : Functional Specification
Catégorie : Verification And Validation
Catégorie : Continuous Monitoring
Catégorie : Responsible AI
Catégorie : AI Workflows
Catégorie : Markov Model
Catégorie : Model Optimization

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Ashutosh Trivedi
University of Colorado Boulder
3 Cours60 apprenants

Offert par

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions