Dans ce cours, vous apprendrez plusieurs algorithmes qui peuvent apprendre des politiques presque optimales basées sur l'interaction d'essais et d'erreurs avec l'environnement - l'apprentissage à partir de l'expérience de l'agent. L'apprentissage à partir de l'expérience réelle est frappant parce qu'il ne nécessite aucune connaissance préalable de la dynamique de l'environnement, tout en permettant d'atteindre un comportement optimal. Nous aborderons des méthodes de Monte Carlo intuitivement simples mais puissantes, ainsi que des méthodes d'apprentissage par différence temporelle, y compris l'apprentissage Q. A la fin de ce cours, vous serez capable de : - Comprendre l'apprentissage par différence temporelle et Monte Carlo comme deux stratégies pour estimer les fonctions de valeur à partir de l'expérience échantillonnée - Comprendre l'importance de l'exploration, lorsque l'on utilise l'expérience échantillonnée plutôt que les balayages de programmation dynamique dans un modèle - Comprendre les liens entre Monte Carlo et la programmation dynamique et la TD.


Méthodes d'apprentissage par échantillonnage


Méthodes d'apprentissage par échantillonnage
Ce cours fait partie de Spécialisation "Apprentissage par renforcement"


Instructeurs : Martha White
38 169 déjà inscrits
Inclus avec
1,256 avis
Expérience recommandée
Compétences que vous acquerrez
- Catégorie : Machine Learning Algorithms
- Catégorie : Algorithms
- Catégorie : Artificial Intelligence and Machine Learning (AI/ML)
- Catégorie : Probability Distribution
- Catégorie : Sampling (Statistics)
- Catégorie : Reinforcement Learning
- Catégorie : Simulations
- Catégorie : Machine Learning
Détails à connaître

Ajouter à votre profil LinkedIn
5 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 5 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeurs


En savoir plus sur Apprentissage automatique
Statut : PrévisualisationColumbia University
Statut : PrévisualisationNortheastern University
Statut : PrévisualisationNortheastern University
Statut : PrévisualisationSimplilearn
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Avis des étudiants
- 5 stars
82,33 %
- 4 stars
13,20 %
- 3 stars
2,78 %
- 2 stars
0,63 %
- 1 star
1,03 %
Affichage de 3 sur 1256
Révisé le 27 févr. 2020
Itwasgoodinsubstane but there is plenty of issues with the automated grader. you spend most time dealing with the letter not on actual learning of the matter.
Révisé le 9 janv. 2020
Really great resource to follow along the RL Book. IMP Suggestion: Do not skip the reading assignments, they are really helpful and following the videos and assignments becomes easy.
Révisé le 3 juil. 2022
Excellent paced course that helped me understand sample based methods. Assignments were thoroughly build to practically utilize these concepts

Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Plus de questions
Aide financière disponible,



