Dans ce cours, vous apprendrez plusieurs algorithmes qui peuvent apprendre des politiques presque optimales basées sur l'interaction d'essais et d'erreurs avec l'environnement - l'apprentissage à partir de l'expérience de l'agent. L'apprentissage à partir de l'expérience réelle est frappant parce qu'il ne nécessite aucune connaissance préalable de la dynamique de l'environnement, tout en permettant d'atteindre un comportement optimal. Nous aborderons des méthodes de Monte Carlo intuitivement simples mais puissantes, ainsi que des méthodes d'apprentissage par différence temporelle, y compris l'apprentissage Q. A la fin de ce cours, vous serez capable de : - Comprendre l'apprentissage par différence temporelle et Monte Carlo comme deux stratégies pour estimer les fonctions de valeur à partir de l'expérience échantillonnée - Comprendre l'importance de l'exploration, lorsque l'on utilise l'expérience échantillonnée plutôt que les balayages de programmation dynamique dans un modèle - Comprendre les liens entre Monte Carlo et la programmation dynamique et la TD.


Méthodes d'apprentissage par échantillonnage
Économisez sur les compétences qui vous font briller avec 40 % de réduction sur 3 mois de Coursera Plus. Économisez maintenant


Méthodes d'apprentissage par échantillonnage
Ce cours fait partie de Spécialisation "Apprentissage par renforcement"


Instructeurs : Martha White
38 357 déjà inscrits
Inclus avec
1,256 avis
Expérience recommandée
Compétences que vous acquerrez
- Catégorie : Algorithmes
- Catégorie : Apprentissage par renforcement
- Catégorie : Méthodes d'apprentissage automatique
- Catégorie : Distribution de probabilité
- Catégorie : Apprentissage automatique
- Catégorie : Échantillonnage (statistiques)
- Catégorie : Apprentissage automatique appliqué
- Catégorie : Algorithmes d'apprentissage automatique
- Catégorie : Simulations
- Catégorie : Intelligence artificielle et apprentissage automatique (IA/ML)
Détails à connaître

Ajouter à votre profil LinkedIn
5 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 5 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeurs


En savoir plus sur Apprentissage automatique
Statut : PrévisualisationColumbia University
Statut : PrévisualisationNortheastern University
Statut : PrévisualisationNortheastern University
Statut : PrévisualisationSimplilearn
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Avis des étudiants
- 5 stars
82,33 %
- 4 stars
13,20 %
- 3 stars
2,78 %
- 2 stars
0,63 %
- 1 star
1,03 %
Affichage de 3 sur 1256
Révisé le 27 févr. 2020
Itwasgoodinsubstane but there is plenty of issues with the automated grader. you spend most time dealing with the letter not on actual learning of the matter.
Révisé le 13 mars 2022
The videos are very clear and do a good job explaining the material from the textbook. The assignments are relevant and just right in terms of length and difficulty.
Révisé le 14 févr. 2020
The course is intermediate in difficulty. But it explains the concept very clearly for me to understand difference between different sample based learning methods.
Foire Aux Questions
Plus de questions
Aide financière disponible,






