Dans ce dernier cours, vous rassemblerez vos connaissances des cours 1, 2 et 3 pour mettre en œuvre une solution RL complète à un problème. Ce projet vous permettra de voir comment chaque composant - formulation du problème, sélection de l'algorithme, sélection des paramètres et conception de la représentation - s'intègre dans une solution complète, et comment faire des choix appropriés lors du déploiement du RL dans le monde réel. Ce projet vous demandera d'implémenter à la fois l'environnement pour stimuler votre problème et un agent de contrôle avec une approximation de fonction de réseau neuronal. En outre, vous mènerez une étude scientifique de votre système d'apprentissage afin de développer votre capacité à évaluer la robustesse des agents RL. Pour utiliser le RL dans le monde réel, il est essentiel de (a) formaliser correctement le problème en tant que MDP, (b) sélectionner les algorithmes appropriés, (c) identifier les choix dans votre implémentation qui auront un impact important sur la performance et (d) valider le comportement attendu de vos algorithmes. Ce cours est utile pour tous ceux qui prévoient d'utiliser le RL pour résoudre des problèmes réels. Pour réussir ce cours, vous devrez avoir suivi les cours 1, 2 et 3 de cette Specializations ou l'équivalent. A la fin de ce cours, vous serez en mesure de :


Un système complet d'apprentissage par renforcement (Capstone)
Économisez sur les compétences qui vous font briller avec 40 % de réduction sur 3 mois de Coursera Plus. Économisez maintenant


Un système complet d'apprentissage par renforcement (Capstone)
Ce cours fait partie de Spécialisation "Apprentissage par renforcement"


Instructeurs : Martha White
25 373 déjà inscrits
Inclus avec
653 avis
Expérience recommandée
Compétences que vous acquerrez
- Catégorie : Ingénierie des fonctionnalités
- Catégorie : Modèle de Markov
- Catégorie : Algorithmes d'apprentissage automatique
- Catégorie : Apprentissage automatique
- Catégorie : Réseaux neuronaux artificiels
- Catégorie : Systèmes agentiques
- Catégorie : Architecture de la solution
- Catégorie : Évaluation du modèle
- Catégorie : Optimisation du modèle
- Catégorie : Modèle de formation
- Catégorie : Développement de systèmes
- Catégorie : Apprentissage par renforcement
- Catégorie : Algorithmes
- Catégorie : Méthodes d'apprentissage automatique
- Catégorie : Optimisation des performances
Détails à connaître

Ajouter à votre profil LinkedIn
2 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 6 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeurs


En savoir plus sur Apprentissage automatique

University of Alberta

University of Alberta

University of Alberta
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Avis des étudiants
- 5 stars
78,10 %
- 4 stars
15,77 %
- 3 stars
5,05 %
- 2 stars
0,61 %
- 1 star
0,45 %
Affichage de 3 sur 653
Révisé le 17 avr. 2020
The project seems to be complicated at first glance, but the notebook will guide you through the implementation, and you will know what you are doing eventually.
Révisé le 2 août 2020
One of the most amazing set of courses that I have ever been through. This neither makes the stuff look difficult nor does it compromise on quality, absolutely the best.
Révisé le 10 juil. 2020
Strongly recommend this course to others. The project could be a little more challenging though. Thanks, Martha, Adam, and RAs, for your good teaching!
Foire Aux Questions
Plus de questions
Aide financière disponible,






