Large language models (LLMs) are trained on human-generated text, but additional methods are needed to align an LLM with human values and preferences.
Reinforcement Learning from Human Feedback
Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

(34 avis)
Expérience recommandée
Ce que vous apprendrez
Get a conceptual understanding of Reinforcement Learning from Human Feedback (RLHF), as well as the datasets needed for this technique.
Fine-tune the Llama 2 model using RLHF with the open source Google Cloud Pipeline Components Library.
Evaluate tuned model performance against the base model with evaluation methods.
Compétences que vous pratiquerez
- Catégorie : Model Optimization
- Catégorie : Model Evaluation
- Catégorie : Large Language Modeling
- Catégorie : Model Training
- Catégorie : Reinforcement Learning
- Catégorie : Fine-tuning
Détails à connaître
Disponible uniquement sur ordinateur
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Apprendre, pratiquer et appliquer des compétences prêtes à l’emploi en moins de 2 heures
- Bénéficiez d’une formation par des experts du secteur
- Gagnez en expérience pratique en effectuant des tâches professionnelles du monde réel

À propos de ce projet
Instructeur

Offert par
Méthode d’apprentissage
Apprentissage pratique basé sur des projets
Mettez en pratique de nouvelles compétences en effectuant des tâches professionnelles à l’aide d’instructions étape par étape.
Aucun téléchargement ou installation requis(e)
Accédez aux outils et aux ressources dont vous avez besoin dans un environnement cloud.
Disponible uniquement sur ordinateur de bureau
Ce projet est conçu pour les ordinateurs portables ou de bureau disposant d’une connexion internet fiable, et non pour les appareils mobiles.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Avis des étudiants
- 5 stars
67,64 %
- 4 stars
29,41 %
- 3 stars
2,94 %
- 2 stars
0 %
- 1 star
0 %
Affichage de 3 sur 34
Révisé le 11 janv. 2025
Overall worth a shot. Not in depth but good overview
Vous aimerez peut-être aussi
Statut : Essai gratuitUniversity of Alberta
Statut : Essai gratuit
Statut : Essai gratuit
Statut : PrévisualisationColumbia University



