Large language models (LLMs) are trained on human-generated text, but additional methods are needed to align an LLM with human values and preferences.
Reinforcement Learning from Human Feedback
Économisez sur les compétences qui vous font briller avec 40 % de réduction sur 3 mois de Coursera Plus. Économisez maintenant

(33 avis)
Expérience recommandée
Ce que vous apprendrez
Get a conceptual understanding of Reinforcement Learning from Human Feedback (RLHF), as well as the datasets needed for this technique.
Fine-tune the Llama 2 model using RLHF with the open source Google Cloud Pipeline Components Library.
Evaluate tuned model performance against the base model with evaluation methods.
Compétences que vous pratiquerez
- Catégorie : Model Optimization
- Catégorie : Model Evaluation
- Catégorie : Fine-tuning
- Catégorie : Model Training
- Catégorie : Reinforcement Learning
- Catégorie : Large Language Modeling
Détails à connaître
Disponible uniquement sur ordinateur
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Apprendre, pratiquer et appliquer des compétences prêtes à l’emploi en moins de 2 heures
- Bénéficiez d’une formation par des experts du secteur
- Gagnez en expérience pratique en effectuant des tâches professionnelles du monde réel

À propos de ce projet
Instructeur

Offert par
Méthode d’apprentissage
Apprentissage pratique basé sur des projets
Mettez en pratique de nouvelles compétences en effectuant des tâches professionnelles à l’aide d’instructions étape par étape.
Aucun téléchargement ou installation requis(e)
Accédez aux outils et aux ressources dont vous avez besoin dans un environnement cloud.
Disponible uniquement sur ordinateur de bureau
Ce projet est conçu pour les ordinateurs portables ou de bureau disposant d’une connexion internet fiable, et non pour les appareils mobiles.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Avis des étudiants
- 5 stars
69,69 %
- 4 stars
27,27 %
- 3 stars
3,03 %
- 2 stars
0 %
- 1 star
0 %
Affichage de 3 sur 33
Révisé le 18 juin 2025
better to be expanded a bit, but overall, it is super course
Révisé le 11 janv. 2025
Overall worth a shot. Not in depth but good overview
Vous aimerez peut-être aussi
Statut : Essai gratuitUniversity of Alberta
Statut : Essai gratuit
Statut : Essai gratuit
Statut : PrévisualisationColumbia University


