DeepLearning.AI

Reinforcement Learning from Human Feedback

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Ce projet n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues. Consultez les langues disponibles.
DeepLearning.AI

Reinforcement Learning from Human Feedback

Nikita Namjoshi

Instructeur : Nikita Namjoshi

3 538 déjà inscrits

Développez des compétences professionnelles recherchées grâce à des instructions étape par étape
4.6

(34 avis)

niveau Intermédiaire

Expérience recommandée

1 hour
Apprenez à votre propre rythme
Développez des compétences professionnelles recherchées grâce à des instructions étape par étape
4.6

(34 avis)

niveau Intermédiaire

Expérience recommandée

1 hour
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Get a conceptual understanding of Reinforcement Learning from Human Feedback (RLHF), as well as the datasets needed for this technique.

  • Fine-tune the Llama 2 model using RLHF with the open source Google Cloud Pipeline Components Library.

  • Evaluate tuned model performance against the base model with evaluation methods.

Compétences que vous pratiquerez

  • Catégorie : Model Optimization
  • Catégorie : Model Evaluation
  • Catégorie : Large Language Modeling
  • Catégorie : Model Training
  • Catégorie : Reinforcement Learning
  • Catégorie : Fine-tuning

Détails à connaître

Enseigné en Anglais
Aucun téléchargement ou installation requis(e)

Disponible uniquement sur ordinateur

Un apprentissage pratique

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Apprendre, pratiquer et appliquer des compétences prêtes à l’emploi en moins de 2 heures

  • Bénéficiez d’une formation par des experts du secteur
  • Gagnez en expérience pratique en effectuant des tâches professionnelles du monde réel

À propos de ce projet

Instructeur

Évaluations de l’enseignant
(8 évaluations)
Nikita Namjoshi
DeepLearning.AI
3 Cours8 135 apprenants

Offert par

DeepLearning.AI

Méthode d’apprentissage

  • Apprentissage pratique basé sur des projets

    Mettez en pratique de nouvelles compétences en effectuant des tâches professionnelles à l’aide d’instructions étape par étape.

  • Aucun téléchargement ou installation requis(e)

    Accédez aux outils et aux ressources dont vous avez besoin dans un environnement cloud.

  • Disponible uniquement sur ordinateur de bureau

    Ce projet est conçu pour les ordinateurs portables ou de bureau disposant d’une connexion internet fiable, et non pour les appareils mobiles.

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

  • 5 stars

    67,64 %

  • 4 stars

    29,41 %

  • 3 stars

    2,94 %

  • 2 stars

    0 %

  • 1 star

    0 %

Affichage de 3 sur 34

ME

Révisé le 11 janv. 2025

Vous aimerez peut-être aussi

Foire Aux Questions