Large language models (LLMs) are trained on human-generated text, but additional methods are needed to align an LLM with human values and preferences.
Reinforcement Learning from Human Feedback
Sichern Sie sich eines unserer besten Angebote mit Coursera Plus für 199 $ (normalerweise 399 $). Jetzt sparen.

Fragen Sie Coursera
(34 Bewertungen)
Empfohlene Erfahrung
Was Sie lernen werden
Get a conceptual understanding of Reinforcement Learning from Human Feedback (RLHF), as well as the datasets needed for this technique.
Fine-tune the Llama 2 model using RLHF with the open source Google Cloud Pipeline Components Library.
Evaluate tuned model performance against the base model with evaluation methods.
Kompetenzen, die Sie festigen
- Kategorie: Large Language Modeling
- Kategorie: Model Evaluation
- Kategorie: Reinforcement Learning
- Kategorie: Fine-tuning
- Kategorie: Model Training
- Kategorie: Model Optimization
Wichtige Details
Nur als Desktop-Version verfügbar
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Lernen, Üben und Anwenden von berufsrelevanten Fähigkeiten in weniger als 2 Stunden
- Nehmen Sie an Schulungen von Branchenexperten teil
- Sammeln Sie mit Aufgaben aus der realen Welt praktische Erfahrung

Über dieses Projekt
Dozent

Was Sie beim Lernen erwartet
Praktisches, projektbasiertes Lernen
Üben Sie die Anwendung neuer Kompetenzen, indem Sie berufsbezogene Aufgaben anhand von detaillierten Anweisungen lösen.
Keine Downloads oder Installation erforderlich
Greifen Sie in einer Cloud-Umgebung auf die Tools und Ressourcen zu.
Nur für Desktop verfügbar
Dieses Projekt ist für die Bearbeitung an einem Laptop oder Desktop-Computer mit stabiler Internetverbindung konzipiert und nicht für Mobilgeräte.
Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Bewertungen von Lernenden
- 5 stars
67,64 %
- 4 stars
29,41 %
- 3 stars
2,94 %
- 2 stars
0 %
- 1 star
0 %
Zeigt 3 von 34 an
Geprüft am 11. Jan. 2025
Overall worth a shot. Not in depth but good overview
Ihnen könnte auch Folgendes gefallen:
Status: VorschauColumbia University
Status: Kostenloser Testzeitraum
Status: VorschauSimplilearn
Status: Kostenloser TestzeitraumNew York University



