Kann ich die Arbeit aus meinem Projekt herunterladen, nachdem ich sie abgeschlossen habe?

Ja, Sie können alle von Ihnen erstellten Dateien aus dem Projekt herunterladen und behalten. Dazu müssen Sie jegliche Dateien und Arbeiten vor Verlassen der Produktumgebung auf Ihrem Gerät speichern.

Ist finanzielle Unterstützung möglich?

Für Projekte ist keine finanzielle Unterstützung verfügbar.

Kann ich an einem Projekt als Hörer teilnehmen?

Die Teilnahme als Hörer ist bei Projekten nicht möglich.

Wie viel Erfahrung brauche ich für dieses Projekt?

Oben auf der Seite können Sie das empfohlene Erfahrungsniveau für dieses Projekt sehen.

Kann ich dieses Projekt über meinen Webbrowser abschließen, anstatt spezielle Software zu installieren?

Ja, alles, was Sie zum Abschluss Ihres Projekts benötigen, wird über Ihren Browser bereitgestellt.

Reinforcement Learning from Human Feedback

Sichern Sie sich eines unserer besten Angebote mit Coursera Plus für 199 $ (normalerweise 399 $). Jetzt sparen.

projekt ist nicht verfügbar in Deutsch (Deutschland)

Wir übersetzen es in weitere Sprachen. Sehen Sie sich die Sprachen an, die wir anbieten.

Reinforcement Learning from Human Feedback

Dozent: Nikita Namjoshi

3.533 bereits angemeldet

Fragen Sie Coursera

Projekt

Bauen Sie mit detaillierten Anweisungen gefragte Jobkompetenzen auf.

4.6

(34 Bewertungen)

Stufe Mittel

Empfohlene Erfahrung

1 hour

In Ihrem eigenen Lerntempo lernen

Praktisches Lernen

Mehr erfahren

Projekt

Bauen Sie mit detaillierten Anweisungen gefragte Jobkompetenzen auf.

4.6

(34 Bewertungen)

Stufe Mittel

Empfohlene Erfahrung

1 hour

In Ihrem eigenen Lerntempo lernen

Praktisches Lernen

Mehr erfahren

Was Sie lernen werden

Get a conceptual understanding of Reinforcement Learning from Human Feedback (RLHF), as well as the datasets needed for this technique.
Fine-tune the Llama 2 model using RLHF with the open source Google Cloud Pipeline Components Library.
Evaluate tuned model performance against the base model with evaluation methods.

Kompetenzen, die Sie festigen

Kategorie: Large Language Modeling
Kategorie: Model Evaluation
Kategorie: Reinforcement Learning
Kategorie: Fine-tuning
Kategorie: Model Training
Kategorie: Model Optimization

Wichtige Details

Unterrichtet in Englisch

Keine Downloads oder Installation erforderlich

Nur als Desktop-Version verfügbar

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Weitere Informationen zu Coursera für Unternehmen

Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Lernen, Üben und Anwenden von berufsrelevanten Fähigkeiten in weniger als 2 Stunden

Nehmen Sie an Schulungen von Branchenexperten teil
Sammeln Sie mit Aufgaben aus der realen Welt praktische Erfahrung

Über dieses Projekt

Large language models (LLMs) are trained on human-generated text, but additional methods are needed to align an LLM with human values and preferences.

Reinforcement Learning from Human Feedback (RLHF) is currently the main method for aligning LLMs with human values and preferences. RLHF is also used for further tuning a base LLM to align with values and preferences that are specific to your use case. In this course, you will gain a conceptual understanding of the RLHF training process, and then practice applying RLHF to tune an LLM. You will: 1. Explore the two datasets that are used in RLHF training: the “preference” and “prompt” datasets. 2. Use the open source Google Cloud Pipeline Components Library, to fine-tune the Llama 2 model with RLHF. 3. Assess the tuned LLM against the original base model by comparing loss curves and using the “Side-by-Side (SxS)” method.

Dozent

Lehrkraftbewertungen

(8 Bewertungen)

Nikita Namjoshi

DeepLearning.AI

3 Kurse8.129 Lernende

von

DeepLearning.AI

Was Sie beim Lernen erwartet

Praktisches, projektbasiertes Lernen
Üben Sie die Anwendung neuer Kompetenzen, indem Sie berufsbezogene Aufgaben anhand von detaillierten Anweisungen lösen.
Keine Downloads oder Installation erforderlich
Greifen Sie in einer Cloud-Umgebung auf die Tools und Ressourcen zu.
Nur für Desktop verfügbar
Dieses Projekt ist für die Bearbeitung an einem Laptop oder Desktop-Computer mit stabiler Internetverbindung konzipiert und nicht für Mobilgeräte.

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018

„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020

„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021

„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Bewertungen von Lernenden

5 stars
67,64 %
4 stars
29,41 %
3 stars
2,94 %
2 stars
0 %
1 star
0 %

Zeigt 3 von 34 an

Geprüft am 11. Jan. 2025

Overall worth a shot. Not in depth but good overview

Weitere Bewertungen anzeigen

Ihnen könnte auch Folgendes gefallen:

Status: Vorschau
Columbia University
Decision Making and Reinforcement Learning
Kurs
Status: Kostenloser Testzeitraum
Pearson
Quick Start Guide to Large Language Models (LLMs): Unit 3
Kurs
Status: Vorschau
Simplilearn
Q Learning in Reinforcement Training Basics
Kurs
Status: Kostenloser Testzeitraum
New York University
Reinforcement Learning in Finance
Kurs

Häufig gestellte Fragen

Bei Projekten absolvieren Sie eine Aktivität oder ein Szenario, indem Sie in einer interaktiven, praxisnahen Umgebung eine Reihe von Anweisungen befolgen. Projekte werden in einer echten Cloud-Umgebung und in echten Instanzen verschiedener Produkte bearbeitet, nicht in einer Simulation oder Demo-Umgebung.

Mit dem Kauf eines Projekts erhalten Sie alles, was Sie zum Abschluss des Projekts benötigen, einschließlich des vorübergehenden Zugriffs auf jedes Produkt, das zum Abschluss des Projekts nötig ist.

Auch wenn Projekte theoretisch auf Mobilgeräten verfügbar sind, empfehlen wir Ihnen dringend, sie nur auf einem Laptop oder Desktop-Computer zu bearbeiten.

Weitere Fragen

Besuchen Sie die das Hilfe-Center für Kursteilnehmer.

Reinforcement Learning from Human Feedback

projekt ist nicht verfügbar in Deutsch (Deutschland)

Reinforcement Learning from Human Feedback

Was Sie lernen werden

Kompetenzen, die Sie festigen

Wichtige Details

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Lernen, Üben und Anwenden von berufsrelevanten Fähigkeiten in weniger als 2 Stunden