LLMs auswerten: Testen und Beweisen der Signifikanz

Sichern Sie sich eines unserer besten Angebote mit Coursera Plus für 199 $ (normalerweise 399 $). Jetzt sparen.

LLMs auswerten: Testen und Beweisen der Signifikanz

Dieser Kurs ist Teil von Spezialisierung „LLM Optimierung & Bewertung“

Dozent: LearningMate

Bei enthalten

Mehr erfahren

1 Modul

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

3 Stunden zu vervollständigen

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

1 Modul

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

3 Stunden zu vervollständigen

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

Bewerten Sie die Leistung von LLMs gründlich mithilfe statistischer Tests und Konfidenzintervalle, um datengestützte Entscheidungen zur Bereitstellung zu treffen.

Kompetenzen, die Sie erwerben

Kategorie: Statistische Programmierung
Kategorie: Statistische Visualisierung
Kategorie: Matplotlib
Kategorie: Statistische Inferenz
Kategorie: Bewertung des Modells
Kategorie: Präsentation der Daten
Kategorie: Datengestützte Entscheidungsfindung
Kategorie: Modellierung großer Sprachen
Kategorie: Wissenschaftliche Visualisierung
Kategorie: Statistik
Kategorie: Statistische Analyse
Kategorie: Experimentieren
Kategorie: Statistische Methoden
Kategorie: Daten-Storytelling
Kategorie: Leistungsmetrik
Kategorie: Statistische Hypothesenprüfung

Werkzeuge, die Sie lernen werden

Kategorie: Modell-Einsatz
Kategorie: Statistische Software

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

3 Zuweisungen¹

KI-bewertet siehe Haftungsausschluss

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Weitere Informationen zu Coursera für Unternehmen

Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung „LLM Optimierung & Bewertung“

Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.

Lernen Sie neue Konzepte von Branchenexperten
Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 1 Modul

„LLMs bewerten: Testen und Signifikanz nachweisen“ ist ein Kurs für Fortgeschrittene, der sich an ML-Ingenieure, KI-Praktiker und Datenwissenschaftler richtet, deren Aufgabe es ist, den Nutzen von Modellaktualisierungen nachzuweisen. Bei wichtigen Entscheidungen zur Modellbereitstellung reicht ein einfacher Genauigkeitswert nicht aus. In diesem Kurs lernen Sie statistische Methoden kennen, mit denen Sie Leistungsverbesserungen von LLMs rigoros validieren können. Sie lernen, Unsicherheiten durch die Berechnung und Interpretation von Konfidenzintervallen zu quantifizieren und durch formale Hypothesentests wie den Chi-Quadrat-Test nachzuweisen, ob Änderungen aussagekräftig sind. In praktischen Übungen mit Python-Bibliotheken wie SciPy und Matplotlib analysieren Sie Modellausgaben, prüfen die statistische Signifikanz und erstellen aussagekräftige Visualisierungen mit Fehlerbalken, mit denen Sie Ihre Ergebnisse den Beteiligten klar vermitteln können. Am Ende dieses Kurses werden Sie in der Lage sein, über subjektive Bewertungen wie „es scheint besser zu sein“ hinauszugehen und selbstbewusst zu sagen: „Wir können beweisen, dass es besser ist“, sodass jede Entscheidung zur Bereitstellung durch fundierte statistische Belege gestützt wird.

Dieser Kurs bietet einen umfassenden Überblick darüber, wie sich die Leistung großer Sprachmodelle (LLMs) gründlich bewerten, validieren und kommunizieren lässt. Sie lernen zunächst, warum einzelne Kennzahlen nicht ausreichen, und lernen dann, Unsicherheiten mithilfe von Konfidenzintervallen zu quantifizieren, Verbesserungen durch Hypothesentests nachzuweisen und schließlich aussagekräftige Visualisierungen zu erstellen, um datengestützte Entscheidungen zur Bereitstellung zu untermauern.

Das ist alles enthalten

5 Videos2 Lektüren3 Aufgaben3 Unbewertete Labore

5 VideosInsgesamt 30 Minuten

Warum Einzelwerte irreführend sind8 Minuten
Screencast: Berechnung von Wilson-Intervallen in Python4 Minuten
Warum Bauchgefühle bei A/B-Tests versagen6 Minuten
Durchführung eines Chi-Quadrat-Tests in Python6 Minuten
Visualisierung von Konfidenzintervallen mit Matplotlib5 Minuten

2 LektürenInsgesamt 14 Minuten

Kernkonzepte: Zuversicht und Bedeutung8 Minuten
Geschichtenerzählen mit statistischen Darstellungen6 Minuten

3 AufgabenInsgesamt 40 Minuten

Abschlussprojekt: LLM-Bewertungsbericht30 Minuten
Quiz zu Konfidenzintervallen5 Minuten
Quiz zum Thema „Ergebnisse kommunizieren“5 Minuten

3 Unbewertete LaboreInsgesamt 110 Minuten

Übung 1: Quantifizierung der Modellgenauigkeit20 Minuten
Übung 2: Validierung einer Modellverbesserung30 Minuten
Übung 3: Erstellen einer Vergleichstabelle60 Minuten

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozent

LearningMate

276 Kurse34.962 Lernende

von

Coursera

Mehr von Maschinelles Lernen entdecken

Simplilearn
LLM Benchmarking and Evaluation Training
Kurs
Status: Kostenloser Testzeitraum
Kategorie: Credits angeboten
Coursera
Safeguard LLM Outputs: Test and Evaluate
Kurs
Status: Kostenloser Testzeitraum
Kategorie: Credits angeboten
Coursera
Evaluate & Optimize LLM Performance
Kurs
Status: Kostenloser Testzeitraum
Kategorie: Credits angeboten
Coursera
Evaluating LLM Performance and Efficiency
Kurs
Status: Kostenloser Testzeitraum
Kategorie: Credits angeboten

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018

„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020

„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021

„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen

Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.

Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzufügen.

Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.

Weitere Fragen

Besuchen Sie die das Hilfe-Center für Kursteilnehmer.

Finanzielle Unterstützung verfügbar,

¹ Einige Aufgaben in diesem Kurs werden mit AI bewertet. Für diese Aufgaben werden Ihre Daten in Übereinstimmung mit Datenschutzhinweis von Courseraverwendet.