„LLMs bewerten: Testen und Signifikanz nachweisen“ ist ein Kurs für Fortgeschrittene, der sich an ML-Ingenieure, KI-Praktiker und Datenwissenschaftler richtet, deren Aufgabe es ist, den Nutzen von Modellaktualisierungen nachzuweisen. Bei wichtigen Entscheidungen zur Modellbereitstellung reicht ein einfacher Genauigkeitswert nicht aus. In diesem Kurs lernen Sie statistische Methoden kennen, mit denen Sie Leistungsverbesserungen von LLMs rigoros validieren können. Sie lernen, Unsicherheiten durch die Berechnung und Interpretation von Konfidenzintervallen zu quantifizieren und durch formale Hypothesentests wie den Chi-Quadrat-Test nachzuweisen, ob Änderungen aussagekräftig sind. In praktischen Übungen mit Python-Bibliotheken wie SciPy und Matplotlib analysieren Sie Modellausgaben, prüfen die statistische Signifikanz und erstellen aussagekräftige Visualisierungen mit Fehlerbalken, mit denen Sie Ihre Ergebnisse den Beteiligten klar vermitteln können. Am Ende dieses Kurses werden Sie in der Lage sein, über subjektive Bewertungen wie „es scheint besser zu sein“ hinauszugehen und selbstbewusst zu sagen: „Wir können beweisen, dass es besser ist“, sodass jede Entscheidung zur Bereitstellung durch fundierte statistische Belege gestützt wird.

LLMs auswerten: Testen und Beweisen der Signifikanz
Sichern Sie sich eines unserer besten Angebote mit Coursera Plus für 199 $ (normalerweise 399 $). Jetzt sparen.

LLMs auswerten: Testen und Beweisen der Signifikanz
Dieser Kurs ist Teil von Spezialisierung „LLM Optimierung & Bewertung“

Dozent: LearningMate
Bei enthalten
Empfohlene Erfahrung
Was Sie lernen werden
Bewerten Sie die Leistung von LLMs gründlich mithilfe statistischer Tests und Konfidenzintervalle, um datengestützte Entscheidungen zur Bereitstellung zu treffen.
Kompetenzen, die Sie erwerben
- Kategorie: Statistische Programmierung
- Kategorie: Statistische Visualisierung
- Kategorie: Matplotlib
- Kategorie: Statistische Inferenz
- Kategorie: Bewertung des Modells
- Kategorie: Präsentation der Daten
- Kategorie: Datengestützte Entscheidungsfindung
- Kategorie: Modellierung großer Sprachen
- Kategorie: Wissenschaftliche Visualisierung
- Kategorie: Statistik
- Kategorie: Statistische Analyse
- Kategorie: Experimentieren
- Kategorie: Statistische Methoden
- Kategorie: Daten-Storytelling
- Kategorie: Leistungsmetrik
- Kategorie: Statistische Hypothesenprüfung
Werkzeuge, die Sie lernen werden
- Kategorie: Modell-Einsatz
- Kategorie: Statistische Software
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 1 Modul
Erwerben Sie ein Karrierezertifikat.
Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
Dozent

von
Mehr von Maschinelles Lernen entdecken
Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Häufig gestellte Fragen
Weitere Fragen
Finanzielle Unterstützung verfügbar,
¹ Einige Aufgaben in diesem Kurs werden mit AI bewertet. Für diese Aufgaben werden Ihre Daten in Übereinstimmung mit Datenschutzhinweis von Courseraverwendet.








