Modellevaluation und Benchmarking

Dieser Kurs ist Teil von Offene generative KI: Aufbau mit offenen Modellen und Werkzeugen (berufsbezogenes Zertifikat)

Dozent: Professionals from the Industry

Bei Mehr erfahren enthalten

Fragen Sie Coursera

3 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

7 Stunden zu vervollständigen

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

3 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

7 Stunden zu vervollständigen

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

Kompetenzen, die Sie erwerben

Kategorie: Kontinuierliche Überwachung
Kategorie: Erstellung des Dashboards
Kategorie: Datenvisualisierung
Kategorie: Modellierung großer Sprachen
Kategorie: Einbettungen
Kategorie: Bildqualität
Kategorie: Bildanalyse
Kategorie: Bewertung des Modells

Werkzeuge, die Sie lernen werden

Kategorie: Generative KI
Kategorie: Dashboard

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

Februar 2026

Bewertungen

2 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Weitere Informationen zu Coursera für Unternehmen

Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihr Fachwissen im Bereich Maschinelles Lernen

Dieser Kurs ist Teil der Spezialisierung Offene generative KI: Aufbau mit offenen Modellen und Werkzeugen (berufsbezogenes Zertifikat)

Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für dieses berufsbezogene Zertifikat angemeldet.

Lernen Sie neue Konzepte von Branchenexperten
Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
Erwerben Sie ein Berufszertifikat von Coursera zur Vorlage

In diesem Kurs gibt es 3 Module

Der Kurs „Modellbewertung und Benchmarking“ richtet sich an Entwickler, Ingenieure und technische Produktentwickler, die sich noch nicht mit generativer KI auskennen, aber bereits über fortgeschrittene Kenntnisse im Bereich des maschinellen Lernens, grundlegende Python-Kenntnisse und Erfahrung mit Entwicklungsumgebungen wie VS Code verfügen und die offene generative KI-Lösungen entwickeln, anpassen und bereitstellen möchten, ohne dabei in eine Anbieterabhängigkeit zu geraten.

Der Kurs vermittelt den Teilnehmern die Fähigkeiten, die Leistung sowohl von text- als auch von bildgenerierenden Modellen zu bewerten und zu vergleichen. Ausgehend von der Textbewertung wenden die Teilnehmer Standardmetriken wie Perplexity, BLEU (Bilingual Evaluation Understudy), ROUGE (Recall-Oriented Understudy for Gisting Evaluation) und BERTScore an und entwerfen gleichzeitig Protokolle für die menschliche Bewertung sowie aufgabenspezifische Methoden für Anwendungen wie Zusammenfassung oder Übersetzung. Anschließend befasst sich der Kurs mit der Bildauswertung unter Verwendung technischer Metriken, darunter FID (Fréchet Inception Distance), CLIP-Ähnlichkeit (Contrastive Language–Image Pretraining similarity) und SSIM (Structural Similarity Index Measure), sowie mit auf der menschlichen Wahrnehmung basierenden Bewertungstechniken und Systemen zur Artefakterkennung. Im abschließenden Modul entwerfen die Teilnehmer umfassende Benchmarking-Frameworks mit reproduzierbaren Testumgebungen, Versionskontrolle und Visualisierungs-Dashboards zur kontinuierlichen Überwachung. Am Ende des Kurses sind die Teilnehmer in der Lage, automatisierte, domänenspezifische Bewertungssysteme zu implementieren und detaillierte Leistungsberichte zu erstellen, die sicherstellen, dass generative Modelle strenge Qualitätsstandards erfüllen.

Erfahren Sie, wie Sie Textmodelle sowohl mithilfe automatisierter Metriken als auch mit menschenzentrierten Methoden bewerten können. Sie werden wichtige Kennzahlen wie Perplexity, BLEU (Bilingual Evaluation Understudy), ROUGE (Recall-Oriented Understudy for Gisting Evaluation) und BERTScore anwenden und verstehen, wann die jeweiligen Kennzahlen am nützlichsten sind. Außerdem entwerfen Sie Protokolle für die menschliche Bewertung und erstellen automatisierte Pipelines, wodurch Sie auf praktische Weise beurteilen können, ob Ihre feinabgestimmten Modelle die Leistung verbessern.

Das ist alles enthalten

4 Videos2 Lektüren1 Aufgabe1 Unbewertetes Labor

4 VideosInsgesamt 26 Minuten

Podcast: Die Probleme, für deren Lösung Textmetriken entwickelt wurden3 Minuten
Ihre erste Auswertungs-Pipeline mit Hugging Face8 Minuten
Erweiterte Auswertung: Feedback von Menschen und umfassende Berichterstattung5 Minuten
Warum statistische Tests wichtig sind10 Minuten

2 LektürenInsgesamt 34 Minuten

Transkripte der Code-Demonstrationen4 Minuten
Ihr unverzichtbares Werkzeugset: Kennzahlen zur Textbewertung30 Minuten

1 AufgabeInsgesamt 30 Minuten

Die Wahl der besten Kennzahl für die jeweilige Aufgabe30 Minuten

1 Unbewertetes LaborInsgesamt 60 Minuten

Führen Sie Ihre erste Bewertung eines Textmodells durch60 Minuten

Erfahren Sie, wie sich die Qualität von Bildern messen lässt, die durch Diffusions- und andere generative Modelle erzeugt wurden. Sie werden technische Metriken wie den Fréchet-Inception-Abstand (FID), den Structural Similarity Index Measure (SSIM) und die CLIP-Ähnlichkeit (Contrastive Language–Image Pretraining) implementieren und diese mit auf der menschlichen Wahrnehmung basierenden Prüfungen hinsichtlich Stil, Genauigkeit und Konsistenz abgleichen. Außerdem automatisieren Sie die Artefakterkennung und Qualitätskontrolle und erwerben so die Fähigkeiten, versteckte Fehler aufzudecken und sicherzustellen, dass Ihre Bildausgaben professionellen Standards entsprechen.

Das ist alles enthalten

3 Videos1 Lektüre1 Unbewertetes Labor

3 VideosInsgesamt 23 Minuten

Podcast: Die verborgenen Probleme, die Bildmetriken aufdecken5 Minuten
Bewertung und Automatisierung der Bildqualität mit TorchMetrics10 Minuten
Fortschrittliche Bildqualität: FID, CLIP und automatisierte Gates8 Minuten

1 LektüreInsgesamt 30 Minuten

Die wichtigsten Kennzahlen zur Bildqualität30 Minuten

1 Unbewertetes LaborInsgesamt 60 Minuten

Führen Sie Ihre erste Bildmodell-Bewertung durch60 Minuten

Erfahren Sie, wie Sie Benchmarks entwerfen, die Modellvergleiche zuverlässig und reproduzierbar machen. Sie erstellen domänenspezifische Bewertungsdatensätze, entwickeln Dashboards zur Visualisierung der Ergebnisse und automatisieren Berichtssysteme für die kontinuierliche Überwachung. Diese Vorgehensweisen helfen Ihnen dabei, Verbesserungen nachzuverfolgen, Leistungsprobleme frühzeitig zu erkennen und durch transparente, wiederholbare Bewertungen Vertrauen in Ihre Arbeit aufzubauen.

Das ist alles enthalten

3 Videos1 Lektüre1 Aufgabe1 Unbewertetes Labor

3 VideosInsgesamt 15 Minuten

Podcast: Der Wert von Benchmarks in KI-Workflows6 Minuten
Modellausgaben in aussagekräftige Vergleiche umwandeln7 Minuten
Podcast: Alles unter einen Hut bringen: Benchmarking, das Vertrauen schafft2 Minuten

1 LektüreInsgesamt 15 Minuten

So entwirft man aussagekräftige Benchmarks15 Minuten

1 AufgabeInsgesamt 60 Minuten

Umfassende Benchmarking-Prüfung60 Minuten

1 Unbewertetes LaborInsgesamt 60 Minuten

Einen Mini-Benchmark durchführen60 Minuten

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozent

Professionals from the Industry

513 Kurse122.725 Lernende

von

Coursera

Mehr von Maschinelles Lernen entdecken

Status: Kostenloser Testzeitraum
Coursera
Evaluate Language Models: Metrics for Success
Kurs
Status: Kostenloser Testzeitraum
Simplilearn
LLM Benchmarking and Evaluation Training
Kurs
Status: Kostenloser Testzeitraum
Coursera
Evaluate, Analyze, and Model Performance
Kurs
Status: Kostenloser Testzeitraum
Simplilearn
Foundations of Generative AI Models
Kurs

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018

„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020

„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021

„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Schalten Sie den Zugang zu mehr als 10.000 Kursen mit einem Abonnement frei
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich den über 4.700 globalen Unternehmen an, die Coursera for Business wählen

Häufig gestellte Fragen

Um auf Kursmaterialien und Aufgaben zugreifen zu können und ein Zertifikat zu erwerben, müssen Sie bei der Anmeldung zu einem Kurs die Option „Zertifikat“ erwerben. Berechtigte Lernende haben möglicherweise auch die Möglichkeit, mit einer kostenlosen Testphase zu beginnen. Bei einigen Kursen wird möglicherweise auch die Option „Vollständiger Kurs, kein Zertifikat“ angeboten. Damit haben Sie Zugriff auf die Kursmaterialien, können die erforderlichen Prüfungen einreichen und erhalten eine Abschlussnote, können jedoch kein Zertifikat erwerben oder erhalten.

Wenn Sie sich für den Kurs anmelden, erhalten Sie Zugang zu allen Kursen des Zertifikats, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird zu Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen.