Benchmarking und Optimierung der LLM-Anwendungsleistung

Sichern Sie sich eines unserer besten Angebote mit Coursera Plus für 199 $ (normalerweise 399 $). Jetzt sparen.

Benchmarking und Optimierung der LLM-Anwendungsleistung

Dieser Kurs ist Teil von Spezialisierung „LLM-Anwendungen der nächsten Generation mit LangChain & LangGraph erstellen“

Dozenten: Starweaver

Bei enthalten

Mehr erfahren

Fragen Sie Coursera

3 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

4 Stunden zu vervollständigen

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

3 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

4 Stunden zu vervollständigen

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

Optimieren Sie das Verhalten von LLMs mithilfe strukturierter Eingabeaufforderungen und Selbstprüfungen, um Abweichungen und Fehler zu reduzieren.
Entwickeln Sie skalierbare Middleware zur Verwaltung von API-Anfragen, Wiederholungsversuchen, Caching und Token-Budgets, um die Leistungsziele zu erreichen.
Entwickeln Sie nutzerorientierte Benutzeroberflächen, die Feedback sammeln und die Genauigkeit von LLMs sowie das Vertrauen der Nutzer stärken.

Kompetenzen, die Sie erwerben

Kategorie: Werkzeuganrufe
Kategorie: Prompt-Muster
Kategorie: LLM-Bewerbung
Kategorie: Token-Optimierung
Kategorie: A/B-Tests
Kategorie: Abruf-erweiterte Erzeugung
Kategorie: Bewertung des Modells
Kategorie: Skalierbarkeit
Kategorie: Leistungsoptimierung
Kategorie: Modell-Optimierung
Kategorie: Leistungsprüfung

Werkzeuge, die Sie lernen werden

Kategorie: Schnelles Engineering

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

1 Aufgabe

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Weitere Informationen zu Coursera für Unternehmen

Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung „LLM-Anwendungen der nächsten Generation mit LangChain & LangGraph erstellen“

Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.

Lernen Sie neue Konzepte von Branchenexperten
Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 3 Module

„Benchmark & Optimize LLM App Performance“ ist ein praxisorientierter Leitfaden, der Sie von „Es funktioniert“ zu „Es läuft wie geschmiert“ führt. Zunächst betrachten Sie Geschwindigkeit und Kosten als Produktmerkmale – Sie definieren eine Basislinie mit den richtigen Metriken (p50/p95-Latenz, Tokens/Sek., Durchsatz, Determinismus, Kosten pro Aufgabe) und erstellen ein schlankes Benchmarking-Tool, das Sie bei jeder Änderung erneut ausführen können. Anschließend lernen Sie, Engpässe im gesamten Stack – Netzwerk, Modell, Prompt und Nachbearbeitung – aufzuspüren. Dabei nutzen Sie praktische Muster, die die Anzahl der Tokens reduzieren, ohne die Qualität zu beeinträchtigen, sowie Caching-Strategien für Embeddings, RAG und Tool-Aufrufe. Anschließend führen Sie A/B/C-Experimente durch, um Modelle und Prompts anhand desselben Datensatzes zu vergleichen, interpretieren die Ergebnisse anhand einfacher Statistiken und wählen selbstbewusst einen Gewinner aus. Schließlich bereiten Sie das System mit Parallelitätsgrenzen, Warteschlangen, Timeouts, Fallbacks und einem 30-tägigen Optimierungsleitfaden für den Produktiveinsatz vor. Freuen Sie sich auf wiederverwendbare Vorlagen, übersichtliche Checklisten und realistische Demos, die für vielbeschäftigte Entwickler und Produktentwickler konzipiert sind, die messbare Fortschritte – und keinen Hype – anstreben.

Dieser Kurs richtet sich an Machine-Learning-Ingenieure, KI-Entwickler, Datenwissenschaftler und Produktingenieure, die LLM-basierte Anwendungen für Produktionsumgebungen optimieren und skalieren möchten. Er eignet sich außerdem ideal für Backend-Ingenieure und DevOps-Experten, die die Systemleistung steigern, die Latenz reduzieren und die Kosteneffizienz bei KI-Implementierungen verbessern möchten. Darüber hinaus profitieren Produktmanager und technische Leiter, die KI-gestützte Systeme betreuen, von den vermittelten praktischen Erkenntnissen. Diese helfen ihnen, die Anwendungsleistung zu verbessern und sicherzustellen, dass ihre LLM-Modelle zuverlässige, qualitativ hochwertige Ergebnisse in großem Maßstab liefern. Dieser Kurs setzt Grundkenntnisse in Python oder JavaScript, Vertrautheit mit REST-APIs sowie ein grundlegendes Verständnis der Funktionsweise von Large Language Models (LLMs) voraus. Diese Fähigkeiten helfen Ihnen dabei, sich effektiv mit den Kursinhalten auseinanderzusetzen, die Leistung zu optimieren und Lösungen zu implementieren. Am Ende dieses Kurses verfügen Sie über die Fähigkeiten, die LLM-Leistung zu optimieren, reale Engpässe zu beseitigen und effiziente, skalierbare KI-Systeme zu implementieren. Sie sind dann in der Lage, diese Techniken selbstbewusst anzuwenden und Ihre KI-Lösungen schneller, zuverlässiger und produktionsreif zu machen!

Dieses Modul verdeutlicht, warum Leistung ein Produktmerkmal ist und kein nachträglicher Einfall des Backends. Wir stellen einen Zusammenhang zwischen Latenz, Kosten und Antwortqualität einerseits und der vom Nutzer wahrgenommenen Geschwindigkeit (p50 vs. p95, Jitter) sowie dem Vertrauen andererseits her. Sie definieren einen minimalen Metrik-Satz – Latenz, Durchsatz, Tokens/Sek., Determinismus und Gewinnrate – und erstellen anschließend ein leichtgewichtiges Benchmarking-Tool, das einen kleinen Testdatensatz ausführt, Eingabeaufforderungen und Ausgaben protokolliert und übersichtliche CSV-Dateien exportiert. Am Ende verfügen Sie über eine reproduzierbare Basislinie, die Sie bei jeder Änderung erneut ausführen können.

Das ist alles enthalten

4 Videos2 Lektüren1 peer review

4 VideosInsgesamt 26 Minuten

Willkommen bei „Benchmarking von LLM-Apps“2 Minuten
Wichtige Kennzahlen: Latenz, Durchsatz und Token-Effizienz7 Minuten
Entwicklung eines minimalistischen Benchmark-Harnesses (Entwurfsbeschreibung)9 Minuten
Führen Sie Ihre erste Baseline durch und exportieren Sie die Daten8 Minuten

2 LektürenInsgesamt 10 Minuten

Willkommen zum Kurs: Kursübersicht5 Minuten
Bewährte Verfahren zur Bewertung (OpenAI-Dokumentation)5 Minuten

1 peer reviewInsgesamt 25 Minuten

Praktisches Lernen: Baseline oder nichts: Ihr erster reproduzierbarer Benchmark25 Minuten

In diesem Modul werden Sie nachverfolgen, wohin die Zeit tatsächlich fließt: Netzwerk-Hops, Modellinferenz, überladene Prompts und Nachbearbeitung. Sie lernen praktische Prompt-Muster kennen, mit denen sich Tokens einsparen lassen, ohne die Qualität zu beeinträchtigen, sowie „Schema-First“-I/O, das die Stabilität und das Parsing verbessert. Wir werden Caching-Strategien für Embeddings, RAG-Abfragen und Tool-Aufrufe hinzufügen, einschließlich Cache-Schlüsseln und Invalidierungsregeln, um veraltete Antworten zu vermeiden. Freuen Sie sich auf klare Heuristiken für „Cold“- und „Warm“-Pfade sowie eine einfache Checkliste, mit der Sie Sekunden – und nicht nur Millisekunden – einsparen können.

Das ist alles enthalten

3 Videos1 Lektüre1 peer review

3 VideosInsgesamt 22 Minuten

Entwicklung zuverlässiger API-Aufrufe für LLM-Anwendungen6 Minuten
Ratenbegrenzungen, Caching und Token-Budgetierung7 Minuten
Aufbau eines ausfallsicheren Backends für LLM-APIs8 Minuten

1 LektüreInsgesamt 5 Minuten

OpenAI-API-Referenz: Fehlerbehandlung und Ratenbegrenzungen5 Minuten

1 peer reviewInsgesamt 25 Minuten

Praktisches Lernen: Herausforderung zur Backend-Zuverlässigkeit: Clever lösen25 Minuten

Das letzte Modul macht aus der Feinabstimmung einen strukturierten Arbeitsablauf. Sie führen A/B/C-Tests über verschiedene Modellstufen und Prompt-Varianten hinweg mit demselben Datensatz durch, um Latenz, Kosten pro Aufgabe und Qualität anhand einfacher Statistiken zu vergleichen – und wählen dann einen Gewinner aus. Wir behandeln das Thema sichere Skalierung: Parallelitätsgrenzen, Warteschlangen, Gegendruck, Wiederholungsversuche, Timeouts sowie sanfte Degradation und Fallbacks. Am Ende erhalten Sie einen 30-tägigen Optimierungsplan und ein Produktions-Playbook, mit dem Ihre App auch nach dem Start schnell, kostengünstig und zuverlässig bleibt.

Das ist alles enthalten

4 Videos1 Lektüre1 Aufgabe2 peer reviews

4 VideosInsgesamt 27 Minuten

Warum Versuchsplanung besser ist als Raten8 Minuten
Sicheres Deployment: Canaries, Feature Flags und Rollbacks8 Minuten
Führen Sie einen A/B/C-Test durch und wählen Sie einen Gewinner aus7 Minuten
Nachbereitung des Kurses4 Minuten

1 LektüreInsgesamt 5 Minuten

Arbeiten mit Evals (OpenAI) – Entwerfen und Ausführen von Evals5 Minuten

1 AufgabeInsgesamt 20 Minuten

Benchmarking und Optimierung der LLM-Anwendungsleistung20 Minuten

2 peer reviewsInsgesamt 85 Minuten

Praktisches Lernen: Experiment Orchestrator: Von den Daten zur Entscheidung 25 Minuten
Projekt: Optimieren und Veröffentlichen Ihrer LLM-App v1.060 Minuten

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozenten

Starweaver

Coursera

570 Kurse1.149.054 Lernende

von

Coursera

Mehr von Maschinelles Lernen entdecken

Coursera
LLM-Modelle mit Zuversicht erstellen und anpassen
Kurs
Coursera
LLM APIs für Skalierbarkeit entwerfen und sichern
Kurs
Coursera
Messung der ML-Auswirkungen und des geschäftlichen Werts
Kurs
Coursera
Bereitstellung von robusten KI Microservices mit LangChain
Kurs

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018

„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020

„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021

„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen

Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.

Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzufügen.

Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.