Coursera

Benchmarking und Optimierung der LLM-Anwendungsleistung

Sichern Sie sich eines unserer besten Angebote mit Coursera Plus für 199 $ (normalerweise 399 $). Jetzt sparen.

Coursera

Benchmarking und Optimierung der LLM-Anwendungsleistung

Starweaver
Karlis Zars

Dozenten: Starweaver

Bei Coursera Plus enthalten

Fragen Sie Coursera

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

4 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

4 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Optimieren Sie das Verhalten von LLMs mithilfe strukturierter Eingabeaufforderungen und Selbstprüfungen, um Abweichungen und Fehler zu reduzieren.

  • Entwickeln Sie skalierbare Middleware zur Verwaltung von API-Anfragen, Wiederholungsversuchen, Caching und Token-Budgets, um die Leistungsziele zu erreichen.

  • Entwickeln Sie nutzerorientierte Benutzeroberflächen, die Feedback sammeln und die Genauigkeit von LLMs sowie das Vertrauen der Nutzer stärken.

Kompetenzen, die Sie erwerben

  • Kategorie: Werkzeuganrufe
  • Kategorie: Prompt-Muster
  • Kategorie: LLM-Bewerbung
  • Kategorie: Token-Optimierung
  • Kategorie: A/B-Tests
  • Kategorie: Abruf-erweiterte Erzeugung
  • Kategorie: Bewertung des Modells
  • Kategorie: Skalierbarkeit
  • Kategorie: Leistungsoptimierung
  • Kategorie: Modell-Optimierung
  • Kategorie: Leistungsprüfung

Werkzeuge, die Sie lernen werden

  • Kategorie: Schnelles Engineering

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

1 Aufgabe

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung „LLM-Anwendungen der nächsten Generation mit LangChain & LangGraph erstellen“
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 3 Module

Dieses Modul verdeutlicht, warum Leistung ein Produktmerkmal ist und kein nachträglicher Einfall des Backends. Wir stellen einen Zusammenhang zwischen Latenz, Kosten und Antwortqualität einerseits und der vom Nutzer wahrgenommenen Geschwindigkeit (p50 vs. p95, Jitter) sowie dem Vertrauen andererseits her. Sie definieren einen minimalen Metrik-Satz – Latenz, Durchsatz, Tokens/Sek., Determinismus und Gewinnrate – und erstellen anschließend ein leichtgewichtiges Benchmarking-Tool, das einen kleinen Testdatensatz ausführt, Eingabeaufforderungen und Ausgaben protokolliert und übersichtliche CSV-Dateien exportiert. Am Ende verfügen Sie über eine reproduzierbare Basislinie, die Sie bei jeder Änderung erneut ausführen können.

Das ist alles enthalten

4 Videos2 Lektüren1 peer review

In diesem Modul werden Sie nachverfolgen, wohin die Zeit tatsächlich fließt: Netzwerk-Hops, Modellinferenz, überladene Prompts und Nachbearbeitung. Sie lernen praktische Prompt-Muster kennen, mit denen sich Tokens einsparen lassen, ohne die Qualität zu beeinträchtigen, sowie „Schema-First“-I/O, das die Stabilität und das Parsing verbessert. Wir werden Caching-Strategien für Embeddings, RAG-Abfragen und Tool-Aufrufe hinzufügen, einschließlich Cache-Schlüsseln und Invalidierungsregeln, um veraltete Antworten zu vermeiden. Freuen Sie sich auf klare Heuristiken für „Cold“- und „Warm“-Pfade sowie eine einfache Checkliste, mit der Sie Sekunden – und nicht nur Millisekunden – einsparen können.

Das ist alles enthalten

3 Videos1 Lektüre1 peer review

Das letzte Modul macht aus der Feinabstimmung einen strukturierten Arbeitsablauf. Sie führen A/B/C-Tests über verschiedene Modellstufen und Prompt-Varianten hinweg mit demselben Datensatz durch, um Latenz, Kosten pro Aufgabe und Qualität anhand einfacher Statistiken zu vergleichen – und wählen dann einen Gewinner aus. Wir behandeln das Thema sichere Skalierung: Parallelitätsgrenzen, Warteschlangen, Gegendruck, Wiederholungsversuche, Timeouts sowie sanfte Degradation und Fallbacks. Am Ende erhalten Sie einen 30-tägigen Optimierungsplan und ein Produktions-Playbook, mit dem Ihre App auch nach dem Start schnell, kostengünstig und zuverlässig bleibt.

Das ist alles enthalten

4 Videos1 Lektüre1 Aufgabe2 peer reviews

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozenten

Starweaver
Coursera
570 Kurse1.149.054 Lernende

von

Coursera

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen