Coursera
Benchmark & Optimize LLM App Performance

Profitez d'une croissance illimitée avec un an de Coursera Plus pour 199 $ (régulièrement 399 $). Économisez maintenant.

Ce cours n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Benchmark & Optimize LLM App Performance

Starweaver
Karlis Zars

Instructeurs : Starweaver

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

4 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

4 heures à compléter
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Optimize LLM behavior using structured prompting and self-checks to reduce variance and errors.

  • Design scalable middleware to manage API requests, retries, caching, and token budgets for performance targets.

  • Build user-centered interfaces that collect feedback and improve LLM accuracy and user trust.

Compétences que vous acquerrez

  • Catégorie : Performance Testing
  • Catégorie : Tool Calling
  • Catégorie : Scalability
  • Catégorie : A/B Testing
  • Catégorie : LLM Application
  • Catégorie : Performance Tuning
  • Catégorie : Retrieval-Augmented Generation
  • Catégorie : Model Evaluation
  • Catégorie : API Design
  • Catégorie : Application Performance Management
  • Catégorie : Prompt Engineering
  • Catégorie : OpenAI API
  • Catégorie : Responsible AI

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

décembre 2025

Évaluations

1 devoir

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Build Next-Gen LLM Apps with LangChain & LangGraph
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 3 modules dans ce cours

This module establishes why performance is a product feature, not a backend afterthought. We connect latency, cost, and answer quality to user-perceived speed (p50 vs p95, jitter) and trust. You’ll define a minimal metric set-latency, throughput, tokens/sec, determinism, and win-rate-then build a lightweight benchmarking harness that runs a small eval set, logs prompts/outputs, and exports clean CSVs. By the end, you’ll have a reproducible baseline you can rerun on every change.

Inclus

4 vidéos2 lectures1 évaluation par les pairs

In this module, you'll trace where time actually goes: network hops, model inference, prompt bloat, and post-processing. You’ll learn practical prompt patterns that cut tokens without cutting quality, plus schema-first I/O that improves stability and parsing. We’ll add caching strategies for embeddings, RAG retrievals, and tool calls, including cache keys and invalidation rules to avoid stale answers. Expect clear heuristics for cold vs warm paths and a simple checklist to shave seconds-not just milliseconds.

Inclus

3 vidéos1 lecture1 évaluation par les pairs

The final module turns tuning into a disciplined workflow. You’ll run A/B/C tests across model tiers and prompt variants on the same dataset to compare latency, cost per task, and quality with simple stats - then pick a winner. We’ll cover safe scaling: concurrency limits, queues, backpressure, retries, timeouts, and graceful degradation/fallbacks. You’ll leave with a 30-day optimization plan and a production playbook that keeps your app fast, affordable, and reliable after launch.

Inclus

4 vidéos1 lecture1 devoir2 évaluations par les pairs

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Starweaver
Coursera
474 Cours912 887 apprenants

Offert par

Coursera

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions