Coursera

Spécialisation "LLM Optimization & Evaluation"

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Spécialisation "LLM Optimization & Evaluation"

Optimize & Deploy Production-Ready LLM Systems.

Build expertise in LLM evaluation, optimization, and deployment through hands-on MLOps projects.

John Whitworth
LearningMate

Instructeurs : John Whitworth

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Evaluate and optimize LLM performance using statistical testing, MLOps tools, and production monitoring systems.

  • Build automated pipelines for feature engineering, experiment tracking, and data processing with industry-standard tools.

  • Diagnose LLM errors, implement safety frameworks, and reduce operational costs through systematic analysis.

Compétences que vous acquerrez

  • Catégorie : AI Security
  • Catégorie : Data Pipelines
  • Catégorie : Data Presentation
  • Catégorie : Extract, Transform, Load
  • Catégorie : Fine-tuning
  • Catégorie : Large Language Modeling
  • Catégorie : LLM Application
  • Catégorie : MLOps (Machine Learning Operations)
  • Catégorie : Model Optimization
  • Catégorie : Performance Tuning
  • Catégorie : Prompt Patterns
  • Catégorie : Root Cause Analysis
  • Catégorie : Scripting
  • Catégorie : SQL
  • Catégorie : Statistical Analysis
  • Catégorie : Technical Communication
  • Catégorie : Technical Documentation
  • Catégorie : User Acceptance Testing (UAT)
  • Catégorie : Version Control

Outils que vous découvrirez

  • Catégorie : Apache Airflow
  • Catégorie : Python Programming

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

décembre 2025

91% of learners achieved a positive career outcome

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Coursera

Spécialisation - série de 13 cours

Engineer Features and Evaluate Models for Production

Engineer Features and Evaluate Models for Production

COURS 1, 3 heures

Ce que vous apprendrez

  • Build feature engineering pipelines and evaluate ML experiments using MLOps tools to select and deploy production-ready models.

Compétences que vous acquerrez

Catégorie : Technical Writing
Catégorie : Model Evaluation
Catégorie : Analysis
Catégorie : Feature Engineering
Catégorie : Data Transformation
Catégorie : Model Training
Catégorie : Performance Analysis
Catégorie : Model Optimization
Catégorie : Model Deployment
Catégorie : Machine Learning Methods
Catégorie : Data Preprocessing
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Data Pipelines
Optimize Deep Learning: Tune PyTorch Models

Optimize Deep Learning: Tune PyTorch Models

COURS 2, 4 heures

Ce que vous apprendrez

  • Use PyTorch Lightning to implement callbacks, diagnose instabilities, and optimize model performance.

Compétences que vous acquerrez

Catégorie : Debugging
Catégorie : Model Training
Catégorie : Fine-tuning
Catégorie : PyTorch (Machine Learning Library)
Catégorie : Deep Learning
Catégorie : Transfer Learning
Catégorie : Performance Tuning
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Artificial Neural Networks
Catégorie : Model Deployment
Catégorie : Scalability
Catégorie : Model Optimization
Evaluate & Optimize LLM Performance

Evaluate & Optimize LLM Performance

COURS 3, 4 heures

Ce que vous apprendrez

  • Evaluate LLMs using metrics like BLEU & ROUGE run A/B tests for statistical significance, and optimize model performance with data-driven strategies.

Compétences que vous acquerrez

Catégorie : Model Evaluation
Catégorie : Statistical Inference
Catégorie : Statistical Methods
Catégorie : Test Script Development
Catégorie : Statistical Analysis
Catégorie : Statistical Hypothesis Testing
Catégorie : Large Language Modeling
Catégorie : Performance Metric
Catégorie : Data-Driven Decision-Making
Catégorie : Probability & Statistics
Catégorie : Scripting
Catégorie : Prompt Engineering
Catégorie : Model Optimization
Catégorie : Natural Language Processing
Catégorie : Embeddings
Catégorie : LLM Application
Analyze Logs: Fix LLM Hallucinations

Analyze Logs: Fix LLM Hallucinations

COURS 4, 4 heures

Ce que vous apprendrez

  • Use data analysis to diagnose LLM hallucinations by correlating user behavior and system errors, and document findings to guide engineering fixes.

Compétences que vous acquerrez

Catégorie : Analysis
Catégorie : Technical Communication
Catégorie : Debugging
Catégorie : Data Manipulation
Catégorie : Generative AI
Catégorie : Large Language Modeling
Catégorie : Business Metrics
Catégorie : LLM Application
Catégorie : Artificial Intelligence
Catégorie : Data Analysis
Catégorie : Pandas (Python Package)
Catégorie : Root Cause Analysis
Catégorie : Retrieval-Augmented Generation
Catégorie : Correlation Analysis
Evaluate LLMs: Test and Prove Significance

Evaluate LLMs: Test and Prove Significance

COURS 5, 3 heures

Ce que vous apprendrez

  • Rigorously evaluate LLM performance using statistical tests and confidence intervals to make data-driven deployment decisions.

Compétences que vous acquerrez

Catégorie : Model Evaluation
Catégorie : Statistical Inference
Catégorie : Data Presentation
Catégorie : Statistical Visualization
Catégorie : Statistical Hypothesis Testing
Catégorie : Statistics
Catégorie : Scientific Visualization
Catégorie : Statistical Analysis
Catégorie : Data Storytelling
Catégorie : Statistical Software
Catégorie : Data-Driven Decision-Making
Catégorie : Model Deployment
Catégorie : Statistical Programming
Catégorie : Matplotlib
Catégorie : Experimentation
Catégorie : Large Language Modeling
Catégorie : Performance Metric
Catégorie : Statistical Methods
Optimize SQL: Build Fast Data Pipelines

Optimize SQL: Build Fast Data Pipelines

COURS 6, 3 heures

Ce que vous apprendrez

  • Parameterized SQL with CTEs and window functions builds scalable, maintainable pipelines that adapt as business needs change.

  • Query optimization is systematic: analyze execution plans, find costly steps, then resolve them with indexing or rewrites.

  • Materialized summary tables and well-timed processing, like morning refreshes, support reliable analytics infrastructure.

  • Understanding execution internals helps analysts build self-sufficient workflows without recurring engineering delays.

Compétences que vous acquerrez

Catégorie : SQL
Catégorie : Performance Tuning
Catégorie : Query Languages
Catégorie : Extract, Transform, Load
Catégorie : Data Pipelines
Catégorie : Data Manipulation
Catégorie : Scripting
Catégorie : Data Transformation
Catégorie : Database Management
Safeguard LLM Outputs: Test and Evaluate

Safeguard LLM Outputs: Test and Evaluate

COURS 7, 3 heures

Ce que vous apprendrez

  • Build and validate a robust safety testing framework for LLMs. Create behavioral test suites and use mutation testing to ensure their effectiveness.

Compétences que vous acquerrez

Catégorie : Security Testing
Catégorie : Software Technical Review
Catégorie : Software Testing
Catégorie : Model Evaluation
Catégorie : AI Security
Catégorie : Verification And Validation
Catégorie : Quality Assessment
Catégorie : LLM Application
Catégorie : Test Tools
Catégorie : Prompt Patterns
Catégorie : Large Language Modeling
Catégorie : Responsible AI
Catégorie : Test Case
Catégorie : Code Coverage
Catégorie : Threat Modeling
Catégorie : Unit Testing
Catégorie : Test Script Development
Catégorie : Prompt Engineering
Catégorie : Maintainability
Catégorie : Testability
Track and Evaluate ML Model Experiments

Track and Evaluate ML Model Experiments

COURS 8, 3 heures

Ce que vous apprendrez

  • Track, version, and evaluate ML experiments using DVC and W&B to reliably select and prepare models for production deployment.

Compétences que vous acquerrez

Catégorie : Model Evaluation
Catégorie : Version Control
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Dashboard
Catégorie : Machine Learning
Catégorie : Model Training
Catégorie : Model Deployment
Catégorie : Performance Analysis
Catégorie : Predictive Modeling
Catégorie : Data Management
Catégorie : Interactive Data Visualization
Catégorie : Large Language Modeling
Catégorie : Record Keeping
Automate Cloud Workflows with Python Scripting

Automate Cloud Workflows with Python Scripting

COURS 9, 1 heure

Ce que vous apprendrez

  • Create automated Python scripts to manage multi-step cloud workflows, from provisioning resources to persisting data.

Compétences que vous acquerrez

Catégorie : Scripting
Catégorie : Data Persistence
Catégorie : Infrastructure as Code (IaC)
Catégorie : Python Programming
Catégorie : Command-Line Interface
Catégorie : AI Workflows
Catégorie : Virtual Machines
Catégorie : Data Pipelines
Automate Data Pipelines: Schema Evolution

Automate Data Pipelines: Schema Evolution

COURS 10, 2 heures

Ce que vous apprendrez

  • Build automated data pipelines with Apache Airflow, manage schema evolution to prevent failures, and implement monitoring for data integrity.

Compétences que vous acquerrez

Catégorie : Apache Airflow
Catégorie : Data Integrity
Catégorie : Data Pipelines
Catégorie : Extract, Transform, Load
Catégorie : Data Validation
Catégorie : System Monitoring
Catégorie : Data Modeling
Catégorie : Continuous Monitoring
Catégorie : Data Quality
Catégorie : Data Transformation
Develop and Evaluate LLM Features Effectively

Develop and Evaluate LLM Features Effectively

COURS 11, 3 heures

Ce que vous apprendrez

  • Translate an LLM product concept into a detailed PRD and create a UAT plan to validate that the delivered feature meets user requirements.

Compétences que vous acquerrez

Catégorie : User Acceptance Testing (UAT)
Catégorie : Functional Requirement
Catégorie : User Requirements Documents
Catégorie : Verification And Validation
Catégorie : Functional Testing
Catégorie : Acceptance Testing
Catégorie : LLM Application
Catégorie : Product Requirements
Catégorie : Key Performance Indicators (KPIs)
Catégorie : Requirements Analysis
Catégorie : Business Requirements
Catégorie : Prioritization
Catégorie : Large Language Modeling
Catégorie : User Story
Catégorie : Test Planning
Catégorie : AI Product Strategy
Document and Evaluate LLM Prompting Success

Document and Evaluate LLM Prompting Success

COURS 12, 2 heures

Ce que vous apprendrez

  • Create operational run-books for LLM systems and evaluate prompt patterns to improve performance and reduce operational costs.

Compétences que vous acquerrez

Catégorie : Prompt Engineering
Catégorie : Prompt Patterns
Catégorie : Retrieval-Augmented Generation
Catégorie : Performance Tuning
Catégorie : Model Optimization
Catégorie : Data Maintenance
Catégorie : Requirements Analysis
Catégorie : Large Language Modeling
Catégorie : LLM Application
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Performance Testing
Catégorie : Configuration Management
Catégorie : Technical Writing
Catégorie : Benchmarking
Catégorie : Token Optimization
Catégorie : Technical Documentation
Optimize LLM Costs & Streamline Processes

Optimize LLM Costs & Streamline Processes

COURS 13, 2 heures

Ce que vous apprendrez

  • Optimize LLM costs by analyzing spend reports and streamline ML pipelines using value-stream mapping to boost efficiency and reduce cycle times.

Compétences que vous acquerrez

Catégorie : Model Optimization
Catégorie : Process Improvement and Optimization
Catégorie : Process Optimization
Catégorie : Process Analysis
Catégorie : Miro AI
Catégorie : Operating Cost
Catégorie : Data-Driven Decision-Making
Catégorie : AI Workflows
Catégorie : Productivity Software
Catégorie : Cost Management
Catégorie : Lean Manufacturing
Catégorie : Collaborative Software
Catégorie : Business Workflow Analysis
Catégorie : Process Modeling
Catégorie : LLM Application
Catégorie : Proposal Development
Catégorie : Waste Minimization

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

John Whitworth
29 Cours2 978 apprenants
LearningMate
275 Cours28 871 apprenants

Offert par

Coursera

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions