Coursera

Spécialisation "LLM Optimization & Evaluation"

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Spécialisation "LLM Optimization & Evaluation"

Optimize & Deploy Production-Ready LLM Systems. Build expertise in LLM evaluation, optimization, and deployment through hands-on MLOps projects.

John Whitworth
LearningMate

Instructeurs : John Whitworth

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Evaluate and optimize LLM performance using statistical testing, MLOps tools, and production monitoring systems.

  • Build automated pipelines for feature engineering, experiment tracking, and data processing with industry-standard tools.

  • Diagnose LLM errors, implement safety frameworks, and reduce operational costs through systematic analysis.

Compétences que vous acquerrez

  • Catégorie : Technical Communication
  • Catégorie : Prompt Patterns
  • Catégorie : SQL
  • Catégorie : Data Presentation
  • Catégorie : Large Language Modeling
  • Catégorie : Performance Tuning
  • Catégorie : Data Pipelines
  • Catégorie : LLM Application
  • Catégorie : Technical Documentation
  • Catégorie : Extract, Transform, Load
  • Catégorie : Scripting
  • Catégorie : MLOps (Machine Learning Operations)
  • Catégorie : AI Security
  • Catégorie : Root Cause Analysis
  • Catégorie : Statistical Analysis
  • Catégorie : User Acceptance Testing (UAT)
  • Catégorie : Version Control

Outils que vous découvrirez

  • Catégorie : PyTorch (Machine Learning Library)
  • Catégorie : Python Programming
  • Catégorie : Apache Airflow
  • Catégorie : Miro AI

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

décembre 2025

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Coursera

Spécialisation - série de 13 cours

Ce que vous apprendrez

  • Build feature engineering pipelines and evaluate ML experiments using MLOps tools to select and deploy production-ready models.

Compétences que vous acquerrez

Catégorie : Feature Engineering
Catégorie : Model Evaluation
Catégorie : Performance Tuning
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Performance Analysis
Catégorie : Data Pipelines
Catégorie : Predictive Modeling
Catégorie : Data Preprocessing
Catégorie : Data Transformation

Ce que vous apprendrez

  • Use PyTorch Lightning to implement callbacks, diagnose instabilities, and optimize model performance.

Compétences que vous acquerrez

Catégorie : Deep Learning
Catégorie : PyTorch (Machine Learning Library)
Catégorie : Performance Tuning
Catégorie : Debugging
Catégorie : Transfer Learning
Catégorie : Scalability
Catégorie : Artificial Neural Networks
Catégorie : Model Deployment
Catégorie : Model Evaluation
Catégorie : MLOps (Machine Learning Operations)

Ce que vous apprendrez

  • Evaluate LLMs using metrics like BLEU & ROUGE run A/B tests for statistical significance, and optimize model performance with data-driven strategies.

Compétences que vous acquerrez

Catégorie : Test Script Development
Catégorie : Statistical Analysis
Catégorie : Model Evaluation
Catégorie : Large Language Modeling
Catégorie : Natural Language Processing
Catégorie : LLM Application
Catégorie : Prompt Engineering
Catégorie : Performance Metric
Catégorie : Statistical Hypothesis Testing
Catégorie : Data-Driven Decision-Making
Catégorie : Business Metrics

Ce que vous apprendrez

  • Use data analysis to diagnose LLM hallucinations by correlating user behavior and system errors, and document findings to guide engineering fixes.

Compétences que vous acquerrez

Catégorie : Root Cause Analysis
Catégorie : Artificial Intelligence
Catégorie : Data Analysis
Catégorie : Analysis
Catégorie : Technical Communication
Catégorie : LLM Application
Catégorie : Debugging
Catégorie : Data Manipulation
Catégorie : Data Processing
Catégorie : Performance Metric
Catégorie : Data Analysis Expressions (DAX)
Catégorie : Business Metrics
Catégorie : Pandas (Python Package)
Catégorie : Anomaly Detection
Catégorie : Customer Retention
Catégorie : Generative AI

Ce que vous apprendrez

  • Rigorously evaluate LLM performance using statistical tests and confidence intervals to make data-driven deployment decisions.

Compétences que vous acquerrez

Catégorie : Jupyter
Catégorie : Model Evaluation
Catégorie : Performance Metric
Catégorie : Matplotlib
Catégorie : Statistical Methods
Catégorie : Data Presentation
Catégorie : Data-Driven Decision-Making
Catégorie : Data Storytelling
Catégorie : Statistical Inference
Catégorie : Statistical Hypothesis Testing
Catégorie : Statistical Analysis
Catégorie : Large Language Modeling
Catégorie : Experimentation
Catégorie : Probability & Statistics
Catégorie : Statistical Visualization

Ce que vous apprendrez

  • Parameterized SQL with CTEs and window functions builds scalable, maintainable pipelines that adapt as business needs change.

  • Query optimization is systematic: analyze execution plans, find costly steps, then resolve them with indexing or rewrites.

  • Materialized summary tables and well-timed processing, like morning refreshes, support reliable analytics infrastructure.

  • Understanding execution internals helps analysts build self-sufficient workflows without recurring engineering delays.

Compétences que vous acquerrez

Catégorie : Performance Tuning
Catégorie : SQL
Catégorie : Data Transformation
Catégorie : Scripting
Catégorie : Extract, Transform, Load
Catégorie : Database Management
Catégorie : Stored Procedure
Catégorie : Data Manipulation
Catégorie : Data Pipelines
Catégorie : Query Languages

Ce que vous apprendrez

  • Build and validate a robust safety testing framework for LLMs. Create behavioral test suites and use mutation testing to ensure their effectiveness.

Compétences que vous acquerrez

Catégorie : Security Testing
Catégorie : Large Language Modeling
Catégorie : Prompt Engineering
Catégorie : Software Technical Review
Catégorie : Quality Assessment
Catégorie : Unit Testing
Catégorie : Test Script Development
Catégorie : Code Coverage
Catégorie : LLM Application
Catégorie : API Testing
Catégorie : Test Case
Catégorie : Maintainability
Catégorie : AI Security
Catégorie : Test Tools
Catégorie : Responsible AI
Catégorie : Verification And Validation
Catégorie : Penetration Testing
Catégorie : Software Testing
Catégorie : Threat Modeling
Catégorie : Model Evaluation

Ce que vous apprendrez

  • Track, version, and evaluate ML experiments using DVC and W&B to reliably select and prepare models for production deployment.

Compétences que vous acquerrez

Catégorie : Version Control
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Model Evaluation
Catégorie : Large Language Modeling
Catégorie : Dashboard
Catégorie : Performance Testing
Catégorie : Performance Analysis
Catégorie : Scripting
Catégorie : Technical Documentation
Catégorie : Machine Learning
Catégorie : Git (Version Control System)
Catégorie : Data Management

Ce que vous apprendrez

  • Create automated Python scripts to manage multi-step cloud workflows, from provisioning resources to persisting data.

Compétences que vous acquerrez

Catégorie : Scripting
Catégorie : Data Pipelines
Catégorie : Python Programming
Catégorie : Virtual Machines
Catégorie : Command-Line Interface
Catégorie : Cloud Deployment
Catégorie : Data Persistence
Catégorie : Infrastructure as Code (IaC)

Ce que vous apprendrez

  • Build automated data pipelines with Apache Airflow, manage schema evolution to prevent failures, and implement monitoring for data integrity.

Compétences que vous acquerrez

Catégorie : Apache Airflow
Catégorie : Data Integrity
Catégorie : Data Pipelines
Catégorie : Data Transformation
Catégorie : Extract, Transform, Load
Catégorie : Data Migration
Catégorie : Technical Communication
Catégorie : Data Modeling
Catégorie : Real Time Data
Catégorie : Continuous Monitoring
Catégorie : Data Validation
Catégorie : Data Quality

Ce que vous apprendrez

  • Translate an LLM product concept into a detailed PRD and create a UAT plan to validate that the delivered feature meets user requirements.

Compétences que vous acquerrez

Catégorie : User Acceptance Testing (UAT)
Catégorie : Risk Management Framework
Catégorie : Technical Communication
Catégorie : Large Language Modeling
Catégorie : Functional Requirement
Catégorie : Requirements Analysis
Catégorie : LLM Application
Catégorie : Key Performance Indicators (KPIs)
Catégorie : Functional Testing
Catégorie : Scenario Testing
Catégorie : AI Product Strategy
Catégorie : Business Requirements
Catégorie : User Story
Catégorie : Acceptance Testing
Catégorie : User Requirements Documents
Catégorie : Product Requirements

Ce que vous apprendrez

  • Create operational run-books for LLM systems and evaluate prompt patterns to improve performance and reduce operational costs.

Compétences que vous acquerrez

Catégorie : Prompt Patterns
Catégorie : Prompt Engineering
Catégorie : LLM Application
Catégorie : Data Maintenance
Catégorie : Technical Writing
Catégorie : Large Language Modeling
Catégorie : Benchmarking
Catégorie : Technical Documentation
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Configuration Management
Catégorie : Requirements Analysis
Catégorie : Performance Testing
Catégorie : Performance Tuning

Ce que vous apprendrez

  • Optimize LLM costs by analyzing spend reports and streamline ML pipelines using value-stream mapping to boost efficiency and reduce cycle times.

Compétences que vous acquerrez

Catégorie : Process Improvement and Optimization
Catégorie : Process Optimization
Catégorie : Process Analysis
Catégorie : Productivity Software
Catégorie : Data-Driven Decision-Making
Catégorie : Expense Management
Catégorie : Miro AI
Catégorie : Cost Benefit Analysis
Catégorie : Cost Management
Catégorie : Business Workflow Analysis

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

John Whitworth
Coursera
25 Cours 883 apprenants
LearningMate
151 Cours 8 475 apprenants

Offert par

Coursera

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions