Coursera
Evaluate LLMs: Test and Prove Significance

Acquérir des compétences de haut niveau avec Coursera Plus pour 199 $ (régulièrement 399 $). Économisez maintenant.

Ce cours n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Evaluate LLMs: Test and Prove Significance

LearningMate

Instructeur : LearningMate

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

3 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

3 heures à compléter
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Rigorously evaluate LLM performance using statistical tests and confidence intervals to make data-driven deployment decisions.

Compétences que vous acquerrez

  • Catégorie : Large Language Modeling
  • Catégorie : Experimentation
  • Catégorie : Statistical Hypothesis Testing
  • Catégorie : Probability & Statistics
  • Catégorie : Statistical Methods
  • Catégorie : Statistical Visualization
  • Catégorie : Data Presentation
  • Catégorie : Data-Driven Decision-Making
  • Catégorie : Matplotlib
  • Catégorie : Data Storytelling
  • Catégorie : Statistical Inference
  • Catégorie : Statistical Analysis
  • Catégorie : Model Evaluation
  • Catégorie : Performance Metric
  • Catégorie : Jupyter

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

décembre 2025

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation LLM Optimization & Evaluation
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a un module dans ce cours

This course provides an end-to-end walkthrough of how to rigorously evaluate, validate, and communicate the performance of Large Language Models (LLMs). You will move from understanding why single metrics are insufficient to quantifying uncertainty with confidence intervals, proving improvements with hypothesis tests, and finally, creating persuasive visualizations to support data-driven deployment decisions.

Inclus

5 vidéos2 lectures3 devoirs3 laboratoires non notés

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

LearningMate
Coursera
62 Cours685 apprenants

Offert par

Coursera

En savoir plus sur Machine Learning

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.