Évaluer les MLD : Tester et prouver la significativité

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Évaluer les MLD : Tester et prouver la significativité

Ce cours fait partie de Spécialisation "LLM Optimisation et évaluation"

Instructeur : LearningMate

Inclus avec En savoir plus

1 module

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Intermédiaire

Expérience recommandée

3 heures à compléter

Planning flexible

Apprenez à votre propre rythme

1 module

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Intermédiaire

Expérience recommandée

3 heures à compléter

Planning flexible

Apprenez à votre propre rythme

Ce que vous apprendrez

Évaluer rigoureusement les performances des modèles de langage de grande capacité (LLM) à l'aide de tests statistiques et d'intervalles de confiance afin de prendre des décisions de déploiement fondées sur les données.

Compétences que vous acquerrez

Catégorie : Récit de données
Catégorie : Mesure de la performance
Catégorie : Tests d'hypothèses statistiques
Catégorie : Présentation des données
Catégorie : Prise de décision fondée sur des données
Catégorie : Modélisation des grandes langues
Catégorie : Visualisation scientifique
Catégorie : Statistiques
Catégorie : Expérimentation
Catégorie : Visualisation statistique
Catégorie : Matplotlib
Catégorie : Inférence statistique
Catégorie : Programmation statistique
Catégorie : Analyse statistique
Catégorie : Évaluation du modèle
Catégorie : Méthodes statistiques

Outils que vous découvrirez

Catégorie : Logiciel statistique
Catégorie : Déploiement du modèle

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

3 affectations¹

Noté par l'IA voir l'avis de non-responsabilité

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation "LLM Optimisation et évaluation"

Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.

Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable

Il y a un module dans ce cours

« Évaluer les grands modèles de langage (LLM) : tester et démontrer la pertinence » est une formation de niveau intermédiaire destinée aux ingénieurs en apprentissage automatique, aux professionnels de l’IA et aux data scientists chargés de démontrer la valeur des mises à jour des modèles. Lorsqu’il s’agit de prendre des décisions de déploiement à fort enjeu, un simple score de précision ne suffit pas. Cette formation vous fournit les méthodes statistiques nécessaires pour valider de manière rigoureuse les améliorations de performances des grands modèles de langage. Vous apprendrez à quantifier l’incertitude en calculant et en interprétant des intervalles de confiance, ainsi qu’à démontrer si les changements sont significatifs en réalisant des tests d’hypothèse formels, tels que le test du chi carré. Grâce à des travaux pratiques utilisant des bibliothèques Python telles que SciPy et Matplotlib, vous analyserez les résultats des modèles, testerez leur signification statistique et créerez des visualisations convaincantes avec des barres d’erreur qui communiqueront clairement vos conclusions aux parties prenantes. À l’issue de ce cours, vous serez en mesure d’aller au-delà des évaluations subjectives du type « ça semble mieux » pour affirmer avec certitude « nous pouvons prouver que c’est mieux », garantissant ainsi que chaque décision de déploiement s’appuie sur des preuves statistiques solides.

Ce cours propose un guide complet expliquant comment évaluer, valider et communiquer de manière rigoureuse les performances des grands modèles linguistiques (LLM). Vous apprendrez d'abord pourquoi les indicateurs isolés ne suffisent pas, puis vous apprendrez à quantifier l'incertitude à l'aide d'intervalles de confiance, à démontrer les améliorations grâce à des tests d'hypothèse et, enfin, à créer des visualisations convaincantes pour étayer des décisions de déploiement fondées sur les données.

Inclus

5 vidéos2 lectures3 devoirs3 laboratoires non notés

5 vidéosTotal 30 minutes

Pourquoi les notes individuelles sont trompeuses8 minutes
Vidéo explicative : Calcul des intervalles de Wilson en Python4 minutes
Pourquoi l'intuition ne suffit pas dans les tests A/B6 minutes
Réalisation d'un test du chi carré en Python6 minutes
Visualiser la confiance avec Matplotlib5 minutes

2 lecturesTotal 14 minutes

Concepts fondamentaux : confiance et importance8 minutes
Raconter des histoires à l'aide de visuels statistiques6 minutes

3 devoirsTotal 40 minutes

Projet final : Rapport d'évaluation du LLM30 minutes
Quiz sur les intervalles de confiance5 minutes
Quiz sur la communication des résultats5 minutes

3 laboratoires non notésTotal 110 minutes

Travail pratique n° 1 : Quantification de la précision d'un modèle20 minutes
Travail pratique n° 2 : Validation d'une amélioration du modèle30 minutes
Exercice n° 3 : Créer un tableau comparatif60 minutes

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

LearningMate

276 Cours35 794 apprenants

Offert par

Coursera

En savoir plus sur Apprentissage automatique

Simplilearn
LLM Benchmarking and Evaluation Training
Cours
Statut : Essai gratuit
Catégorie : Crédit proposé
Coursera
Safeguard LLM Outputs: Test and Evaluate
Cours
Statut : Essai gratuit
Catégorie : Crédit proposé
Coursera
Evaluate & Optimize LLM Performance
Cours
Statut : Essai gratuit
Catégorie : Crédit proposé
Coursera
Evaluating LLM Performance and Efficiency
Cours
Statut : Essai gratuit
Catégorie : Crédit proposé

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.

Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.

Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.

Plus de questions

Visitez le Centre d'Aide pour les Étudiants

Aide financière disponible,

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.