Faut-il des prérequis avant d'apprendre le LLM output evaluation ?

Une compréhension de base de l'intelligence artificielle, des concepts d'apprentissage automatique et du traitement du langage naturel est utile avant de suivre ce cours. Aucune expérience préalable approfondie de Vertex AI n'est requise, bien qu'une certaine familiarité avec ce logiciel puisse être utile.

Quels sont les outils, les plateformes ou les méthodes utilisés dans ce cours ?

Le cours utilise Google Cloud Vertex AI comme plateforme principale pour l'évaluation pratique. Il se concentre sur les mesures automatiques et les comparaisons côte à côte, tout en montrant comment l'évaluation humaine soutient ces méthodes.

Évaluation des résultats de modèles linguistiques de grande taille : Un guide pratique

Ce cours fait partie de Spécialisation "Exploiter les Mildes d'apprentissage tout au long de la vie : Stratégie, mise au point et évaluation"

Instructeurs : Reza Moradinezhad

Inclus avec En savoir plus

Demander à Coursera

1 module

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Débutant

Expérience recommandée

2 heures à compléter

Planning flexible

Apprenez à votre propre rythme

1 module

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Débutant

Expérience recommandée

2 heures à compléter

Planning flexible

Apprenez à votre propre rythme

Ce que vous apprendrez

Identifier les fondamentaux des Grands modèles de langage, y compris les méthodes d'évaluation actuelles et l'accès aux modèles d'évaluation de Vertex IA.
Appliquer les connaissances pratiques de l'utilisation des métriques automatiques et de l'AutoSxS de Vertex IA pour l'évaluation des LLM.
Évaluer les tendances à venir dans l'évaluation de l'IA générative, englobant les modèles de texte, d'image et d'audio, et l'importance de l'évaluation humaine.

Compétences que vous acquerrez

Catégorie : Modélisation des grandes langues
Catégorie : L'IA responsable
Catégorie : Candidature au LLM
Catégorie : Google Cloud Platform
Catégorie : Éthique des données
Catégorie : Qualité de l'image
Catégorie : Optimisation du modèle
Catégorie : Connaissance de l'IA
Catégorie : Évaluation de la qualité
Catégorie : Évaluation du modèle
Catégorie : Facteurs humains

Outils que vous découvrirez

Catégorie : IA générative

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

3 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation "Exploiter les Mildes d'apprentissage tout au long de la vie : Stratégie, mise au point et évaluation"

Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.

Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable

Il y a un module dans ce cours

Ce cours aborde l'évaluation des Grands modèles langage (LLM), en commençant par les méthodes d'évaluation fondamentales, en explorant les techniques avancées avec les outils de Vertex IA comme Automatic Metrics et AutoSxS, et en prévoyant l'évolution de l'évaluation de l'IA générative.

Ce cours est idéal pour les gestionnaires de produits d'IA qui cherchent à optimiser les applications LLM, les scientifiques de données intéressés par les techniques avancées d'évaluation de modèles d'IA, les éthiciens de l'IA et les décideurs axés sur le déploiement responsable de l'IA, et les chercheurs universitaires qui étudient l'impact de l'IA générative dans divers domaines. Une compréhension de base de l'intelligence artificielle, des concepts d'apprentissage automatique, et une familiarité avec le traitement du langage naturel (NLP) sont recommandés. Une expérience préalable avec Google Cloud Vertex IA est bénéfique mais non requise. Il couvre les applications pratiques, l'intégration du jugement humain avec des méthodes automatiques, et prépare les apprenants aux futures tendances de l'évaluation de l'IA à travers divers médias, y compris le texte, les images et l'audio. Cette approche complète garantit que vous êtes équipé pour évaluer efficacement les LLM, en améliorant les stratégies commerciales et l'innovation.

Ce cours traite de l'évaluation des Grands modèles de langage (LLM), en commençant par les méthodes d'évaluation fondamentales, en explorant les techniques avancées avec les outils de Vertex IA comme Automatic Metrics et AutoSxS, et en prévoyant l'évolution de l'évaluation de l'IA générative.

Inclus

12 vidéos4 lectures3 devoirs

12 vidéosTotal 69 minutes

Introduction au cours et rencontre avec l'instructeur3 minutes
Introduction aux LLM et à leurs méthodes d'évaluation6 minutes
Avantages et défis des méthodes d'évaluation du LLM5 minutes
Évaluation du LLM sur Vertex AI5 minutes
Mesures automatiques5 minutes
Démonstration des mesures automatiques8 minutes
AutoSxS8 minutes
Démonstration d'AutoSxS8 minutes
Modèles d'évaluation basés sur le texte6 minutes
Mesure de la diversité et évaluation de l'absence de tir pour les LLM5 minutes
Évaluation des modèles d'IA génératifs non textuels5 minutes
Félicitations et parcours d'apprentissage continu4 minutes

4 lecturesTotal 20 minutes

Aperçu du cours5 minutes
Évaluer les LLM : Un ensemble standard de mesures pour une évaluation précise5 minutes
Service d'évaluation de l'IA générative de Google5 minutes
Évaluation de l'IA générative pour la création d'images5 minutes

3 devoirsTotal 45 minutes

Évaluation des résultats de modèles linguistiques de grande taille : Un guide pratique20 minutes
Contrôle des connaissances : Les bases des grands modèles de langage (LLM)15 minutes
Contrôle des connaissances : Évaluation du LLM sur Vertex IA10 minutes

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Évaluations de l’enseignant

(6 évaluations)

Reza Moradinezhad

Coursera

6 Cours5 458 apprenants

Offert par

Coursera

En savoir plus sur Apprentissage automatique

Packt
Decoding Large Language Models
Cours
Statut : Essai gratuit
Google Cloud
Machine Learning Operations with Vertex AI: Model Evaluation
Cours
Statut : Essai gratuit
Coursera
Evaluate Language Models: Metrics for Success
Cours
Statut : Essai gratuit
Coursera
Generative AI and Large Language Models
Cours

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Débloquez l'accès à plus de 10 000 cours grâce à un abonnement
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez les 4 700 entreprises internationales qui ont choisi Coursera for Business.

Foire Aux Questions

Dans ce cours, l'évaluation des résultats du LLM signifie évaluer dans quelle mesure les réponses d'un modèle répondent aux besoins d'une tâche en termes de qualité, d'exactitude, de pertinence et d'utilisation responsable. Le cours l'aborde comme un processus pratique permettant d'évaluer les résultats d'un modèle plutôt que de simplement les générer.

Vous l'utiliserez pour choisir entre les modèles, améliorer une application basée sur le LLM ou vérifier si les réponses sont précises, justes et appropriées à la tâche. Il est particulièrement utile lorsque le résultat sera utilisé dans des contextes où la fiabilité et le jugement sont importants.

Elle intervient une fois que vous savez ce que vous voulez que le modèle fasse et avant de vous fier à ses résultats dans un cas d'utilisation réel. Dans ce cours, l'évaluation aide à transformer la sélection et l'affinement des modèles en un processus reproductible basé sur les objectifs, les méthodes, les données et l'interprétation.

La vérification manuelle de quelques réponses peut vous donner une impression rapide, mais elle est souvent subjective et difficile à répéter de manière cohérente. L'évaluation des résultats du LLM est plus structurée car elle définit ce que signifie une bonne performance et combine des méthodes de comparaison cohérentes avec un jugement humain lorsque cela est nécessaire.

Vous vous entraînerez à définir les objectifs de l'évaluation, à choisir les méthodes d'évaluation, à préparer les données d'évaluation, à comparer les résultats des modèles et à interpréter les résultats. Le cours vous permet également de travailler avec des idées d'évaluation automatisées et centrées sur l'homme afin que vous puissiez évaluer les réponses au programme d'éducation et de formation tout au long de la vie d'une manière plus cohérente.