Identifier les fondamentaux des Grands modèles de langage, y compris les méthodes d'évaluation actuelles et l'accès aux modèles d'évaluation de Vertex IA.
Appliquer les connaissances pratiques de l'utilisation des métriques automatiques et de l'AutoSxS de Vertex IA pour l'évaluation des LLM.
Évaluer les tendances à venir dans l'évaluation de l'IA générative, englobant les modèles de texte, d'image et d'audio, et l'importance de l'évaluation humaine.
Compétences que vous acquerrez
Catégorie : Évaluation de la qualité
Évaluation de la qualité
Catégorie : Google Cloud Platform
Google Cloud Platform
Catégorie : Qualité de l'image
Qualité de l'image
Catégorie : Évaluation du modèle
Évaluation du modèle
Catégorie : Éthique des données
Éthique des données
Catégorie : Modélisation des grandes langues
Modélisation des grandes langues
Catégorie : Optimisation du modèle
Optimisation du modèle
Catégorie : Facteurs humains
Facteurs humains
Catégorie : Connaissance de l'IA
Connaissance de l'IA
Catégorie : L'IA responsable
L'IA responsable
Catégorie : Candidature au LLM
Candidature au LLM
Outils que vous découvrirez
Catégorie : IA générative
IA générative
Détails à connaître
Certificat partageable
Ajouter à votre profil LinkedIn
Évaluations
3 devoirs
Enseigné en Anglais
91% of learners achieved a positive career outcome
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable
Il y a un module dans ce cours
Ce cours aborde l'évaluation des Grands modèles langage (LLM), en commençant par les méthodes d'évaluation fondamentales, en explorant les techniques avancées avec les outils de Vertex IA comme Automatic Metrics et AutoSxS, et en prévoyant l'évolution de l'évaluation de l'IA générative.
Ce cours est idéal pour les gestionnaires de produits d'IA qui cherchent à optimiser les applications LLM, les scientifiques de données intéressés par les techniques avancées d'évaluation de modèles d'IA, les éthiciens de l'IA et les décideurs axés sur le déploiement responsable de l'IA, et les chercheurs universitaires qui étudient l'impact de l'IA générative dans divers domaines. Une compréhension de base de l'intelligence artificielle, des concepts d'apprentissage automatique, et une familiarité avec le traitement du langage naturel (NLP) sont recommandés. Une expérience préalable avec Google Cloud Vertex IA est bénéfique mais non requise. Il couvre les applications pratiques, l'intégration du jugement humain avec des méthodes automatiques, et prépare les apprenants aux futures tendances de l'évaluation de l'IA à travers divers médias, y compris le texte, les images et l'audio. Cette approche complète garantit que vous êtes équipé pour évaluer efficacement les LLM, en améliorant les stratégies commerciales et l'innovation.
Ce cours traite de l'évaluation des Grands modèles de langage (LLM), en commençant par les méthodes d'évaluation fondamentales, en explorant les techniques avancées avec les outils de Vertex IA comme Automatic Metrics et AutoSxS, et en prévoyant l'évolution de l'évaluation de l'IA générative.
Inclus
12 vidéos4 lectures3 devoirs
Afficher les informations sur le contenu du module
12 vidéos•Total 69 minutes
Introduction au cours et rencontre avec l'instructeur•3 minutes
Introduction aux LLM et à leurs méthodes d'évaluation•6 minutes
Avantages et défis des méthodes d'évaluation du LLM•5 minutes
Évaluation du LLM sur Vertex AI•5 minutes
Mesures automatiques•5 minutes
Démonstration des mesures automatiques•8 minutes
AutoSxS•8 minutes
Démonstration d'AutoSxS•8 minutes
Modèles d'évaluation basés sur le texte•6 minutes
Mesure de la diversité et évaluation de l'absence de tir pour les LLM•5 minutes
Évaluation des modèles d'IA génératifs non textuels•5 minutes
Félicitations et parcours d'apprentissage continu•4 minutes
4 lectures•Total 20 minutes
Aperçu du cours•5 minutes
Évaluer les LLM : Un ensemble standard de mesures pour une évaluation précise•5 minutes
Service d'évaluation de l'IA générative de Google•5 minutes
Évaluation de l'IA générative pour la création d'images•5 minutes
3 devoirs•Total 45 minutes
Contrôle des connaissances : Les bases des grands modèles de langage (LLM)•15 minutes
Contrôle des connaissances : Évaluation du LLM sur Vertex IA•10 minutes
Évaluation des résultats de modèles linguistiques de grande taille : Un guide pratique•20 minutes
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeurs
Évaluations de l’enseignant
Évaluations de l’enseignant
Nous avons demandé à tous les étudiants de fournir des commentaires sur nos enseignants au sujet de la qualité de leur pédagogie.
Coursera rassemble un réseau diversifié d'experts en la matière qui ont démontré leur expertise grâce à leur expérience professionnelle dans l'industrie ou à leur solide formation universitaire. Ces instructeurs conçoivent et enseignent des cours qui permettent aux apprenants du monde entier d'acquérir des compétences pratiques et utiles à leur carrière.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Qu'est-ce que l'évaluation des résultats du LLM dans ce cours ?
Dans ce cours, l'évaluation des résultats du LLM signifie évaluer dans quelle mesure les réponses d'un modèle répondent aux besoins d'une tâche en termes de qualité, d'exactitude, de pertinence et d'utilisation responsable. Le cours l'aborde comme un processus pratique permettant d'évaluer les résultats d'un modèle plutôt que de simplement les générer.
Quand utiliseriez-vous l'évaluation des résultats du programme LLM ?
Vous l'utiliserez pour choisir entre les modèles, améliorer une application basée sur le LLM ou vérifier si les réponses sont précises, justes et appropriées à la tâche. Il est particulièrement utile lorsque le résultat sera utilisé dans des contextes où la fiabilité et le jugement sont importants.
Comment l'évaluation des résultats du programme d'éducation et de formation tout au long de la vie s'inscrit-elle dans un flux de travail plus large ?
Elle intervient une fois que vous savez ce que vous voulez que le modèle fasse et avant de vous fier à ses résultats dans un cas d'utilisation réel. Dans ce cours, l'évaluation aide à transformer la sélection et l'affinement des modèles en un processus reproductible basé sur les objectifs, les méthodes, les données et l'interprétation.
En quoi l'évaluation des résultats du LLM diffère-t-elle de la vérification manuelle de quelques réponses ?
La vérification manuelle de quelques réponses peut vous donner une impression rapide, mais elle est souvent subjective et difficile à répéter de manière cohérente. L'évaluation des résultats du LLM est plus structurée car elle définit ce que signifie une bonne performance et combine des méthodes de comparaison cohérentes avec un jugement humain lorsque cela est nécessaire.
Faut-il des prérequis avant d'apprendre le LLM output evaluation ?
Une compréhension de base de l'intelligence artificielle, des concepts d'apprentissage automatique et du traitement du langage naturel est utile avant de suivre ce cours. Aucune expérience préalable approfondie de Vertex AI n'est requise, bien qu'une certaine familiarité avec ce logiciel puisse être utile.
Quels sont les outils, les plateformes ou les méthodes utilisés dans ce cours ?
Le cours utilise Google Cloud Vertex AI comme plateforme principale pour l'évaluation pratique. Il se concentre sur les mesures automatiques et les comparaisons côte à côte, tout en montrant comment l'évaluation humaine soutient ces méthodes.
Quelles sont les tâches spécifiques que vous allez pratiquer ou accomplir dans le cadre de ce cours ?
Vous vous entraînerez à définir les objectifs de l'évaluation, à choisir les méthodes d'évaluation, à préparer les données d'évaluation, à comparer les résultats des modèles et à interpréter les résultats. Le cours vous permet également de travailler avec des idées d'évaluation automatisées et centrées sur l'homme afin que vous puissiez évaluer les réponses au programme d'éducation et de formation tout au long de la vie d'une manière plus cohérente.