IBM

Generative AI Language Modeling with Transformers

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Ce cours n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues. Consultez les langues disponibles.
IBM

Generative AI Language Modeling with Transformers

Ce cours fait partie de plusieurs programmes.

Joseph Santarcangelo
Fateme Akbari
Kang Wang

Instructeurs : Joseph Santarcangelo

29 379 déjà inscrits

Inclus avec Coursera Plus

Demander à Coursera

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

150 avis

niveau Intermédiaire

Expérience recommandée

Planning flexible
9 heures à compléter
Apprenez à votre propre rythme
90%
La plupart des étudiants ont apprécié ce cours
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

150 avis

niveau Intermédiaire

Expérience recommandée

Planning flexible
9 heures à compléter
Apprenez à votre propre rythme
90%
La plupart des étudiants ont apprécié ce cours

Ce que vous apprendrez

  • Explain the role of attention mechanisms in transformer models for capturing contextual relationships in text

  • Describe the differences in language modeling approaches between decoder-based models like GPT and encoder-based models like BERT

  • Implement key components of transformer models, including positional encoding, attention mechanisms, and masking, using PyTorch

  • Apply transformer-based models for real-world NLP tasks, such as text classification and language translation, using PyTorch and Hugging Face tools

Compétences que vous acquerrez

  • Catégorie : Model Training
  • Catégorie : Large Language Modeling
  • Catégorie : Applied Machine Learning
  • Catégorie : Natural Language Processing
  • Catégorie : Model Optimization
  • Catégorie : Embeddings
  • Catégorie : Transfer Learning
  • Catégorie : Generative Model Architectures
  • Catégorie : Data Preprocessing

Outils que vous découvrirez

  • Catégorie : Generative AI
  • Catégorie : PyTorch (Machine Learning Library)

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

6 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours est disponible dans le cadre de
Lorsque vous vous inscrivez à ce cours, vous devez également sélectionner un programme spécifique.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 2 modules dans ce cours

In this module, you will learn how transformers process sequential data using positional encoding and attention mechanisms. You will explore how to implement positional encoding in PyTorch and understand how attention helps models focus on relevant parts of input sequences. You'll dive deeper into self-attention and scaled dot-product attention with multiple heads to see how they contribute to language modeling tasks. The module also explains how the transformer architecture leverages these mechanisms efficiently. Through hands-on labs, you’ll implement these concepts and build transformer encoder layers in PyTorch. Finally, you'll apply transformer models for text classification, including building a data pipeline, defining the model, and training it, while also exploring techniques to optimize transformer training performance.

Inclus

6 vidéos4 lectures2 devoirs2 éléments d'application2 plugins

In this module, you will learn how decoder-based models like GPT are trained using causal language modeling and implemented in PyTorch for both training and inference. You will explore encoder-based models, such as Bidirectional Encoder Representations from Transformers (BERT), and understand their pretraining strategies using masked language modeling (MLM) and next sentence prediction (NSP), along with data preparation techniques in PyTorch. You will also examine how transformer architectures are applied to machine translation, including their implementation using PyTorch. Through hands-on labs, you will gain practical experience with decoder models, encoder models, and translation tasks. The module concludes with a cheat sheet, glossary, and summary to help consolidate your understanding of key concepts.

Inclus

10 vidéos6 lectures4 devoirs4 éléments d'application3 plugins

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Évaluations de l’enseignant
(32 évaluations)
Joseph Santarcangelo
IBM
37 Cours2 501 352 apprenants

Offert par

IBM

En savoir plus sur Machine Learning

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

  • 5 stars

    74,17 %

  • 4 stars

    13,24 %

  • 3 stars

    4,63 %

  • 2 stars

    1,98 %

  • 1 star

    5,96 %

Affichage de 3 sur 150

AB

Révisé le 29 déc. 2024

PA

Révisé le 4 nov. 2025

RR

Révisé le 1 sept. 2025

Foire Aux Questions