Ce cours s'adresse tout particulièrement aux ingénieurs en informatique, aux data scientists et aux étudiants de troisième cycle en informatique ou dans des filières d'ingénierie qui souhaitent acquérir une expertise dans la conception et le déploiement de systèmes de traitement du langage naturel afin de résoudre des problèmes concrets liés à la compréhension du langage.

Traitement du langage naturel naturel (NLP) appliqué à l'ingénierie - Partie 2
Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Traitement du langage naturel naturel (NLP) appliqué à l'ingénierie - Partie 2

Instructeur : Ramin Mohammadi
Inclus avec
Compétences que vous acquerrez
- Catégorie : Modèle de MarkovModèle de Markov
- Catégorie : Apprentissage par transfertApprentissage par transfert
- Catégorie : Modèle de formationModèle de formation
- Catégorie : Réseaux neuronaux récurrents (RNN)Réseaux neuronaux récurrents (RNN)
- Catégorie : Réseaux neuronaux artificielsRéseaux neuronaux artificiels
- Catégorie : Architectures de modèles génératifsArchitectures de modèles génératifs
- Catégorie : Optimisation du modèleOptimisation du modèle
- Catégorie : Traitement du langage naturelTraitement du langage naturel
- Catégorie : Apprentissage profondApprentissage profond
- Catégorie : Méthodes d'apprentissage automatiqueMéthodes d'apprentissage automatique
- Catégorie : Modélisation des grandes languesModélisation des grandes langues
- Catégorie : Prétraitement des donnéesPrétraitement des données
Outils que vous découvrirez
- Catégorie : Visage étreintVisage étreint
- Catégorie : PyTorch (Bibliothèque d'apprentissage automatique)PyTorch (Bibliothèque d'apprentissage automatique)
Détails à connaître

Ajouter à votre profil LinkedIn
21 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Il y a 7 modules dans ce cours
Ce module aborde en détail l’étape cruciale de prétraitement qu’est la tokenisation en TALN, qui consiste à segmenter un texte en unités plus petites appelées « tokens ». Vous découvrirez diverses techniques de tokenisation, notamment la tokenisation au niveau des caractères, au niveau des mots, par encodage par paires d’octets (BPE), WordPiece et Unigram. Vous examinerez ensuite l’importance des processus de normalisation et de pré-tokenisation pour garantir l’uniformité du texte et améliorer la précision de la tokenisation. À travers des exemples concrets et des exercices pratiques, les étudiants apprendront à gérer les problèmes liés aux mots hors vocabulaire (OOV), à gérer efficacement les grands vocabulaires et à comprendre les complexités de calcul impliquées. À la fin de ce module, vous disposerez des connaissances nécessaires pour mettre en œuvre et optimiser des méthodes de tokenisation destinées à diverses applications de traitement du langage naturel (NLP).
Inclus
1 vidéo13 lectures2 devoirs1 élément d'application
1 vidéo•Total 1 minute
- Rencontrez vos professeurs•1 minute
13 lectures•Total 69 minutes
- Introduction au cours•2 minutes
- Programme - Traitement du langage naturel appliqué à l'ingénierie, 2e partie•10 minutes
- Intégrité académique•1 minute
- Vue d'ensemble de la semaine 8•2 minutes
- Introduction•5 minutes
- Pré-tokenisation•5 minutes
- Tokenisation par caractères•5 minutes
- Tokenisation au niveau des mots•5 minutes
- Codage par paires d'octets (BPE)•10 minutes
- Tokenisation WordPiece•10 minutes
- Tokenisation Unigram•10 minutes
- Élagage du vocabulaire dans la tokenisation par unigrammes•2 minutes
- Résumé et conclusions•2 minutes
2 devoirs•Total 75 minutes
- Évaluez vos acquis : la tokenisation•30 minutes
- Quiz du module 8•45 minutes
1 élément d'application•Total 10 minutes
- L'algorithme de Viterbi pour la tokenisation•10 minutes
Dans ce module, nous aborderons les modèles fondamentaux du traitement du langage naturel (TLN), en mettant l'accent sur les modèles linguistiques, les réseaux neuronaux à propagation directe (FFNN) et les modèles de Markov cachés (HMM). Les modèles linguistiques jouent un rôle crucial dans la prédiction et la génération de séquences de texte en attribuant des probabilités aux mots ou aux expressions d'une phrase, ce qui permet des applications telles que la saisie semi-automatique et la génération de texte. Les FFNN, bien que limités à des contextes de taille fixe, constituent des architectures neuronales fondamentales utilisées dans la modélisation du langage, permettant d’apprendre des relations complexes entre les mots grâce à des transformations non linéaires. À l’inverse, les HMM modélisent des séquences en se basant sur des états cachés, qui influencent les résultats observables. Ils sont particulièrement utiles dans des tâches telles que le marquage des catégories grammaticales et la reconnaissance vocale. Au fil de ce module, nous examinerons également les avancées récentes, telles que l’analyse syntaxique basée sur les transitions neuronales, ainsi que l’évolution des modèles linguistiques vers des architectures sophistiquées comme les « transformers » et les modèles pré-entraînés à grande échelle tels que BERT et GPT. Ce module offre une vue d’ensemble complète de l’évolution de la modélisation du langage, depuis les méthodes statistiques jusqu’aux architectures neuronales de pointe.
Inclus
2 vidéos19 lectures4 devoirs
2 vidéos•Total 8 minutes
- Modèle de langage•4 minutes
- Modèles de Markov cachés•4 minutes
19 lectures•Total 183 minutes
- Aperçu de la semaine 9•2 minutes
- Introduction aux modèles linguistiques•5 minutes
- Devoir sur les probabilités dans les modèles linguistiques•2 minutes
- Évolution des modèles linguistiques•10 minutes
- Modèles de pointe•2 minutes
- N-Gram•5 minutes
- Probabilités dans les modèles linguistiques•10 minutes
- Exemple : Le chat était assis sur le tapis•10 minutes
- Limites des modèles N-grammes•5 minutes
- Le FFNN dans la modélisation du langage•20 minutes
- Avantages et inconvénients des réseaux neuronaux feed-forward (FFNN)•5 minutes
- Introduction aux HMM•10 minutes
- Modèles de Markov cachés•2 minutes
- Représentation mathématique des modèles HMM•15 minutes
- Problème de vraisemblance : algorithme a posteriori•10 minutes
- Problème de décodage : l'algorithme de Viterbi•15 minutes
- Problème d'apprentissage : l'algorithme de Baum-Welch•15 minutes
- Exemple de modèle HMM•20 minutes
- Les modèles HMM dans la reconnaissance vocale•20 minutes
4 devoirs•Total 120 minutes
- Évaluez vos acquis : modèles linguistiques•30 minutes
- Évaluez vos acquis : réseaux neuronaux de type FFNN•15 minutes
- Évaluez vos acquis : les modèles HMM•30 minutes
- Quiz du module 9•45 minutes
Dans ce module, nous allons explorer les réseaux neuronaux récurrents (RNN), une architecture fondamentale de l'apprentissage profond conçue pour les données séquentielles. Les RNN sont particulièrement adaptés aux tâches où l'ordre des entrées a son importance, telles que la prédiction de séries chronologiques, la modélisation linguistique et la reconnaissance vocale. Contrairement aux réseaux neuronaux traditionnels, les RNN disposent de connexions qui leur permettent de « se souvenir » des informations issues des étapes précédentes en partageant des paramètres d’un pas de temps à l’autre. Cette capacité leur permet de saisir les dépendances temporelles dans les données, ce qui en fait des outils puissants pour les tâches basées sur des séquences. Cependant, les RNN posent des défis tels que la disparition et l’explosion des gradients, qui affectent leur capacité à apprendre des dépendances à long terme. Tout au long de ce module, vous explorerez différentes variantes de RNN, telles que les réseaux à mémoire à court et long terme (LSTM) et les unités récurrentes à porte (GRU), qui permettent de surmonter ces défis. Vous vous plongerez également dans les techniques d’entraînement avancées et les applications des RNN à des problèmes concrets de traitement du langage naturel (NLP) et de séries chronologiques.
Inclus
2 vidéos22 lectures2 devoirs1 élément d'application
2 vidéos•Total 4 minutes
- Réseaux neuronaux récurrents•4 minutes
- Le processus RNN•0 minutes
22 lectures•Total 221 minutes
- Aperçu de la semaine 10•2 minutes
- Réseaux neuronaux récurrents (RNN)•2 minutes
- Défis et applications des réseaux neuronaux récurrents (RNN)•5 minutes
- Partage des paramètres dans les réseaux neuronaux récurrents (RNN)•5 minutes
- Systèmes dynamiques•5 minutes
- Des systèmes dynamiques aux réseaux neuronaux récurrents (RNN)•10 minutes
- Calcul du gradient dans un réseau neuronal récurrent (RNN)•10 minutes
- Avantages et inconvénients des réseaux neuronaux récurrents (RNN)•5 minutes
- Entraînement d'un modèle linguistique RNN•20 minutes
- Problèmes liés aux RNN•15 minutes
- Comment résoudre ces problèmes ?•15 minutes
- RNN à portes•15 minutes
- Équations LSTM•15 minutes
- Unité récurrente clôturée (GRU)•10 minutes
- Réseaux de neurones résiduels•20 minutes
- Le « skip connection » : la clé pour comprendre les résidus•15 minutes
- Conventions utilisées•2 minutes
- Analyse étape par étape 1 - 2•5 minutes
- Analyse détaillée, étape par étape : 3 A - G•15 minutes
- Analyse détaillée étape par étape 3 H - N•15 minutes
- Analyse détaillée, étape par étape : 4 à 6•10 minutes
- Calcul de la perplexité•5 minutes
2 devoirs•Total 75 minutes
- Évaluez vos acquis : les réseaux neuronaux récurrents (RNN)•30 minutes
- Quiz du module 10•45 minutes
1 élément d'application•Total 10 minutes
- Introduction aux réseaux LSTM, GRU et résiduels•10 minutes
Ce module initie les étudiants aux techniques avancées de traitement du langage naturel (NLP), en mettant l'accent sur des tâches fondamentales telles que le marquage des catégories grammaticales (PoS), l'analyse des sentiments et la modélisation de séquences à l'aide de réseaux neuronaux récurrents (RNN). Les étudiants examineront comment le marquage des parties du discours aide à comprendre les structures grammaticales, permettant ainsi des applications telles que la traduction automatique et la reconnaissance d'entités nommées (NER). Le module explore en détail l’analyse des sentiments, en mettant en avant diverses approches allant des modèles traditionnels d’apprentissage automatique (par exemple, Naive Bayes) aux techniques avancées d’apprentissage profond (par exemple, les RNN bidirectionnels et les transformateurs). Les étudiants apprendront à mettre en œuvre une compréhension contextuelle à la fois ascendante et descendante à l’aide de RNN bidirectionnels, ce qui améliore la précision dans les tâches où l’ordre des séquences a une incidence sur le sens. À la fin du cours, les étudiants auront acquis une expérience pratique de la construction de modèles de TALN destinés à des applications concrètes, ce qui leur permettra de traiter des données séquentielles et de saisir les dépendances complexes dans l’analyse de textes.
Inclus
1 vidéo15 lectures4 devoirs
1 vidéo•Total 5 minutes
- Introduction au marquage PoS, aux réseaux neuronaux récurrents bidirectionnels (RNN) et à l'analyse des sentiments•5 minutes
15 lectures•Total 113 minutes
- Aperçu de la semaine 11•2 minutes
- Introduction au marquage PoS•10 minutes
- Comment fonctionne le marquage PoS ?•10 minutes
- Défis et avantages du marquage PoS•5 minutes
- Utilisation des réseaux neuronaux récurrents (RNN) pour le marquage PoS•10 minutes
- Étapes du marquage PoS avec un RNN•5 minutes
- Utilisation de réseaux LSTM ou GRU à la place de réseaux RNN simples•10 minutes
- Conclusion•10 minutes
- Motivation•2 minutes
- Réseaux neuronaux récurrents bidirectionnels•10 minutes
- Réseaux neuronaux récurrents multicouches•10 minutes
- Introduction•5 minutes
- Approches utilisant les réseaux neuronaux récurrents (RNN)•20 minutes
- Autres approches de l'analyse des sentiments•2 minutes
- Conclusion•2 minutes
4 devoirs•Total 135 minutes
- Évaluez vos acquis : PoS•30 minutes
- Évaluez vos acquis : les réseaux neuronaux récurrents bidirectionnels (RNN)•30 minutes
- Évaluez vos acquis : analyse des sentiments•30 minutes
- Quiz du module 11 •45 minutes
Ce module vous présente les tâches CORE et les techniques avancées du traitement du langage naturel (NLP), en mettant l'accent sur la prédiction structurée, la traduction automatique et l'étiquetage de séquences. Vous explorerez des thèmes fondamentaux tels que la reconnaissance d’entités nommées (NER), le marquage des catégories grammaticales (PoS) et l’analyse des sentiments, et vous utiliserez des architectures de réseaux neuronaux telles que les réseaux neuronaux récurrents (RNN), les réseaux à mémoire à court et long terme (LSTM) et les champs aléatoires conditionnels (CRF). Ce module abordera les concepts clés de la modélisation de séquences, tels que les RNN bidirectionnels et multicouches, qui prennent en compte à la fois le contexte passé et futur afin d’améliorer la précision de tâches telles que la reconnaissance d’entités nommées (NER) et l’étiquetage des parties du discours (PoS). De plus, vous vous plongerez dans la traduction automatique neuronale (NMT), en étudiant les modèles encodeur-décodeur dotés de mécanismes d’attention pour relever les défis liés à la traduction de longues séquences. Les mises en œuvre pratiques consisteront à intégrer ces modèles dans des applications concrètes, en mettant l’accent sur la gestion des structures linguistiques complexes, des mots rares et des dépendances séquentielles. À l’issue de ce module, vous serez capable de construire et d’optimiser des modèles d’apprentissage profond pour diverses tâches de traitement du langage naturel (NLP).
Inclus
3 vidéos18 lectures4 devoirs
3 vidéos•Total 7 minutes
- Introduction au CRF•3 minutes
- Introduction à la reconnaissance des entités nominales (NER) et à la traduction automatique (NMT)•4 minutes
- Visualisation du processus NMT •0 minutes
18 lectures•Total 164 minutes
- Vue d'ensemble de la semaine 12•2 minutes
- Définition du CRF•10 minutes
- Modèle CRF avec LSTM•10 minutes
- Combinaison du modèle LSTM et du modèle CRF•20 minutes
- Calcul de la probabilité d'une séquence, de la probabilité logarithmique et de l'objectif d'apprentissage•15 minutes
- Décodage : déterminer la meilleure séquence d'étiquettes•5 minutes
- Détails sur les composants du modèle LSTM-CRF•15 minutes
- Résumé de la matrice de transition dans le CRF•5 minutes
- Reconnaissance des entités nommées (NER)•10 minutes
- NER à l'aide de RNN/LSTM•10 minutes
- BiLSTM pour la reconnaissance des entités nominales (NER)•10 minutes
- Couche CRF pour le marquage de séquençage•10 minutes
- L'attention dans la reconnaissance des entités nommées (NER)•10 minutes
- Tableau : Liste alphabétique des balises de catégorie grammaticale utilisées dans le projet Penn Treebank•5 minutes
- Présentation de la traduction automatique•5 minutes
- Modèle « séquence à séquence » pour la traduction automatique (NMT)•10 minutes
- Apprentissage en traduction automatique : optimisation et fonction de perte•10 minutes
- Codage par paires d'octets (BPE) pour la gestion des mots rares•2 minutes
4 devoirs•Total 135 minutes
- Évaluez vos acquis : CRF•30 minutes
- Évaluez vos acquis : NER•30 minutes
- Évaluez vos acquis : NMT•30 minutes
- Quiz du module 12•45 minutes
Dans ce module, nous nous intéresserons aux mécanismes d’attention et explorerons l’évolution et l’importance de l’attention dans les réseaux neuronaux, en commençant par son introduction dans la traduction automatique neuronale. Nous aborderons les défis posés par les modèles traditionnels de type « séquence à séquence » et la manière dont les mécanismes d’attention, en particulier dans les architectures Transformer, permettent de résoudre des problèmes tels que les dépendances à longue portée et la parallélisation, ce qui améliore la capacité du modèle à se concentrer de manière dynamique sur les parties pertinentes de la séquence d’entrée. Nous nous intéresserons ensuite aux Transformers et nous plongerons dans l’architecture révolutionnaire introduite par Vaswani et al. en 2017, qui a considérablement fait progresser le traitement du langage naturel. Nous aborderons les composants CORE des Transformers, notamment l’auto-attention, l’attention multi-têtes et l’encodage positionnel, afin d’expliquer comment ces innovations surmontent les limites des modèles séquence-séquence traditionnels et permettent un traitement parallèle efficace ainsi que la gestion des dépendances à longue portée dans le texte.
Inclus
2 vidéos25 lectures3 devoirs2 éléments d'application
2 vidéos•Total 9 minutes
- Mécanismes d'attention•3 minutes
- Transformateurs•6 minutes
25 lectures•Total 239 minutes
- Vue d'ensemble de la semaine 13•2 minutes
- Introduction et motivation•5 minutes
- Modèles séquence-à-séquence•5 minutes
- Les défis des modèles Seq2Seq•15 minutes
- Mécanismes d'attention•5 minutes
- Modèles Seq2Seq généraux•10 minutes
- Processus d'attention détaillé dans Seq2Seq•15 minutes
- Introduction et architecture du Transformer•2 minutes
- Applications des architectures de transformateurs•5 minutes
- Clé, requête, valeur•3 minutes
- Attention à soi•15 minutes
- L'auto-attention comme mécanisme de routage•5 minutes
- Calcul et pondération des valeurs•10 minutes
- L'auto-attention sous forme matricielle•10 minutes
- Présentations de poste •10 minutes
- L'intuition•15 minutes
- Non-linéarité élément par élément•20 minutes
- Attention à plusieurs têtes•10 minutes
- Forme de séquence-tuteur•10 minutes
- Transformateurs•15 minutes
- Types de transformateurs•20 minutes
- Attention croisée•15 minutes
- Processus de décodage avec attention croisée•10 minutes
- Inconvénients des transformateurs•5 minutes
- Conclusion•2 minutes
3 devoirs•Total 105 minutes
- Évaluez votre apprentissage : Attention•30 minutes
- Évaluez vos acquis : Transformer•30 minutes
- Quiz du module 13•45 minutes
2 éléments d'application•Total 40 minutes
- Visualisation multi-têtes•20 minutes
- Exemple d'encodeur-décodeur•20 minutes
Dans ce module, nous nous intéresserons de près au pré-entraînement et explorerons son rôle fondamental dans les modèles modernes de traitement du langage naturel (NLP), en soulignant comment ces modèles sont initialement entraînés sur de vastes ensembles de données généraux afin d’apprendre les structures linguistiques et la sémantique. Cette phase de pré-entraînement, qui implique souvent des tâches telles que la modélisation linguistique masquée, dote les modèles de connaissances linguistiques étendues, qui peuvent ensuite être affinées pour des tâches spécifiques, ce qui améliore les performances et réduit le besoin de disposer de données spécifiques à ces tâches en grande quantité.
Inclus
1 vidéo19 lectures2 devoirs
1 vidéo•Total 5 minutes
- Préparation à la formation•5 minutes
19 lectures•Total 209 minutes
- Vue d'ensemble de la semaine 14•2 minutes
- Introduction à la pré-formation•15 minutes
- Représentations lexicales pré-entraînées•10 minutes
- Apprendre à partir de la reconstruction des données d'entrée•10 minutes
- Pré-entraînement par modélisation linguistique•20 minutes
- Pré-entraînement pour trois types d'architectures•10 minutes
- BERT : Représentations de codeurs bidirectionnels à partir de transformateurs•15 minutes
- Pré-entraînement de BERT •10 minutes
- Mise au point•15 minutes
- Réglage fin complet vs réglage fin avec optimisation des paramètres•15 minutes
- Limites des encodeurs pré-entraînés et extensions de BERT•10 minutes
- Pré-entraînement des décodeurs•10 minutes
- Transformateur génératif pré-entraîné (GPT)•10 minutes
- Lois d'échelle•15 minutes
- Quels types de notions le pré-apprentissage permet-il d'acquérir ?•10 minutes
- Pré-entraînement des réseaux encodeur-décodeur : quel objectif de pré-entraînement choisir ?•15 minutes
- Corruption de la portée : modèle T5•10 minutes
- Transfert de connaissances vers des tâches en aval•5 minutes
- Félicitations !•2 minutes
2 devoirs•Total 75 minutes
- Évaluez vos acquis : avant la formation•30 minutes
- Quiz du module 14•45 minutes
Instructeur

Offert par
En savoir plus sur Apprentissage automatique
Statut : PrévisualisationPrévisualisationNNortheastern University
Cours
Statut : PrévisualisationPrévisualisationNNortheastern University
Cours
Statut : Essai gratuitEssai gratuitSpécialisation
Statut : PrévisualisationPrévisualisationBBirla Institute of Technology & Science, Pilani
Cours
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Foire Aux Questions
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous achetez un certificat, vous avez accès à tous les supports de cours, y compris les devoirs notés. Une fois le cours terminé, votre certificat électronique sera ajouté à votre page de réalisations. Vous pourrez alors l'imprimer ou l'ajouter à votre profil LinkedIn.
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.
Plus de questions
Aide financière disponible,




