Traitement du langage naturel naturel (NLP) appliqué à l'ingénierie - Partie 2

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Traitement du langage naturel naturel (NLP) appliqué à l'ingénierie - Partie 2

Instructeur : Ramin Mohammadi

Inclus avec

7 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

3 semaines à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

7 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

3 semaines à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

Compétences que vous acquerrez

Catégorie : Modèle de Markov
Catégorie : Apprentissage par transfert
Catégorie : Modèle de formation
Catégorie : Réseaux neuronaux récurrents (RNN)
Catégorie : Réseaux neuronaux artificiels
Catégorie : Architectures de modèles génératifs
Catégorie : Optimisation du modèle
Catégorie : Traitement du langage naturel
Catégorie : Apprentissage profond
Catégorie : Méthodes d'apprentissage automatique
Catégorie : Modélisation des grandes langues
Catégorie : Prétraitement des données

Outils que vous découvrirez

Catégorie : Visage étreint
Catégorie : PyTorch (Bibliothèque d'apprentissage automatique)

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

21 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Il y a 7 modules dans ce cours

Ce cours s'adresse tout particulièrement aux ingénieurs en informatique, aux data scientists et aux étudiants de troisième cycle en informatique ou dans des filières d'ingénierie qui souhaitent acquérir une expertise dans la conception et le déploiement de systèmes de traitement du langage naturel afin de résoudre des problèmes concrets liés à la compréhension du langage.

Vous maîtriserez les tâches fondamentales du TALN, telles que le marquage des catégories grammaticales, la reconnaissance d’entités nommées, l’analyse des sentiments et la traduction automatique neuronale, tout en mettant en œuvre diverses architectures neuronales, allant des réseaux neuronaux récurrents (RNN) et des RNN bidirectionnels aux champs aléatoires conditionnels (CRF) et aux modèles Transformer de pointe. Ce cours met l’accent sur la mise en pratique grâce à de nombreux travaux pratiques et projets, au cours desquels vous développerez des pipelines complets de TALN à l’aide de frameworks tels que PyTorch et Hugging Face, en apprenant à prétraiter les données, à entraîner des modèles et à évaluer les performances à l’aide de métriques conformes aux normes de l’industrie. À l’issue de ce cours, vous disposerez à la fois des connaissances théoriques et des compétences pratiques nécessaires pour concevoir, mettre en œuvre et optimiser des solutions de TALN destinées à des applications d’ingénierie concrètes, allant des chatbots et des systèmes de traduction aux outils d’extraction d’informations et d’analyse de texte. Le programme se termine par un projet de fin d’études complet dans lequel vous appliquerez les différentes techniques apprises tout au long de la formation pour résoudre un défi complexe en traitement du langage. Vous disposerez ainsi des connaissances théoriques nécessaires pour aborder des problèmes complexes de traitement du langage en milieu industriel, ce qui vous permettra de créer des applications de TAL prêtes à l’emploi, capables de comprendre, d’interpréter et de générer efficacement le langage humain.

Ce module aborde en détail l’étape cruciale de prétraitement qu’est la tokenisation en TALN, qui consiste à segmenter un texte en unités plus petites appelées « tokens ». Vous découvrirez diverses techniques de tokenisation, notamment la tokenisation au niveau des caractères, au niveau des mots, par encodage par paires d’octets (BPE), WordPiece et Unigram. Vous examinerez ensuite l’importance des processus de normalisation et de pré-tokenisation pour garantir l’uniformité du texte et améliorer la précision de la tokenisation. À travers des exemples concrets et des exercices pratiques, les étudiants apprendront à gérer les problèmes liés aux mots hors vocabulaire (OOV), à gérer efficacement les grands vocabulaires et à comprendre les complexités de calcul impliquées. À la fin de ce module, vous disposerez des connaissances nécessaires pour mettre en œuvre et optimiser des méthodes de tokenisation destinées à diverses applications de traitement du langage naturel (NLP).

Inclus

1 vidéo13 lectures2 devoirs1 élément d'application

1 vidéoTotal 1 minute

Rencontrez vos professeurs1 minute

13 lecturesTotal 69 minutes

Introduction au cours2 minutes
Programme - Traitement du langage naturel appliqué à l'ingénierie, 2e partie10 minutes
Intégrité académique1 minute
Vue d'ensemble de la semaine 82 minutes
Introduction5 minutes
Pré-tokenisation5 minutes
Tokenisation par caractères5 minutes
Tokenisation au niveau des mots5 minutes
Codage par paires d'octets (BPE)10 minutes
Tokenisation WordPiece10 minutes
Tokenisation Unigram10 minutes
Élagage du vocabulaire dans la tokenisation par unigrammes2 minutes
Résumé et conclusions2 minutes

2 devoirsTotal 75 minutes

Évaluez vos acquis : la tokenisation30 minutes
Quiz du module 845 minutes

1 élément d'applicationTotal 10 minutes

L'algorithme de Viterbi pour la tokenisation10 minutes

Dans ce module, nous aborderons les modèles fondamentaux du traitement du langage naturel (TLN), en mettant l'accent sur les modèles linguistiques, les réseaux neuronaux à propagation directe (FFNN) et les modèles de Markov cachés (HMM). Les modèles linguistiques jouent un rôle crucial dans la prédiction et la génération de séquences de texte en attribuant des probabilités aux mots ou aux expressions d'une phrase, ce qui permet des applications telles que la saisie semi-automatique et la génération de texte. Les FFNN, bien que limités à des contextes de taille fixe, constituent des architectures neuronales fondamentales utilisées dans la modélisation du langage, permettant d’apprendre des relations complexes entre les mots grâce à des transformations non linéaires. À l’inverse, les HMM modélisent des séquences en se basant sur des états cachés, qui influencent les résultats observables. Ils sont particulièrement utiles dans des tâches telles que le marquage des catégories grammaticales et la reconnaissance vocale. Au fil de ce module, nous examinerons également les avancées récentes, telles que l’analyse syntaxique basée sur les transitions neuronales, ainsi que l’évolution des modèles linguistiques vers des architectures sophistiquées comme les « transformers » et les modèles pré-entraînés à grande échelle tels que BERT et GPT. Ce module offre une vue d’ensemble complète de l’évolution de la modélisation du langage, depuis les méthodes statistiques jusqu’aux architectures neuronales de pointe.

Inclus

2 vidéos19 lectures4 devoirs

2 vidéosTotal 8 minutes

Modèle de langage4 minutes
Modèles de Markov cachés4 minutes

19 lecturesTotal 183 minutes

Aperçu de la semaine 92 minutes
Introduction aux modèles linguistiques5 minutes
Devoir sur les probabilités dans les modèles linguistiques2 minutes
Évolution des modèles linguistiques10 minutes
Modèles de pointe2 minutes
N-Gram5 minutes
Probabilités dans les modèles linguistiques10 minutes
Exemple : Le chat était assis sur le tapis10 minutes
Limites des modèles N-grammes5 minutes
Le FFNN dans la modélisation du langage20 minutes
Avantages et inconvénients des réseaux neuronaux feed-forward (FFNN)5 minutes
Introduction aux HMM10 minutes
Modèles de Markov cachés2 minutes
Représentation mathématique des modèles HMM15 minutes
Problème de vraisemblance : algorithme a posteriori10 minutes
Problème de décodage : l'algorithme de Viterbi15 minutes
Problème d'apprentissage : l'algorithme de Baum-Welch15 minutes
Exemple de modèle HMM20 minutes
Les modèles HMM dans la reconnaissance vocale20 minutes

4 devoirsTotal 120 minutes

Évaluez vos acquis : modèles linguistiques30 minutes
Évaluez vos acquis : réseaux neuronaux de type FFNN15 minutes
Évaluez vos acquis : les modèles HMM30 minutes
Quiz du module 945 minutes

Dans ce module, nous allons explorer les réseaux neuronaux récurrents (RNN), une architecture fondamentale de l'apprentissage profond conçue pour les données séquentielles. Les RNN sont particulièrement adaptés aux tâches où l'ordre des entrées a son importance, telles que la prédiction de séries chronologiques, la modélisation linguistique et la reconnaissance vocale. Contrairement aux réseaux neuronaux traditionnels, les RNN disposent de connexions qui leur permettent de « se souvenir » des informations issues des étapes précédentes en partageant des paramètres d’un pas de temps à l’autre. Cette capacité leur permet de saisir les dépendances temporelles dans les données, ce qui en fait des outils puissants pour les tâches basées sur des séquences. Cependant, les RNN posent des défis tels que la disparition et l’explosion des gradients, qui affectent leur capacité à apprendre des dépendances à long terme. Tout au long de ce module, vous explorerez différentes variantes de RNN, telles que les réseaux à mémoire à court et long terme (LSTM) et les unités récurrentes à porte (GRU), qui permettent de surmonter ces défis. Vous vous plongerez également dans les techniques d’entraînement avancées et les applications des RNN à des problèmes concrets de traitement du langage naturel (NLP) et de séries chronologiques.

Inclus

2 vidéos22 lectures2 devoirs1 élément d'application

2 vidéosTotal 4 minutes

Réseaux neuronaux récurrents4 minutes
Le processus RNN0 minutes

22 lecturesTotal 221 minutes

Aperçu de la semaine 102 minutes
Réseaux neuronaux récurrents (RNN)2 minutes
Défis et applications des réseaux neuronaux récurrents (RNN)5 minutes
Partage des paramètres dans les réseaux neuronaux récurrents (RNN)5 minutes
Systèmes dynamiques5 minutes
Des systèmes dynamiques aux réseaux neuronaux récurrents (RNN)10 minutes
Calcul du gradient dans un réseau neuronal récurrent (RNN)10 minutes
Avantages et inconvénients des réseaux neuronaux récurrents (RNN)5 minutes
Entraînement d'un modèle linguistique RNN20 minutes
Problèmes liés aux RNN15 minutes
Comment résoudre ces problèmes ?15 minutes
RNN à portes15 minutes
Équations LSTM15 minutes
Unité récurrente clôturée (GRU)10 minutes
Réseaux de neurones résiduels20 minutes
Le « skip connection » : la clé pour comprendre les résidus15 minutes
Conventions utilisées2 minutes
Analyse étape par étape 1 - 25 minutes
Analyse détaillée, étape par étape : 3 A - G15 minutes
Analyse détaillée étape par étape 3 H - N15 minutes
Analyse détaillée, étape par étape : 4 à 610 minutes
Calcul de la perplexité5 minutes

2 devoirsTotal 75 minutes

Évaluez vos acquis : les réseaux neuronaux récurrents (RNN)30 minutes
Quiz du module 1045 minutes

1 élément d'applicationTotal 10 minutes

Introduction aux réseaux LSTM, GRU et résiduels10 minutes

Ce module initie les étudiants aux techniques avancées de traitement du langage naturel (NLP), en mettant l'accent sur des tâches fondamentales telles que le marquage des catégories grammaticales (PoS), l'analyse des sentiments et la modélisation de séquences à l'aide de réseaux neuronaux récurrents (RNN). Les étudiants examineront comment le marquage des parties du discours aide à comprendre les structures grammaticales, permettant ainsi des applications telles que la traduction automatique et la reconnaissance d'entités nommées (NER). Le module explore en détail l’analyse des sentiments, en mettant en avant diverses approches allant des modèles traditionnels d’apprentissage automatique (par exemple, Naive Bayes) aux techniques avancées d’apprentissage profond (par exemple, les RNN bidirectionnels et les transformateurs). Les étudiants apprendront à mettre en œuvre une compréhension contextuelle à la fois ascendante et descendante à l’aide de RNN bidirectionnels, ce qui améliore la précision dans les tâches où l’ordre des séquences a une incidence sur le sens. À la fin du cours, les étudiants auront acquis une expérience pratique de la construction de modèles de TALN destinés à des applications concrètes, ce qui leur permettra de traiter des données séquentielles et de saisir les dépendances complexes dans l’analyse de textes.

Inclus

1 vidéo15 lectures4 devoirs

1 vidéoTotal 5 minutes

Introduction au marquage PoS, aux réseaux neuronaux récurrents bidirectionnels (RNN) et à l'analyse des sentiments5 minutes

15 lecturesTotal 113 minutes

Aperçu de la semaine 112 minutes
Introduction au marquage PoS10 minutes
Comment fonctionne le marquage PoS ?10 minutes
Défis et avantages du marquage PoS5 minutes
Utilisation des réseaux neuronaux récurrents (RNN) pour le marquage PoS10 minutes
Étapes du marquage PoS avec un RNN5 minutes
Utilisation de réseaux LSTM ou GRU à la place de réseaux RNN simples10 minutes
Conclusion10 minutes
Motivation2 minutes
Réseaux neuronaux récurrents bidirectionnels10 minutes
Réseaux neuronaux récurrents multicouches10 minutes
Introduction5 minutes
Approches utilisant les réseaux neuronaux récurrents (RNN)20 minutes
Autres approches de l'analyse des sentiments2 minutes
Conclusion2 minutes

4 devoirsTotal 135 minutes

Évaluez vos acquis : PoS30 minutes
Évaluez vos acquis : les réseaux neuronaux récurrents bidirectionnels (RNN)30 minutes
Évaluez vos acquis : analyse des sentiments30 minutes
Quiz du module 11 45 minutes

Ce module vous présente les tâches CORE et les techniques avancées du traitement du langage naturel (NLP), en mettant l'accent sur la prédiction structurée, la traduction automatique et l'étiquetage de séquences. Vous explorerez des thèmes fondamentaux tels que la reconnaissance d’entités nommées (NER), le marquage des catégories grammaticales (PoS) et l’analyse des sentiments, et vous utiliserez des architectures de réseaux neuronaux telles que les réseaux neuronaux récurrents (RNN), les réseaux à mémoire à court et long terme (LSTM) et les champs aléatoires conditionnels (CRF). Ce module abordera les concepts clés de la modélisation de séquences, tels que les RNN bidirectionnels et multicouches, qui prennent en compte à la fois le contexte passé et futur afin d’améliorer la précision de tâches telles que la reconnaissance d’entités nommées (NER) et l’étiquetage des parties du discours (PoS). De plus, vous vous plongerez dans la traduction automatique neuronale (NMT), en étudiant les modèles encodeur-décodeur dotés de mécanismes d’attention pour relever les défis liés à la traduction de longues séquences. Les mises en œuvre pratiques consisteront à intégrer ces modèles dans des applications concrètes, en mettant l’accent sur la gestion des structures linguistiques complexes, des mots rares et des dépendances séquentielles. À l’issue de ce module, vous serez capable de construire et d’optimiser des modèles d’apprentissage profond pour diverses tâches de traitement du langage naturel (NLP).

Inclus

3 vidéos18 lectures4 devoirs

3 vidéosTotal 7 minutes

Introduction au CRF3 minutes
Introduction à la reconnaissance des entités nominales (NER) et à la traduction automatique (NMT)4 minutes
Visualisation du processus NMT 0 minutes

18 lecturesTotal 164 minutes

Vue d'ensemble de la semaine 122 minutes
Définition du CRF10 minutes
Modèle CRF avec LSTM10 minutes
Combinaison du modèle LSTM et du modèle CRF20 minutes
Calcul de la probabilité d'une séquence, de la probabilité logarithmique et de l'objectif d'apprentissage15 minutes
Décodage : déterminer la meilleure séquence d'étiquettes5 minutes
Détails sur les composants du modèle LSTM-CRF15 minutes
Résumé de la matrice de transition dans le CRF5 minutes
Reconnaissance des entités nommées (NER)10 minutes
NER à l'aide de RNN/LSTM10 minutes
BiLSTM pour la reconnaissance des entités nominales (NER)10 minutes
Couche CRF pour le marquage de séquençage10 minutes
L'attention dans la reconnaissance des entités nommées (NER)10 minutes
Tableau : Liste alphabétique des balises de catégorie grammaticale utilisées dans le projet Penn Treebank5 minutes
Présentation de la traduction automatique5 minutes
Modèle « séquence à séquence » pour la traduction automatique (NMT)10 minutes
Apprentissage en traduction automatique : optimisation et fonction de perte10 minutes
Codage par paires d'octets (BPE) pour la gestion des mots rares2 minutes

4 devoirsTotal 135 minutes

Évaluez vos acquis : CRF30 minutes
Évaluez vos acquis : NER30 minutes
Évaluez vos acquis : NMT30 minutes
Quiz du module 1245 minutes

Dans ce module, nous nous intéresserons aux mécanismes d’attention et explorerons l’évolution et l’importance de l’attention dans les réseaux neuronaux, en commençant par son introduction dans la traduction automatique neuronale. Nous aborderons les défis posés par les modèles traditionnels de type « séquence à séquence » et la manière dont les mécanismes d’attention, en particulier dans les architectures Transformer, permettent de résoudre des problèmes tels que les dépendances à longue portée et la parallélisation, ce qui améliore la capacité du modèle à se concentrer de manière dynamique sur les parties pertinentes de la séquence d’entrée. Nous nous intéresserons ensuite aux Transformers et nous plongerons dans l’architecture révolutionnaire introduite par Vaswani et al. en 2017, qui a considérablement fait progresser le traitement du langage naturel. Nous aborderons les composants CORE des Transformers, notamment l’auto-attention, l’attention multi-têtes et l’encodage positionnel, afin d’expliquer comment ces innovations surmontent les limites des modèles séquence-séquence traditionnels et permettent un traitement parallèle efficace ainsi que la gestion des dépendances à longue portée dans le texte.

Inclus

2 vidéos25 lectures3 devoirs2 éléments d'application

2 vidéosTotal 9 minutes

Mécanismes d'attention3 minutes
Transformateurs6 minutes

25 lecturesTotal 239 minutes

Vue d'ensemble de la semaine 132 minutes
Introduction et motivation5 minutes
Modèles séquence-à-séquence5 minutes
Les défis des modèles Seq2Seq15 minutes
Mécanismes d'attention5 minutes
Modèles Seq2Seq généraux10 minutes
Processus d'attention détaillé dans Seq2Seq15 minutes
Introduction et architecture du Transformer2 minutes
Applications des architectures de transformateurs5 minutes
Clé, requête, valeur3 minutes
Attention à soi15 minutes
L'auto-attention comme mécanisme de routage5 minutes
Calcul et pondération des valeurs10 minutes
L'auto-attention sous forme matricielle10 minutes
Présentations de poste 10 minutes
L'intuition15 minutes
Non-linéarité élément par élément20 minutes
Attention à plusieurs têtes10 minutes
Forme de séquence-tuteur10 minutes
Transformateurs15 minutes
Types de transformateurs20 minutes
Attention croisée15 minutes
Processus de décodage avec attention croisée10 minutes
Inconvénients des transformateurs5 minutes
Conclusion2 minutes

3 devoirsTotal 105 minutes

Évaluez votre apprentissage : Attention30 minutes
Évaluez vos acquis : Transformer30 minutes
Quiz du module 1345 minutes

2 éléments d'applicationTotal 40 minutes

Visualisation multi-têtes20 minutes
Exemple d'encodeur-décodeur20 minutes

Dans ce module, nous nous intéresserons de près au pré-entraînement et explorerons son rôle fondamental dans les modèles modernes de traitement du langage naturel (NLP), en soulignant comment ces modèles sont initialement entraînés sur de vastes ensembles de données généraux afin d’apprendre les structures linguistiques et la sémantique. Cette phase de pré-entraînement, qui implique souvent des tâches telles que la modélisation linguistique masquée, dote les modèles de connaissances linguistiques étendues, qui peuvent ensuite être affinées pour des tâches spécifiques, ce qui améliore les performances et réduit le besoin de disposer de données spécifiques à ces tâches en grande quantité.

Inclus

1 vidéo19 lectures2 devoirs

1 vidéoTotal 5 minutes

Préparation à la formation5 minutes

19 lecturesTotal 209 minutes

Vue d'ensemble de la semaine 142 minutes
Introduction à la pré-formation15 minutes
Représentations lexicales pré-entraînées10 minutes
Apprendre à partir de la reconstruction des données d'entrée10 minutes
Pré-entraînement par modélisation linguistique20 minutes
Pré-entraînement pour trois types d'architectures10 minutes
BERT : Représentations de codeurs bidirectionnels à partir de transformateurs15 minutes
Pré-entraînement de BERT 10 minutes
Mise au point15 minutes
Réglage fin complet vs réglage fin avec optimisation des paramètres15 minutes
Limites des encodeurs pré-entraînés et extensions de BERT10 minutes
Pré-entraînement des décodeurs10 minutes
Transformateur génératif pré-entraîné (GPT)10 minutes
Lois d'échelle15 minutes
Quels types de notions le pré-apprentissage permet-il d'acquérir ?10 minutes
Pré-entraînement des réseaux encodeur-décodeur : quel objectif de pré-entraînement choisir ?15 minutes
Corruption de la portée : modèle T510 minutes
Transfert de connaissances vers des tâches en aval5 minutes
Félicitations !2 minutes

2 devoirsTotal 75 minutes

Évaluez vos acquis : avant la formation30 minutes
Quiz du module 1445 minutes

Instructeur

Ramin Mohammadi

Northeastern University

6 Cours962 apprenants

Offert par

Northeastern University

En savoir plus sur Apprentissage automatique

Statut : Prévisualisation
Northeastern University
Applied Natural Language Processing in Engineering Part 1
Cours
Statut : Prévisualisation
Northeastern University
NLP in Engineering: Concepts & Real-World Applications
Cours
Statut : Essai gratuit
Packt
Natural Language Processing with Real-World Projects
Spécialisation
Statut : Prévisualisation
Birla Institute of Technology & Science, Pilani
Natural Language Processing
Cours

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.

Lorsque vous achetez un certificat, vous avez accès à tous les supports de cours, y compris les devoirs notés. Une fois le cours terminé, votre certificat électronique sera ajouté à votre page de réalisations. Vous pourrez alors l'imprimer ou l'ajouter à votre profil LinkedIn.

Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.

Plus de questions

Visitez le Centre d'Aide pour les Étudiants

Aide financière disponible,