Traitement du langage naturel naturel (NLP) appliqué à l'ingénierie - Partie 1

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Traitement du langage naturel naturel (NLP) appliqué à l'ingénierie - Partie 1

Instructeur : Ramin Mohammadi

Inclus avec

Demander à Coursera

7 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

3 semaines à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

7 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

3 semaines à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

Compétences que vous acquerrez

Catégorie : Intelligence artificielle et apprentissage automatique (IA/ML)
Catégorie : Traitement du langage naturel
Catégorie : Réseaux neuronaux artificiels
Catégorie : Optimisation du modèle
Catégorie : Apprentissage profond
Catégorie : Apprentissage supervisé
Catégorie : Analyse de dépendance
Catégorie : Emboîtements
Catégorie : Apprentissage automatique
Catégorie : Évaluation du modèle
Catégorie : Méthodes d'apprentissage automatique

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

22 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Il y a 7 modules dans ce cours

Bienvenue dans ce cours consacré au traitement du langage naturel appliqué à l’ingénierie. Ce cours a pour objectif de vous permettre d’acquérir une compréhension approfondie du TALN, un domaine clé de l’intelligence artificielle qui permet aux ordinateurs de comprendre, d’interpréter et de générer le langage humain. Tout au long de ce cours, vous explorerez un large éventail de sujets, allant des tâches fondamentales du TAL telles que la classification de textes et la reconnaissance d’entités nommées (NER) aux techniques avancées de traduction automatique neuronale et aux méthodes d’optimisation essentielles à l’apprentissage automatique. Nous nous pencherons sur les complexités liées à l’enseignement du langage aux machines, en abordant des défis tels que l’ambiguïté, la grammaire et les nuances culturelles. À l’issue de cette première partie du cours, vous disposerez d’une compréhension fondamentale du fonctionnement des systèmes modernes de TALN, en particulier ceux faisant appel à l’apprentissage automatique et à l’apprentissage profond. Ces thèmes vous donneront les moyens de créer, d’analyser et d’améliorer des systèmes de TALN dans de nombreuses applications.

Ce module propose une exploration approfondie du traitement du langage naturel (NLP), un domaine essentiel de l'intelligence artificielle qui permet aux ordinateurs de comprendre, d'interpréter et de générer le langage humain. En associant la linguistique informatique à l'apprentissage automatique, le NLP trouve des applications dans diverses technologies, allant des chatbots et de l'analyse des sentiments à la traduction automatique et à la reconnaissance vocale. Ce module présente les tâches fondamentales du TALN, telles que la classification de textes, la reconnaissance d’entités nommées (NER) et la traduction automatique neuronale, en illustrant comment ces applications façonnent les interactions réelles avec l’IA. De plus, il met en évidence les complexités liées à l’enseignement du langage aux machines, notamment la gestion de l’ambiguïté, de la grammaire et des nuances culturelles. Tout au long de ce cours, vous acquerrez une expérience pratique et des connaissances sur des techniques clés telles que la représentation des mots et la sémantique distributionnelle, ce qui vous préparera à relever les défis linguistiques rencontrés dans les systèmes d’IA modernes.

Inclus

4 vidéos19 lectures2 devoirs1 élément d'application

4 vidéosTotal 6 minutes

Introduction au cours3 minutes
Rencontrez vos professeurs1 minute
Traitement du langage naturel (NLP)1 minute
Représenter le sens d'un mot1 minute

19 lecturesTotal 154 minutes

Introduction au cours2 minutes
Programme - Traitement du langage naturel appliqué à l'ingénierie, 1re partie10 minutes
Intégrité académique1 minute
Connaissances préalables recommandées100 minutes
Semaine 1 Introduction2 minutes
Introduction à la NLP5 minutes
Exemple : Chatbots2 minutes
Exemple : Filtrage des courriels2 minutes
Exemple : Analyse des sentiments3 minutes
Exemple : GPT - 33 minutes
Exemple : Capacités du ChatGPT5 minutes
Traitement du langage naturel1 minute
L'évolution des langues en images2 minutes
Comment représenter le sens d'un mot ?2 minutes
Comment obtenir un sens utilisable dans un ordinateur ?4 minutes
Les mots en tant que symboles discrets5 minutes
Représenter les mots en fonction de leur contexte2 minutes
Vecteurs de mots2 minutes
Dernières réflexions sur la NLP1 minute

2 devoirsTotal 36 minutes

Évaluez vos acquis : qu'est-ce que la PNL ?18 minutes
Évaluez votre apprentissage : la motivation18 minutes

1 élément d'applicationTotal 15 minutes

Les défis de l'enseignement des langues à l'IA15 minutes

Ce module est consacré aux techniques d’optimisation essentielles à l’apprentissage automatique, en particulier dans le cadre des tâches de traitement du langage naturel (NLP). Il présente la descente de gradient (GD), un algorithme fondamental utilisé pour minimiser les fonctions de coût en ajustant de manière itérative les paramètres du modèle. Vous explorerez des variantes telles que la descente stochastique du gradient (SGD) et la descente du gradient par mini-lots afin d’en savoir plus sur leur efficacité dans le traitement de grands ensembles de données. Des méthodes avancées telles que Momentum et Adam sont abordées pour vous permettre de comprendre comment améliorer la vitesse de convergence en lissant les mises à jour et en adaptant les taux d’apprentissage. Ce module aborde également des techniques du second ordre, telles que la méthode de Newton et les méthodes quasi-Newton (par exemple, BFGS), qui exploitent les informations de courbure pour une optimisation plus directe, bien qu’elles impliquent des coûts de calcul plus élevés. Dans l’ensemble, ce module met l’accent sur l’équilibre entre efficacité, précision et faisabilité computationnelle dans l’optimisation des modèles d’apprentissage automatique.

Inclus

2 vidéos16 lectures3 devoirs

2 vidéosTotal 8 minutes

Apprentissage automatique et NLP4 minutes
Techniques d'optimisation4 minutes

16 lecturesTotal 82 minutes

Vue d'ensemble de la semaine 22 minutes
Apprentissage automatique2 minutes
Variations de la descente de gradient2 minutes
Types de ML dans la PNL6 minutes
Qu'est-ce qu'un modèle en PNL et comment apprend-il ?6 minutes
Comprendre les fonctions de coût2 minutes
Minimiser la fonction de coût dans le NLP10 minutes
L'importance des techniques d'optimisation1 minute
Pourquoi le SGD fonctionne-t-il ?10 minutes
Matrice jacobienne et matrice hessienne5 minutes
L'élan10 minutes
Méthodes de Newton5 minutes
Méthodes de Quasi-Newton5 minutes
Propagation quadratique moyenne (RMSProp)5 minutes
Estimation adaptative du moment (Adam)10 minutes
Défis généraux des techniques d'optimisation de second ordre1 minute

3 devoirsTotal 81 minutes

Évaluez vos acquis : l'apprentissage automatique en traitement du langage naturel18 minutes
Évaluez votre apprentissage : techniques d'optimisation18 minutes
Quiz du module 245 minutes

Ce module aborde la reconnaissance d’entités nommées (NER), une tâche CORE du traitement du langage naturel (NLP) qui consiste à identifier et à classer des entités telles que des personnes, des lieux et des organisations dans un texte. Nous commencerons par examiner comment la régression logistique peut être utilisée pour modéliser la NER en tant que problème de classification binaire, bien que cette approche présente des limites en termes de complexité et de prise en compte du contexte. Nous passerons ensuite à des techniques plus avancées, telles que les réseaux neuronaux, qui excellent dans le traitement des modèles complexes et des données à grande échelle avec lesquels les modèles traditionnels peinent à composer. La capacité des réseaux neuronaux à apprendre des caractéristiques hiérarchiques les rend idéaux pour les tâches de NER, car ils peuvent saisir les informations contextuelles plus efficacement que des modèles plus simples. Tout au long de ce module, nous comparons ces méthodes et mettons en évidence la manière dont les approches d’apprentissage profond, telles que les réseaux neuronaux récurrents (RNN) et les transformateurs comme BERT, améliorent la précision et l’évolutivité du NER.

Inclus

2 vidéos14 lectures3 devoirs1 élément d'application

2 vidéosTotal 4 minutes

Définitions des réseaux neuronaux4 minutes
Propagation sur le réseau0 minutes

14 lecturesTotal 89 minutes

Vue d'ensemble de la semaine 32 minutes
Réseaux neuronaux2 minutes
Reconnaissance des entités nommées (NER)5 minutes
Le NER en tant que problème de régression binaire5 minutes
Réseau de neurones5 minutes
Réseau de neurones5 minutes
Comment un réseau neuronal apprend-il ?10 minutes
Représentation mathématique20 minutes
Étapes de l'algorithme de rétropropagation5 minutes
Gradient stochastique5 minutes
Tâches de classification5 minutes
Tâches de séquence à séquence5 minutes
Tâches d'étiquetage des séquences5 minutes
Tâches de régression et mesures de divergence10 minutes

3 devoirsTotal 81 minutes

Évaluez vos acquis : NER et réseaux neuronaux18 minutes
Évaluez vos acquis : les fonctions de coût18 minutes
Quiz du module 345 minutes

1 élément d'applicationTotal 10 minutes

Quelques fonctions d'activation courantes10 minutes

Les modèles Word2Vec et GloVe sont des techniques d'encodage de mots très répandues dans le domaine du traitement du langage naturel (TLN), chacune offrant des avantages propres. Word2Vec, développé par Google, s'appuie sur deux modèles clés : le « Continuous Bag of Words » (CBOW) et le « Skip-gram », qui visent à prédire un mot en fonction de son contexte ou inversement (Word2Vec). Le modèle GloVe, quant à lui, créé par l’université de Stanford, combine des approches basées sur le comptage et des approches prédictives en exploitant des matrices de cooccurrence de mots pour apprendre des vecteurs de mots (GloVe). Les deux modèles représentent les mots dans un espace vectoriel de haute dimension et capturent les relations sémantiques. Word2Vec se concentre sur les contextes locaux, apprenant efficacement à partir de grands ensembles de données, tandis que GloVe met l’accent sur les schémas globaux de cooccurrence des mots à l’échelle de l’ensemble du corpus, révélant ainsi des associations de mots plus profondes. Ces représentations permettent d’effectuer des tâches telles que la résolution d’analogies, la similarité sémantique et d’autres calculs linguistiques, ce qui les rend essentielles aux applications modernes du traitement du langage naturel (NLP).

Inclus

3 vidéos29 lectures4 devoirs1 élément d'application

3 vidéosTotal 11 minutes

Processus de formation du GLoVe5 minutes
Word2Vec4 minutes
Skip-Gram2 minutes

29 lecturesTotal 267 minutes

Aperçu de la semaine 42 minutes
Introduction à GLoVe5 minutes
Matrice de cooccurrence5 minutes
Objectif : Ratio de cooccurrences5 minutes
Calcul des rapports de probabilité5 minutes
Symétrie et linéarité à GloVe5 minutes
Minimiser la fonction de coût et optimiser les vecteurs de mots5 minutes
Processus d'optimisation10 minutes
Vecteurs du mot de la fin2 minutes
Propriétés implicites dans GloVe5 minutes
GLoVe Introduction2 minutes
Qu'est-ce que la modélisation linguistique ?5 minutes
Matrice de cooccurrence5 minutes
Représentations vectorielles pour les mots3 minutes
Sac de mots continu (CBOW)5 minutes
Objectifs mathématiques10 minutes
Objectifs mathématiques 215 minutes
Limites du CBOW1 minute
Skip-Gram15 minutes
Dérivation du gradient15 minutes
Le défi de la formation au saut de mouton10 minutes
Perspective de la classification binaire10 minutes
Gradient de l'objectif d'échantillonnage négatif10 minutes
Connexion entre le Skip-Gram, l'échantillonnage négatif et l'échantillonnage unique2 minutes
Skip-Gram avec échantillonnage négatif pour tous les mots10 minutes
Échantillonnage négatif dans le modèle Skip-Gram10 minutes
Exemple de Word2Vec30 minutes
Exemple pratique de Word2Vec 30 minutes
Exemple 2 de Word2Vec30 minutes

4 devoirsTotal 99 minutes

Évaluez vos acquis : GLoVe18 minutes
Évaluez vos acquis : Word2Vec et CBOW18 minutes
Évaluez votre apprentissage : Skip-Gram et échantillonnage négatif18 minutes
Quiz du module 445 minutes

1 élément d'applicationTotal 3 minutes

Processus de formation GloVe3 minutes

Ce module explore les techniques d'évaluation des modèles de traitement du langage naturel (NLP), en mettant l'accent à la fois sur les méthodes d'évaluation intrinsèques et extrinsèques. L'évaluation intrinsèque évalue les performances du modèle sur la base de critères internes, tels que la qualité de l'embedding des mots, la précision de l'analyse syntaxique et la perplexité du modèle linguistique. À l'inverse, l'évaluation extrinsèque mesure l'efficacité du modèle dans des applications concrètes, notamment des tâches telles que la traduction automatique, l'analyse des sentiments et la reconnaissance d'entités nommées. Vous en apprendrez également davantage sur les principales différences entre ces types d’évaluation, ainsi que sur l’importance du contexte et de l’application pour déterminer l’utilité d’un modèle. De plus, vous passerez en revue des indicateurs spécifiques tels que la perte d’entropie croisée, la perplexité, les scores BLEU et ROUGE, ce qui vous permettra d’acquérir une compréhension approfondie de la manière d’évaluer et d’améliorer les modèles de TALN.

Inclus

9 lectures2 devoirs1 élément d'application

9 lecturesTotal 99 minutes

Aperçu de la semaine 52 minutes
Concept général d'évaluation (en TALN)15 minutes
Principales différences entre l'évaluation intrinsèque et l'évaluation extrinsèque2 minutes
Perte d'entropie croisée - Intrinsèque10 minutes
Entropie croisée et apprentissage à partir de prédictions erronées15 minutes
Perplexité - Intrinsèque15 minutes
Score BLEU (Bilingual Evaluation Understudy) - Extrinsèque15 minutes
Récupération et précision dans la synthèse ou la traduction de textes15 minutes
Modèle de remplacement axé sur la récupération pour l'évaluation de la synthèse (ROUGE) - Extrinsèque10 minutes

2 devoirsTotal 63 minutes

Évaluez votre apprentissage : évaluation du modèle PNL18 minutes
Quiz du module 545 minutes

1 élément d'applicationTotal 10 minutes

Techniques d'évaluation10 minutes

Ce module explore diverses techniques de modélisation des thèmes dans le traitement du langage naturel (TLN), en mettant l’accent sur des méthodes telles que l’analyse sémantique latente (LSA), la factorisation matricielle non négative (NMF) et l’allocation latente de Dirichlet (LDA). Il commence par une introduction à la factorisation matricielle et à l’importance de transformer les données textuelles en représentations numériques. Vous approfondirez les mécanismes de l’LSA et de la NMF, en vous intéressant particulièrement à leur utilisation du TF-IDF et de la décomposition en valeurs singulières (SVD) pour mettre au jour des structures sémantiques latentes. De plus, vous passerez en revue l’approche probabiliste de la LDA en matière de modélisation de thèmes, en expliquant son recours aux distributions de Dirichlet et à l’inférence bayésienne pour identifier les thèmes cachés au sein d’un corpus. À travers des exemples détaillés et des explications mathématiques, ce module offre une compréhension approfondie de la manière dont ces techniques peuvent être appliquées pour extraire des thèmes pertinents à partir de vastes ensembles de données textuelles.

Inclus

1 vidéo16 lectures4 devoirs1 élément d'application

1 vidéoTotal 5 minutes

Modélisation des thèmes5 minutes

16 lecturesTotal 133 minutes

Vue d'ensemble de la semaine 62 minutes
Factorisation des matrices1 minute
Analyse sémantique latente (LSA)15 minutes
Exemple LSA15 minutes
Modélisation de thèmes à l'aide de l'analyse sémantique latente (LSA)5 minutes
Dimensions et applications5 minutes
Factorisation de matrice non négative (NMF)5 minutes
Mise en œuvre de la NMF7 minutes
Exemple numérique de NMF15 minutes
Applications de la NMF2 minutes
Allocation de Dirichlet Latent (LDA)5 minutes
Définition du problème et hypothèses clés1 minute
Modèle mathématique de l'analyse des composantes principales (LDA)10 minutes
Étapes de l'analyse factorielle linéaire (LDA) : explication mathématique15 minutes
Optimisation de la probabilité a posteriori dans l'analyse LDA15 minutes
Exemple complet15 minutes

4 devoirsTotal 99 minutes

Évaluez vos acquis : analyse sémantique latente18 minutes
Évaluez vos acquis : factorisation non négative des matrices18 minutes
Évaluez votre apprentissage : allocation latente de Dirichlet18 minutes
Quiz du module 645 minutes

1 élément d'applicationTotal 10 minutes

Récapitulatif sur le NMF et le LDA10 minutes

Ce module aborde les techniques essentielles de l'analyse syntaxique et sémantique dans le traitement du langage naturel (NLP). Vous commencerez par explorer les structures linguistiques, en vous concentrant sur la structure phrastique et la structure de dépendance, qui sont fondamentales pour comprendre la syntaxe des phrases. Vous passerez ensuite en revue diverses méthodes d’analyse, notamment l’analyse de dépendance basée sur les transitions et celle basée sur les graphes, en soulignant leurs avantages et leurs défis respectifs. De plus, vous aborderez l’analyse syntaxique neuronale basée sur les transitions, qui exploite les réseaux neuronaux pour améliorer la précision et l’efficacité. Enfin, le module aborde l’analyse sémantique, en soulignant son rôle dans la mise en correspondance des phrases avec des représentations formelles du sens, ce qui est crucial pour des applications telles que les systèmes de dialogue et l’extraction d’informations.

Inclus

2 vidéos32 lectures4 devoirs

2 vidéosTotal 5 minutes

Exemples d'analyse syntaxique basée sur les transitions et d'analyse syntaxique des graphes2 minutes
Progrès des réseaux neuronaux en analyse syntaxique : dépendance et sémantique3 minutes

32 lecturesTotal 160 minutes

Aperçu de la semaine 72 minutes
Introduction à l'analyse syntaxique des dépendances5 minutes
Qu'est-ce qu'un constituant ?5 minutes
Pseudo-clivage et fragments de phrase5 minutes
Remplacement de phrases correctes5 minutes
Désignation des autres phases5 minutes
Domination immédiate, domination et relations de parenté féminines5 minutes
Analyse syntaxique - Structure phrastique10 minutes
Structure de la phrase3 minutes
Règles de structure des phrases et explications2 minutes
Construire l'arbre2 minutes
Résumé5 minutes
Structure des dépendances2 minutes
Concepts clés et exemple10 minutes
Avantages de la structure des dépendances5 minutes
Qu'est-ce que l'analyse syntaxique basée sur les transitions ?2 minutes
La méthode gloutonne basée sur les transitions10 minutes
Type 2 : analyseur « Shift-Reduce »10 minutes
Introduction5 minutes
Concepts clés et configuration10 minutes
Avantages, défis et éléments à prendre en compte5 minutes
Introduction2 minutes
Concepts clés de l'analyse syntaxique des dépendances basée sur les graphes5 minutes
Exemple détaillé10 minutes
Avantages et inconvénients2 minutes
Analyse syntaxique basée sur les transitions vs analyse syntaxique basée sur les graphes1 minute
Analyse sémantique5 minutes
Exemple 15 minutes
Exemple 25 minutes
Exemple 35 minutes
Exemple 45 minutes
Félicitations !2 minutes

4 devoirsTotal 135 minutes

Évaluez vos acquis : les constituants et l'identification des éléments de la phrase30 minutes
Évaluez vos acquis : structure des phrases et des dépendances30 minutes
Évaluez vos acquis : l'analyse syntaxique30 minutes
Quiz du module 745 minutes

Instructeur

Ramin Mohammadi

Northeastern University

6 Cours962 apprenants

Offert par

Northeastern University

En savoir plus sur Apprentissage automatique

Statut : Prévisualisation
Northeastern University
NLP in Engineering: Concepts & Real-World Applications
Cours
Statut : Prévisualisation
Northeastern University
Applied Natural Language Processing in Engineering Part 2
Cours
Statut : Prévisualisation
Birla Institute of Technology & Science, Pilani
Natural Language Processing
Cours
Statut : Prévisualisation
Birla Institute of Technology & Science, Pilani
Natural Language Processing
Cours

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.

Lorsque vous achetez un certificat, vous avez accès à tous les supports de cours, y compris les devoirs notés. Une fois le cours terminé, votre certificat électronique sera ajouté à votre page de réalisations. Vous pourrez alors l'imprimer ou l'ajouter à votre profil LinkedIn.

Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.