Northeastern University

Traitement du langage naturel naturel (NLP) appliqué à l'ingénierie - Partie 1

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Northeastern University

Traitement du langage naturel naturel (NLP) appliqué à l'ingénierie - Partie 1

Ramin Mohammadi

Instructeur : Ramin Mohammadi

Inclus avec Coursera Plus

Demander à Coursera

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
3 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
3 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Compétences que vous acquerrez

  • Catégorie : Intelligence artificielle et apprentissage automatique (IA/ML)
  • Catégorie : Traitement du langage naturel
  • Catégorie : Réseaux neuronaux artificiels
  • Catégorie : Optimisation du modèle
  • Catégorie : Apprentissage profond
  • Catégorie : Apprentissage supervisé
  • Catégorie : Analyse de dépendance
  • Catégorie : Emboîtements
  • Catégorie : Apprentissage automatique
  • Catégorie : Évaluation du modèle
  • Catégorie : Méthodes d'apprentissage automatique

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

22 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Il y a 7 modules dans ce cours

Ce module propose une exploration approfondie du traitement du langage naturel (NLP), un domaine essentiel de l'intelligence artificielle qui permet aux ordinateurs de comprendre, d'interpréter et de générer le langage humain. En associant la linguistique informatique à l'apprentissage automatique, le NLP trouve des applications dans diverses technologies, allant des chatbots et de l'analyse des sentiments à la traduction automatique et à la reconnaissance vocale. Ce module présente les tâches fondamentales du TALN, telles que la classification de textes, la reconnaissance d’entités nommées (NER) et la traduction automatique neuronale, en illustrant comment ces applications façonnent les interactions réelles avec l’IA. De plus, il met en évidence les complexités liées à l’enseignement du langage aux machines, notamment la gestion de l’ambiguïté, de la grammaire et des nuances culturelles. Tout au long de ce cours, vous acquerrez une expérience pratique et des connaissances sur des techniques clés telles que la représentation des mots et la sémantique distributionnelle, ce qui vous préparera à relever les défis linguistiques rencontrés dans les systèmes d’IA modernes.

Inclus

4 vidéos19 lectures2 devoirs1 élément d'application

Ce module est consacré aux techniques d’optimisation essentielles à l’apprentissage automatique, en particulier dans le cadre des tâches de traitement du langage naturel (NLP). Il présente la descente de gradient (GD), un algorithme fondamental utilisé pour minimiser les fonctions de coût en ajustant de manière itérative les paramètres du modèle. Vous explorerez des variantes telles que la descente stochastique du gradient (SGD) et la descente du gradient par mini-lots afin d’en savoir plus sur leur efficacité dans le traitement de grands ensembles de données. Des méthodes avancées telles que Momentum et Adam sont abordées pour vous permettre de comprendre comment améliorer la vitesse de convergence en lissant les mises à jour et en adaptant les taux d’apprentissage. Ce module aborde également des techniques du second ordre, telles que la méthode de Newton et les méthodes quasi-Newton (par exemple, BFGS), qui exploitent les informations de courbure pour une optimisation plus directe, bien qu’elles impliquent des coûts de calcul plus élevés. Dans l’ensemble, ce module met l’accent sur l’équilibre entre efficacité, précision et faisabilité computationnelle dans l’optimisation des modèles d’apprentissage automatique.

Inclus

2 vidéos16 lectures3 devoirs

Ce module aborde la reconnaissance d’entités nommées (NER), une tâche CORE du traitement du langage naturel (NLP) qui consiste à identifier et à classer des entités telles que des personnes, des lieux et des organisations dans un texte. Nous commencerons par examiner comment la régression logistique peut être utilisée pour modéliser la NER en tant que problème de classification binaire, bien que cette approche présente des limites en termes de complexité et de prise en compte du contexte. Nous passerons ensuite à des techniques plus avancées, telles que les réseaux neuronaux, qui excellent dans le traitement des modèles complexes et des données à grande échelle avec lesquels les modèles traditionnels peinent à composer. La capacité des réseaux neuronaux à apprendre des caractéristiques hiérarchiques les rend idéaux pour les tâches de NER, car ils peuvent saisir les informations contextuelles plus efficacement que des modèles plus simples. Tout au long de ce module, nous comparons ces méthodes et mettons en évidence la manière dont les approches d’apprentissage profond, telles que les réseaux neuronaux récurrents (RNN) et les transformateurs comme BERT, améliorent la précision et l’évolutivité du NER.

Inclus

2 vidéos14 lectures3 devoirs1 élément d'application

Les modèles Word2Vec et GloVe sont des techniques d'encodage de mots très répandues dans le domaine du traitement du langage naturel (TLN), chacune offrant des avantages propres. Word2Vec, développé par Google, s'appuie sur deux modèles clés : le « Continuous Bag of Words » (CBOW) et le « Skip-gram », qui visent à prédire un mot en fonction de son contexte ou inversement (Word2Vec). Le modèle GloVe, quant à lui, créé par l’université de Stanford, combine des approches basées sur le comptage et des approches prédictives en exploitant des matrices de cooccurrence de mots pour apprendre des vecteurs de mots (GloVe). Les deux modèles représentent les mots dans un espace vectoriel de haute dimension et capturent les relations sémantiques. Word2Vec se concentre sur les contextes locaux, apprenant efficacement à partir de grands ensembles de données, tandis que GloVe met l’accent sur les schémas globaux de cooccurrence des mots à l’échelle de l’ensemble du corpus, révélant ainsi des associations de mots plus profondes. Ces représentations permettent d’effectuer des tâches telles que la résolution d’analogies, la similarité sémantique et d’autres calculs linguistiques, ce qui les rend essentielles aux applications modernes du traitement du langage naturel (NLP).

Inclus

3 vidéos29 lectures4 devoirs1 élément d'application

Ce module explore les techniques d'évaluation des modèles de traitement du langage naturel (NLP), en mettant l'accent à la fois sur les méthodes d'évaluation intrinsèques et extrinsèques. L'évaluation intrinsèque évalue les performances du modèle sur la base de critères internes, tels que la qualité de l'embedding des mots, la précision de l'analyse syntaxique et la perplexité du modèle linguistique. À l'inverse, l'évaluation extrinsèque mesure l'efficacité du modèle dans des applications concrètes, notamment des tâches telles que la traduction automatique, l'analyse des sentiments et la reconnaissance d'entités nommées. Vous en apprendrez également davantage sur les principales différences entre ces types d’évaluation, ainsi que sur l’importance du contexte et de l’application pour déterminer l’utilité d’un modèle. De plus, vous passerez en revue des indicateurs spécifiques tels que la perte d’entropie croisée, la perplexité, les scores BLEU et ROUGE, ce qui vous permettra d’acquérir une compréhension approfondie de la manière d’évaluer et d’améliorer les modèles de TALN.

Inclus

9 lectures2 devoirs1 élément d'application

Ce module explore diverses techniques de modélisation des thèmes dans le traitement du langage naturel (TLN), en mettant l’accent sur des méthodes telles que l’analyse sémantique latente (LSA), la factorisation matricielle non négative (NMF) et l’allocation latente de Dirichlet (LDA). Il commence par une introduction à la factorisation matricielle et à l’importance de transformer les données textuelles en représentations numériques. Vous approfondirez les mécanismes de l’LSA et de la NMF, en vous intéressant particulièrement à leur utilisation du TF-IDF et de la décomposition en valeurs singulières (SVD) pour mettre au jour des structures sémantiques latentes. De plus, vous passerez en revue l’approche probabiliste de la LDA en matière de modélisation de thèmes, en expliquant son recours aux distributions de Dirichlet et à l’inférence bayésienne pour identifier les thèmes cachés au sein d’un corpus. À travers des exemples détaillés et des explications mathématiques, ce module offre une compréhension approfondie de la manière dont ces techniques peuvent être appliquées pour extraire des thèmes pertinents à partir de vastes ensembles de données textuelles.

Inclus

1 vidéo16 lectures4 devoirs1 élément d'application

Ce module aborde les techniques essentielles de l'analyse syntaxique et sémantique dans le traitement du langage naturel (NLP). Vous commencerez par explorer les structures linguistiques, en vous concentrant sur la structure phrastique et la structure de dépendance, qui sont fondamentales pour comprendre la syntaxe des phrases. Vous passerez ensuite en revue diverses méthodes d’analyse, notamment l’analyse de dépendance basée sur les transitions et celle basée sur les graphes, en soulignant leurs avantages et leurs défis respectifs. De plus, vous aborderez l’analyse syntaxique neuronale basée sur les transitions, qui exploite les réseaux neuronaux pour améliorer la précision et l’efficacité. Enfin, le module aborde l’analyse sémantique, en soulignant son rôle dans la mise en correspondance des phrases avec des représentations formelles du sens, ce qui est crucial pour des applications telles que les systèmes de dialogue et l’extraction d’informations.

Inclus

2 vidéos32 lectures4 devoirs

Instructeur

Ramin Mohammadi
Northeastern University
6 Cours962 apprenants

Offert par

En savoir plus sur Apprentissage automatique

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions