Bienvenue dans ce cours consacré au traitement du langage naturel appliqué à l’ingénierie. Ce cours a pour objectif de vous permettre d’acquérir une compréhension approfondie du TALN, un domaine clé de l’intelligence artificielle qui permet aux ordinateurs de comprendre, d’interpréter et de générer le langage humain. Tout au long de ce cours, vous explorerez un large éventail de sujets, allant des tâches fondamentales du TAL telles que la classification de textes et la reconnaissance d’entités nommées (NER) aux techniques avancées de traduction automatique neuronale et aux méthodes d’optimisation essentielles à l’apprentissage automatique. Nous nous pencherons sur les complexités liées à l’enseignement du langage aux machines, en abordant des défis tels que l’ambiguïté, la grammaire et les nuances culturelles. À l’issue de cette première partie du cours, vous disposerez d’une compréhension fondamentale du fonctionnement des systèmes modernes de TALN, en particulier ceux faisant appel à l’apprentissage automatique et à l’apprentissage profond. Ces thèmes vous donneront les moyens de créer, d’analyser et d’améliorer des systèmes de TALN dans de nombreuses applications.

Traitement du langage naturel naturel (NLP) appliqué à l'ingénierie - Partie 1
Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Traitement du langage naturel naturel (NLP) appliqué à l'ingénierie - Partie 1

Instructeur : Ramin Mohammadi
Inclus avec
Demander à Coursera
Compétences que vous acquerrez
- Catégorie : Intelligence artificielle et apprentissage automatique (IA/ML)Intelligence artificielle et apprentissage automatique (IA/ML)
- Catégorie : Traitement du langage naturelTraitement du langage naturel
- Catégorie : Réseaux neuronaux artificielsRéseaux neuronaux artificiels
- Catégorie : Optimisation du modèleOptimisation du modèle
- Catégorie : Apprentissage profondApprentissage profond
- Catégorie : Apprentissage superviséApprentissage supervisé
- Catégorie : Analyse de dépendanceAnalyse de dépendance
- Catégorie : EmboîtementsEmboîtements
- Catégorie : Apprentissage automatiqueApprentissage automatique
- Catégorie : Évaluation du modèleÉvaluation du modèle
- Catégorie : Méthodes d'apprentissage automatiqueMéthodes d'apprentissage automatique
Détails à connaître

Ajouter à votre profil LinkedIn
22 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Il y a 7 modules dans ce cours
Ce module propose une exploration approfondie du traitement du langage naturel (NLP), un domaine essentiel de l'intelligence artificielle qui permet aux ordinateurs de comprendre, d'interpréter et de générer le langage humain. En associant la linguistique informatique à l'apprentissage automatique, le NLP trouve des applications dans diverses technologies, allant des chatbots et de l'analyse des sentiments à la traduction automatique et à la reconnaissance vocale. Ce module présente les tâches fondamentales du TALN, telles que la classification de textes, la reconnaissance d’entités nommées (NER) et la traduction automatique neuronale, en illustrant comment ces applications façonnent les interactions réelles avec l’IA. De plus, il met en évidence les complexités liées à l’enseignement du langage aux machines, notamment la gestion de l’ambiguïté, de la grammaire et des nuances culturelles. Tout au long de ce cours, vous acquerrez une expérience pratique et des connaissances sur des techniques clés telles que la représentation des mots et la sémantique distributionnelle, ce qui vous préparera à relever les défis linguistiques rencontrés dans les systèmes d’IA modernes.
Inclus
4 vidéos19 lectures2 devoirs1 élément d'application
4 vidéos•Total 6 minutes
- Introduction au cours•3 minutes
- Rencontrez vos professeurs•1 minute
- Traitement du langage naturel (NLP)•1 minute
- Représenter le sens d'un mot•1 minute
19 lectures•Total 154 minutes
- Introduction au cours•2 minutes
- Programme - Traitement du langage naturel appliqué à l'ingénierie, 1re partie•10 minutes
- Intégrité académique•1 minute
- Connaissances préalables recommandées•100 minutes
- Semaine 1 Introduction•2 minutes
- Introduction à la NLP•5 minutes
- Exemple : Chatbots•2 minutes
- Exemple : Filtrage des courriels•2 minutes
- Exemple : Analyse des sentiments•3 minutes
- Exemple : GPT - 3•3 minutes
- Exemple : Capacités du ChatGPT•5 minutes
- Traitement du langage naturel•1 minute
- L'évolution des langues en images•2 minutes
- Comment représenter le sens d'un mot ?•2 minutes
- Comment obtenir un sens utilisable dans un ordinateur ?•4 minutes
- Les mots en tant que symboles discrets•5 minutes
- Représenter les mots en fonction de leur contexte•2 minutes
- Vecteurs de mots•2 minutes
- Dernières réflexions sur la NLP•1 minute
2 devoirs•Total 36 minutes
- Évaluez vos acquis : qu'est-ce que la PNL ?•18 minutes
- Évaluez votre apprentissage : la motivation•18 minutes
1 élément d'application•Total 15 minutes
- Les défis de l'enseignement des langues à l'IA•15 minutes
Ce module est consacré aux techniques d’optimisation essentielles à l’apprentissage automatique, en particulier dans le cadre des tâches de traitement du langage naturel (NLP). Il présente la descente de gradient (GD), un algorithme fondamental utilisé pour minimiser les fonctions de coût en ajustant de manière itérative les paramètres du modèle. Vous explorerez des variantes telles que la descente stochastique du gradient (SGD) et la descente du gradient par mini-lots afin d’en savoir plus sur leur efficacité dans le traitement de grands ensembles de données. Des méthodes avancées telles que Momentum et Adam sont abordées pour vous permettre de comprendre comment améliorer la vitesse de convergence en lissant les mises à jour et en adaptant les taux d’apprentissage. Ce module aborde également des techniques du second ordre, telles que la méthode de Newton et les méthodes quasi-Newton (par exemple, BFGS), qui exploitent les informations de courbure pour une optimisation plus directe, bien qu’elles impliquent des coûts de calcul plus élevés. Dans l’ensemble, ce module met l’accent sur l’équilibre entre efficacité, précision et faisabilité computationnelle dans l’optimisation des modèles d’apprentissage automatique.
Inclus
2 vidéos16 lectures3 devoirs
2 vidéos•Total 8 minutes
- Apprentissage automatique et NLP•4 minutes
- Techniques d'optimisation•4 minutes
16 lectures•Total 82 minutes
- Vue d'ensemble de la semaine 2•2 minutes
- Apprentissage automatique•2 minutes
- Variations de la descente de gradient•2 minutes
- Types de ML dans la PNL•6 minutes
- Qu'est-ce qu'un modèle en PNL et comment apprend-il ?•6 minutes
- Comprendre les fonctions de coût•2 minutes
- Minimiser la fonction de coût dans le NLP•10 minutes
- L'importance des techniques d'optimisation•1 minute
- Pourquoi le SGD fonctionne-t-il ?•10 minutes
- Matrice jacobienne et matrice hessienne•5 minutes
- L'élan•10 minutes
- Méthodes de Newton•5 minutes
- Méthodes de Quasi-Newton•5 minutes
- Propagation quadratique moyenne (RMSProp)•5 minutes
- Estimation adaptative du moment (Adam)•10 minutes
- Défis généraux des techniques d'optimisation de second ordre•1 minute
3 devoirs•Total 81 minutes
- Évaluez vos acquis : l'apprentissage automatique en traitement du langage naturel•18 minutes
- Évaluez votre apprentissage : techniques d'optimisation•18 minutes
- Quiz du module 2•45 minutes
Ce module aborde la reconnaissance d’entités nommées (NER), une tâche CORE du traitement du langage naturel (NLP) qui consiste à identifier et à classer des entités telles que des personnes, des lieux et des organisations dans un texte. Nous commencerons par examiner comment la régression logistique peut être utilisée pour modéliser la NER en tant que problème de classification binaire, bien que cette approche présente des limites en termes de complexité et de prise en compte du contexte. Nous passerons ensuite à des techniques plus avancées, telles que les réseaux neuronaux, qui excellent dans le traitement des modèles complexes et des données à grande échelle avec lesquels les modèles traditionnels peinent à composer. La capacité des réseaux neuronaux à apprendre des caractéristiques hiérarchiques les rend idéaux pour les tâches de NER, car ils peuvent saisir les informations contextuelles plus efficacement que des modèles plus simples. Tout au long de ce module, nous comparons ces méthodes et mettons en évidence la manière dont les approches d’apprentissage profond, telles que les réseaux neuronaux récurrents (RNN) et les transformateurs comme BERT, améliorent la précision et l’évolutivité du NER.
Inclus
2 vidéos14 lectures3 devoirs1 élément d'application
2 vidéos•Total 4 minutes
- Définitions des réseaux neuronaux•4 minutes
- Propagation sur le réseau•0 minutes
14 lectures•Total 89 minutes
- Vue d'ensemble de la semaine 3•2 minutes
- Réseaux neuronaux•2 minutes
- Reconnaissance des entités nommées (NER)•5 minutes
- Le NER en tant que problème de régression binaire•5 minutes
- Réseau de neurones•5 minutes
- Réseau de neurones•5 minutes
- Comment un réseau neuronal apprend-il ?•10 minutes
- Représentation mathématique•20 minutes
- Étapes de l'algorithme de rétropropagation•5 minutes
- Gradient stochastique•5 minutes
- Tâches de classification•5 minutes
- Tâches de séquence à séquence•5 minutes
- Tâches d'étiquetage des séquences•5 minutes
- Tâches de régression et mesures de divergence•10 minutes
3 devoirs•Total 81 minutes
- Évaluez vos acquis : NER et réseaux neuronaux•18 minutes
- Évaluez vos acquis : les fonctions de coût•18 minutes
- Quiz du module 3•45 minutes
1 élément d'application•Total 10 minutes
- Quelques fonctions d'activation courantes•10 minutes
Les modèles Word2Vec et GloVe sont des techniques d'encodage de mots très répandues dans le domaine du traitement du langage naturel (TLN), chacune offrant des avantages propres. Word2Vec, développé par Google, s'appuie sur deux modèles clés : le « Continuous Bag of Words » (CBOW) et le « Skip-gram », qui visent à prédire un mot en fonction de son contexte ou inversement (Word2Vec). Le modèle GloVe, quant à lui, créé par l’université de Stanford, combine des approches basées sur le comptage et des approches prédictives en exploitant des matrices de cooccurrence de mots pour apprendre des vecteurs de mots (GloVe). Les deux modèles représentent les mots dans un espace vectoriel de haute dimension et capturent les relations sémantiques. Word2Vec se concentre sur les contextes locaux, apprenant efficacement à partir de grands ensembles de données, tandis que GloVe met l’accent sur les schémas globaux de cooccurrence des mots à l’échelle de l’ensemble du corpus, révélant ainsi des associations de mots plus profondes. Ces représentations permettent d’effectuer des tâches telles que la résolution d’analogies, la similarité sémantique et d’autres calculs linguistiques, ce qui les rend essentielles aux applications modernes du traitement du langage naturel (NLP).
Inclus
3 vidéos29 lectures4 devoirs1 élément d'application
3 vidéos•Total 11 minutes
- Processus de formation du GLoVe•5 minutes
- Word2Vec•4 minutes
- Skip-Gram•2 minutes
29 lectures•Total 267 minutes
- Aperçu de la semaine 4•2 minutes
- Introduction à GLoVe•5 minutes
- Matrice de cooccurrence•5 minutes
- Objectif : Ratio de cooccurrences•5 minutes
- Calcul des rapports de probabilité•5 minutes
- Symétrie et linéarité à GloVe•5 minutes
- Minimiser la fonction de coût et optimiser les vecteurs de mots•5 minutes
- Processus d'optimisation•10 minutes
- Vecteurs du mot de la fin•2 minutes
- Propriétés implicites dans GloVe•5 minutes
- GLoVe Introduction•2 minutes
- Qu'est-ce que la modélisation linguistique ?•5 minutes
- Matrice de cooccurrence•5 minutes
- Représentations vectorielles pour les mots•3 minutes
- Sac de mots continu (CBOW)•5 minutes
- Objectifs mathématiques•10 minutes
- Objectifs mathématiques 2•15 minutes
- Limites du CBOW•1 minute
- Skip-Gram•15 minutes
- Dérivation du gradient•15 minutes
- Le défi de la formation au saut de mouton•10 minutes
- Perspective de la classification binaire•10 minutes
- Gradient de l'objectif d'échantillonnage négatif•10 minutes
- Connexion entre le Skip-Gram, l'échantillonnage négatif et l'échantillonnage unique•2 minutes
- Skip-Gram avec échantillonnage négatif pour tous les mots•10 minutes
- Échantillonnage négatif dans le modèle Skip-Gram•10 minutes
- Exemple de Word2Vec•30 minutes
- Exemple pratique de Word2Vec •30 minutes
- Exemple 2 de Word2Vec•30 minutes
4 devoirs•Total 99 minutes
- Évaluez vos acquis : GLoVe•18 minutes
- Évaluez vos acquis : Word2Vec et CBOW•18 minutes
- Évaluez votre apprentissage : Skip-Gram et échantillonnage négatif•18 minutes
- Quiz du module 4•45 minutes
1 élément d'application•Total 3 minutes
- Processus de formation GloVe•3 minutes
Ce module explore les techniques d'évaluation des modèles de traitement du langage naturel (NLP), en mettant l'accent à la fois sur les méthodes d'évaluation intrinsèques et extrinsèques. L'évaluation intrinsèque évalue les performances du modèle sur la base de critères internes, tels que la qualité de l'embedding des mots, la précision de l'analyse syntaxique et la perplexité du modèle linguistique. À l'inverse, l'évaluation extrinsèque mesure l'efficacité du modèle dans des applications concrètes, notamment des tâches telles que la traduction automatique, l'analyse des sentiments et la reconnaissance d'entités nommées. Vous en apprendrez également davantage sur les principales différences entre ces types d’évaluation, ainsi que sur l’importance du contexte et de l’application pour déterminer l’utilité d’un modèle. De plus, vous passerez en revue des indicateurs spécifiques tels que la perte d’entropie croisée, la perplexité, les scores BLEU et ROUGE, ce qui vous permettra d’acquérir une compréhension approfondie de la manière d’évaluer et d’améliorer les modèles de TALN.
Inclus
9 lectures2 devoirs1 élément d'application
9 lectures•Total 99 minutes
- Aperçu de la semaine 5•2 minutes
- Concept général d'évaluation (en TALN)•15 minutes
- Principales différences entre l'évaluation intrinsèque et l'évaluation extrinsèque•2 minutes
- Perte d'entropie croisée - Intrinsèque•10 minutes
- Entropie croisée et apprentissage à partir de prédictions erronées•15 minutes
- Perplexité - Intrinsèque•15 minutes
- Score BLEU (Bilingual Evaluation Understudy) - Extrinsèque•15 minutes
- Récupération et précision dans la synthèse ou la traduction de textes•15 minutes
- Modèle de remplacement axé sur la récupération pour l'évaluation de la synthèse (ROUGE) - Extrinsèque•10 minutes
2 devoirs•Total 63 minutes
- Évaluez votre apprentissage : évaluation du modèle PNL•18 minutes
- Quiz du module 5•45 minutes
1 élément d'application•Total 10 minutes
- Techniques d'évaluation•10 minutes
Ce module explore diverses techniques de modélisation des thèmes dans le traitement du langage naturel (TLN), en mettant l’accent sur des méthodes telles que l’analyse sémantique latente (LSA), la factorisation matricielle non négative (NMF) et l’allocation latente de Dirichlet (LDA). Il commence par une introduction à la factorisation matricielle et à l’importance de transformer les données textuelles en représentations numériques. Vous approfondirez les mécanismes de l’LSA et de la NMF, en vous intéressant particulièrement à leur utilisation du TF-IDF et de la décomposition en valeurs singulières (SVD) pour mettre au jour des structures sémantiques latentes. De plus, vous passerez en revue l’approche probabiliste de la LDA en matière de modélisation de thèmes, en expliquant son recours aux distributions de Dirichlet et à l’inférence bayésienne pour identifier les thèmes cachés au sein d’un corpus. À travers des exemples détaillés et des explications mathématiques, ce module offre une compréhension approfondie de la manière dont ces techniques peuvent être appliquées pour extraire des thèmes pertinents à partir de vastes ensembles de données textuelles.
Inclus
1 vidéo16 lectures4 devoirs1 élément d'application
1 vidéo•Total 5 minutes
- Modélisation des thèmes•5 minutes
16 lectures•Total 133 minutes
- Vue d'ensemble de la semaine 6•2 minutes
- Factorisation des matrices•1 minute
- Analyse sémantique latente (LSA)•15 minutes
- Exemple LSA•15 minutes
- Modélisation de thèmes à l'aide de l'analyse sémantique latente (LSA)•5 minutes
- Dimensions et applications•5 minutes
- Factorisation de matrice non négative (NMF)•5 minutes
- Mise en œuvre de la NMF•7 minutes
- Exemple numérique de NMF•15 minutes
- Applications de la NMF•2 minutes
- Allocation de Dirichlet Latent (LDA)•5 minutes
- Définition du problème et hypothèses clés•1 minute
- Modèle mathématique de l'analyse des composantes principales (LDA)•10 minutes
- Étapes de l'analyse factorielle linéaire (LDA) : explication mathématique•15 minutes
- Optimisation de la probabilité a posteriori dans l'analyse LDA•15 minutes
- Exemple complet•15 minutes
4 devoirs•Total 99 minutes
- Évaluez vos acquis : analyse sémantique latente•18 minutes
- Évaluez vos acquis : factorisation non négative des matrices•18 minutes
- Évaluez votre apprentissage : allocation latente de Dirichlet•18 minutes
- Quiz du module 6•45 minutes
1 élément d'application•Total 10 minutes
- Récapitulatif sur le NMF et le LDA•10 minutes
Ce module aborde les techniques essentielles de l'analyse syntaxique et sémantique dans le traitement du langage naturel (NLP). Vous commencerez par explorer les structures linguistiques, en vous concentrant sur la structure phrastique et la structure de dépendance, qui sont fondamentales pour comprendre la syntaxe des phrases. Vous passerez ensuite en revue diverses méthodes d’analyse, notamment l’analyse de dépendance basée sur les transitions et celle basée sur les graphes, en soulignant leurs avantages et leurs défis respectifs. De plus, vous aborderez l’analyse syntaxique neuronale basée sur les transitions, qui exploite les réseaux neuronaux pour améliorer la précision et l’efficacité. Enfin, le module aborde l’analyse sémantique, en soulignant son rôle dans la mise en correspondance des phrases avec des représentations formelles du sens, ce qui est crucial pour des applications telles que les systèmes de dialogue et l’extraction d’informations.
Inclus
2 vidéos32 lectures4 devoirs
2 vidéos•Total 5 minutes
- Exemples d'analyse syntaxique basée sur les transitions et d'analyse syntaxique des graphes•2 minutes
- Progrès des réseaux neuronaux en analyse syntaxique : dépendance et sémantique•3 minutes
32 lectures•Total 160 minutes
- Aperçu de la semaine 7•2 minutes
- Introduction à l'analyse syntaxique des dépendances•5 minutes
- Qu'est-ce qu'un constituant ?•5 minutes
- Pseudo-clivage et fragments de phrase•5 minutes
- Remplacement de phrases correctes•5 minutes
- Désignation des autres phases•5 minutes
- Domination immédiate, domination et relations de parenté féminines•5 minutes
- Analyse syntaxique - Structure phrastique•10 minutes
- Structure de la phrase•3 minutes
- Règles de structure des phrases et explications•2 minutes
- Construire l'arbre•2 minutes
- Résumé•5 minutes
- Structure des dépendances•2 minutes
- Concepts clés et exemple•10 minutes
- Avantages de la structure des dépendances•5 minutes
- Qu'est-ce que l'analyse syntaxique basée sur les transitions ?•2 minutes
- La méthode gloutonne basée sur les transitions•10 minutes
- Type 2 : analyseur « Shift-Reduce »•10 minutes
- Introduction•5 minutes
- Concepts clés et configuration•10 minutes
- Avantages, défis et éléments à prendre en compte•5 minutes
- Introduction•2 minutes
- Concepts clés de l'analyse syntaxique des dépendances basée sur les graphes•5 minutes
- Exemple détaillé•10 minutes
- Avantages et inconvénients•2 minutes
- Analyse syntaxique basée sur les transitions vs analyse syntaxique basée sur les graphes•1 minute
- Analyse sémantique•5 minutes
- Exemple 1•5 minutes
- Exemple 2•5 minutes
- Exemple 3•5 minutes
- Exemple 4•5 minutes
- Félicitations !•2 minutes
4 devoirs•Total 135 minutes
- Évaluez vos acquis : les constituants et l'identification des éléments de la phrase•30 minutes
- Évaluez vos acquis : structure des phrases et des dépendances•30 minutes
- Évaluez vos acquis : l'analyse syntaxique•30 minutes
- Quiz du module 7•45 minutes
Instructeur

Offert par
En savoir plus sur Apprentissage automatique
Statut : PrévisualisationPrévisualisationNNortheastern University
Cours
Statut : PrévisualisationPrévisualisationNNortheastern University
Cours
Statut : PrévisualisationPrévisualisationBBirla Institute of Technology & Science, Pilani
Cours
Statut : PrévisualisationPrévisualisationBBirla Institute of Technology & Science, Pilani
Cours
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Foire Aux Questions
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous achetez un certificat, vous avez accès à tous les supports de cours, y compris les devoirs notés. Une fois le cours terminé, votre certificat électronique sera ajouté à votre page de réalisations. Vous pourrez alors l'imprimer ou l'ajouter à votre profil LinkedIn.
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.
Plus de questions
Aide financière disponible,




