Quand recevrai-je mon certificat de cours ?

Si vous terminez le cours avec succès, votre certificat de cours électronique sera ajouté à votre page de réalisations - de là, vous pouvez imprimer votre certificat de cours ou l'ajouter à votre profil LinkedIn.

Pourquoi ne puis-je pas suivre ce cours ?

Ce cours n'est actuellement accessible qu'aux apprenants qui ont payé ou reçu une aide financière, le cas échéant.

Une aide financière est-elle disponible ?

Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.

Manuel de l'ingénieur LLM

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Manuel de l'ingénieur LLM

Instructeur : Packt - Course Instructors

Inclus avec

11 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Débutant

Expérience recommandée

2 semaines à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

11 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Débutant

Expérience recommandée

2 semaines à compléter

à 10 heures par semaine

Planning flexible

Apprenez à votre propre rythme

Ce que vous apprendrez

Concevoir et gérer des filières efficaces de formation et de déploiement des LLM.
Mise en œuvre d'un réglage fin supervisé et évaluation des performances du LLM.
Déployer des applications LLM évolutives et de bout en bout à l'aide d'outils cloud.

Compétences que vous acquerrez

Catégorie : Candidature au LLM
Catégorie : Traitement des données
Catégorie : CI/CD
Catégorie : Mise au point
Catégorie : Pipelines de données
Catégorie : Optimisation du modèle
Catégorie : Évaluation du modèle
Catégorie : Modélisation des grandes langues
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Génération assistée par récupération
Catégorie : Extraire, transformer, charger

Outils que vous découvrirez

Catégorie : Déploiement du modèle

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

11 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Il y a 11 modules dans ce cours

Dans ce cours complet, vous explorerez le monde complexe des Grands modèles de langage (LLM) et acquerrez les compétences nécessaires pour les concevoir, les former et les déployer à l'aide de pratiques MLOps de pointe. Les LLM révolutionnent le paysage de l'IA, et comprendre comment les développer et les gérer est essentiel pour les professionnels de l'IA. Ce cours est conçu pour vous aider non seulement à saisir les concepts fondamentaux derrière les LLM, mais aussi à vous donner une expérience pratique pour construire des systèmes LLM de qualité production. Vous apprendrez à créer des systèmes LLM évolutifs et efficaces à partir de zéro, en vous concentrant sur les applications du monde réel qui vous permettront de vous démarquer dans l'industrie de l'IA. Ce cours se distingue par sa combinaison d'idées théoriques approfondies et d'applications pratiques du monde réel. Vous irez au-delà des connaissances de base pour maîtriser l'architecture des LLM, le réglage fin supervisé et le déploiement sur les plateformes cloud, en veillant à ce que vous soyez entièrement équipé pour construire des systèmes robustes et prêts pour la production. Ce cours est idéal pour les ingénieurs IA, les professionnels du NLP et tous ceux qui cherchent à approfondir leur expertise dans l'ingénierie des LLM. Une compréhension de base des LLM, de Python et des plates-formes de cloud comme AWS est recommandée pour un apprentissage optimal.

Dans cette section, nous approfondissons le concept et l'architecture de LLM Twin, un modèle IA innovant imitant le style d'écriture et la personnalité d'une personne. Nous discutons de son importance, de ses avantages par rapport aux chatbots génériques et du processus de planification pour créer un produit LLM efficace. Des aperçus détaillés de la conception des pipelines de caractéristiques, d'entraînement et d'inférence sont explorés pour structurer un système de ML robuste.

Inclus

2 vidéos3 lectures1 devoir

2 vidéosTotal 2 minutes

Aperçu du cours1 minute
Comprendre le concept et l'architecture du jumelage LLM - Vidéo de présentation1 minute

3 lecturesTotal 30 minutes

Introduction10 minutes
Construire des systèmes de ML avec des pipelines de caractéristiques, d'entraînement et d'inférence10 minutes
Conception de l'architecture du système du LLM Twin10 minutes

1 devoirTotal 10 minutes

Conception d'un système basé sur la LLM10 minutes

Dans cette section, nous présentons les outils essentiels nécessaires au cours, en particulier pour le projet LLM Twin. Nous donnons un aperçu de la pile technologique, couvrons les procédures d'installation de Python et de son écosystème, la gestion des dépendances avec Python, et l'exécution des tâches à l'aide de Poe the Poet. Cette section donne également un aperçu des outils MLOps et LLMOps, y compris ZenML et Hugging Face, et explique leur rôle dans le projet. Enfin, nous guidons les utilisateurs dans la configuration d'un compte AWS, en nous concentrant sur SageMaker pour le déploiement de modèles ML.

Inclus

1 vidéo2 lectures1 devoir

Dans cette section, nous nous plongeons dans le projet LLM Twin en concevant un pipeline de collecte de données pour rassembler les données brutes essentielles aux cours d'utilisation LLM, tels que le réglage fin et l'inférence. Nous nous concentrerons sur la mise en œuvre d'un pipeline ETL qui agrège les données de plateformes telles que Medium et GitHub dans un entrepôt de données MongoDB, simulant ainsi des scénarios de projets d'apprentissage automatique du monde réel.

Inclus

1 vidéo4 lectures1 devoir

Dans cette section, nous explorons le pipeline de caractéristiques de la Génération augmentée par récupération (RAG), une technique cruciale pour intégrer des données personnalisées dans de grands modèles de langage sans ajustement constant. Nous présentons les composants fondamentaux d'un système RAG naïf, tels que le chunking, l'embedding et les bases de données vectorielles. Nous approfondissons également l'architecture du pipeline de fonctionnalités RAG de LLM Twin, en appliquant des concepts théoriques par le biais d'une mise en œuvre pratique, et nous discutons de l'importance du RAG pour résoudre des problèmes tels que les hallucinations de modèles et les vieilles données. Cette section offre un aperçu approfondi des techniques RAG avancées et du rôle des pipelines de lots dans la synchronisation des données pour une meilleure précision.

Inclus

1 vidéo7 lectures1 devoir

1 vidéoTotal 1 minute

RAG Feature Pipeline - Vidéo de présentation1 minute

7 lecturesTotal 170 minutes

Introduction10 minutes
Qu'est-ce qu'un emboîtement ?30 minutes
Opérations de la DB10 minutes
Exploration de l'architecture du pipeline de fonctionnalités RAG du LLM Twin30 minutes
Saisie des données de modification : synchronisation de l'entrepôt de données et du magasin de fonctionnalités30 minutes
Entrepôt de données30 minutes
OVM30 minutes

1 devoirTotal 10 minutes

Concepts avancés de la Génération augmentée de récupération (RAG)10 minutes

Dans cette section, nous allons explorer le processus de réglage fin supervisé (SFT) pour les Grands modèles de langage (LLM). Nous nous pencherons sur la création d'ensembles de données d'instruction et sur la manière dont ils sont utilisés pour affiner les LLM pour des tâches spécifiques. Cette section couvre les étapes impliquées dans la création de ces ensembles de données, l'importance de la qualité des données, et présente diverses techniques et stratégies pour améliorer le processus d'affinage. Nous nous concentrerons sur la transformation des modèles à usage général en assistants spécialisés par le biais du SFT, ce qui leur permet de fournir des réponses plus cohérentes et plus pertinentes.

Inclus

1 vidéo7 lectures1 devoir

1 vidéoTotal 1 minute

Supervised Fine-Tuning - Vidéo de présentation1 minute

7 lecturesTotal 150 minutes

Introduction10 minutes
Déduplication des données30 minutes
Génération de données10 minutes
Création de notre propre ensemble de données d'instruction30 minutes
Exploration de la SFT et de ses techniques30 minutes
Paramètres de formation10 minutes
Le réglage fin en pratique30 minutes

1 devoirTotal 10 minutes

Techniques avancées d'affinage des modèles de langage10 minutes

Dans cette section, nous nous plongeons dans le domaine de l'alignement des préférences, en examinant comment l'optimisation directe des préférences (DPO) peut affiner les modèles de langage pour mieux s'aligner sur les préférences humaines. Nous développons la création et l'évaluation des ensembles de données de préférences, en veillant à ce que nos modèles capturent des interactions humaines nuancées.

Inclus

1 vidéo4 lectures1 devoir

Dans cette section, nous nous penchons sur l'évaluation des grands modèles de langage (LLM), en abordant diverses méthodes d'évaluation et leur importance. Nous couvrons les évaluations générales, spécifiques à un domaine et spécifiques à une tâche, en soulignant les défis uniques que chacune d'entre elles présente. En outre, nous explorons les pipelines de Génération Augmentée de Récupération (RAG) et présentons des outils tels que Ragas et ARES pour une évaluation complète des LLM.

Inclus

1 vidéo3 lectures1 devoir

Dans cette section, nous allons nous plonger dans l'art du réglage fin des grands modèles de langage afin d'améliorer leurs performances et leur efficacité. Nous explorerons les stratégies clés pour optimiser le processus d'inférence de ces modèles, une étape cruciale compte tenu de leurs exigences élevées en matière de calcul et de mémoire. De la réduction de la latence à l'amélioration du débit et à la minimisation de l'utilisation de la mémoire, nous examinons comment déployer du matériel spécialisé et des techniques innovantes pour améliorer les résultats des modèles. En apprenant ces secrets d'optimisation, vous débloquerez des déploiements plus efficaces, qu'il s'agisse de tâches à réponse rapide comme la complétion de code ou la génération de documents par lots.

Inclus

1 vidéo3 lectures1 devoir

Dans cette section, nous explorons la construction et la mise en œuvre d'un pipeline d'inférence RAG, en commençant par la compréhension de son architecture jusqu'à la mise en œuvre de modules clés tels que la récupération, la création d'invites et l'interaction avec le LLM. Nous introduisons des méthodes pour optimiser les processus de récupération comme l'expansion de la requête et l'auto-requête tout en utilisant l'API d'OpenAI, et nous intégrons ces techniques dans un module de récupération complet. Nous conclurons en assemblant ces éléments dans un pipeline d'inférence cohérent et en nous préparant à d'autres étapes de déploiement.

Inclus

1 vidéo5 lectures1 devoir

1 vidéoTotal 1 minute

Vidéo de présentation du pipeline d'inférence RAG1 minute

5 lecturesTotal 130 minutes

Introduction30 minutes
Auto-questionnement30 minutes
Optimisation avancée du RAG après la recherche : Reranking10 minutes
Mise en œuvre du pipeline d'inférence RAG du jumeau LLM30 minutes
Rassembler tous les éléments dans le pipeline d'inférence RAG30 minutes

1 devoirTotal 10 minutes

Mise en œuvre avancée du pipeline RAG10 minutes

Dans cette section, nous nous concentrons sur le déploiement du pipeline d'inférence pour les grands modèles de langage (LLM) dans les applications de ML, en veillant à ce que les modèles soient accessibles et efficaces pour les utilisateurs finaux. Nous aborderons les stratégies de déploiement, les décisions architecturales et les techniques d'optimisation pour relever des défis tels que la puissance de calcul et l'accès aux fonctionnalités.

Inclus

1 vidéo5 lectures1 devoir

1 vidéoTotal 1 minute

Déploiement du pipeline d'inférence - Vidéo de présentation1 minute

5 lecturesTotal 110 minutes

Introduction10 minutes
Architecture monolithique ou microservices dans le cadre du Model Serving10 minutes
Exploration de la stratégie de déploiement du pipeline d'inférence du jumeau LLM30 minutes
Déploiement du modèle LLM Twin sur AWS SageMaker30 minutes
Appel du point de terminaison d'inférence d'AWS SageMaker30 minutes

1 devoirTotal 10 minutes

Déploiement d'un modèle moderne de ML10 minutes

Dans cette section, nous plongeons dans les subtilités des MLOps et des LLMOps, en explorant leurs rôles dans l'automatisation des processus d'apprentissage automatique et la gestion de grands modèles de langage. Nous couvrirons leurs origines dans DevOps, soulignerons les défis uniques que les LLMOps abordent, tels que la gestion des prompts et les problèmes de mise à l'échelle, et illustrerons les étapes pratiques pour déployer ces systèmes efficacement. Cette section comprend également des discussions sur la transition du déploiement manuel vers des solutions basées sur le cloud, en soulignant les avantages des pipelines CI/CD et de la Dockérisation dans l'exécution et la gestion des modèles à l'échelle.

Inclus

1 vidéo7 lectures1 devoir

1 vidéoTotal 1 minute

MLOps et LLMOps - Vidéo de présentation1 minute

7 lecturesTotal 210 minutes

Introduction30 minutes
Principes MLOps30 minutes
Suivi rapide30 minutes
Mise en place du nuage ZenML30 minutes
Exécuter les pipelines sur AWS30 minutes
Fichier YAML des actions GitHub CI30 minutes
Déclencher des pipelines en aval30 minutes

1 devoirTotal 10 minutes

Principes de base des MLOps et des LLMOps10 minutes

Instructeur

Packt - Course Instructors

Packt

1 946 Cours578 447 apprenants

Offert par

Packt

En savoir plus sur Analyse des données

Packt
Essential Guide to LLMOps
Cours
Catégorie : Crédit proposé
Coursera
Designing Production LLM Architectures
Cours
Statut : Essai gratuit
Catégorie : Crédit proposé
Coursera
LLM Engineering That Works: Prompting, Tuning, and Retrieval
Certificat Professionnel
Statut : Essai gratuit
Catégorie : Crédit proposé
Packt
Building LLM Powered Applications
Cours
Catégorie : Crédit proposé

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

Oui, vous pouvez visionner la première vidéo et le syllabus avant de vous inscrire. Vous devez acheter le cours pour accéder au contenu qui n'est pas inclus dans l'aperçu.

Si vous décidez de vous inscrire au cours avant la date de début de la session, vous aurez accès à toutes les vidéos et à toutes les lectures du cours. Vous pourrez soumettre vos travaux dès le début de la session.

Une fois que vous vous serez inscrit et que votre session aura commencé, vous aurez accès à toutes les vidéos et autres ressources, y compris les lectures et le forum de discussion du cours. Vous pourrez consulter et soumettre des évaluations pratiques, et effectuer les devoirs notés requis pour obtenir une note et un certificat de cours.

Plus de questions

Visitez le Centre d'Aide pour les Étudiants

Aide financière disponible,

Manuel de l'ingénieur LLM

Manuel de l'ingénieur LLM

Ce que vous apprendrez

Compétences que vous acquerrez

Outils que vous découvrirez

Détails à connaître

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Il y a 11 modules dans ce cours

Comprendre le concept et l'architecture du jumelage LLM

Inclus

Outillage et installation

Inclus

Ingénierie des données

Inclus

RAG Feature Pipeline

Inclus

Mise au point supervisée

Inclus

Ajustement fin grâce à l'alignement des préférences

Inclus

Évaluer les programmes d'éducation et de formation tout au long de la vie

Inclus

Optimisation de l'inférence

Inclus

Pipeline d'inférence RAG

Inclus

Déploiement du pipeline d'inférence

Inclus

MLOps et LLMOps

Inclus

Instructeur

Offert par

En savoir plus sur Analyse des données

Essential Guide to LLMOps

Designing Production LLM Architectures

LLM Engineering That Works: Prompting, Tuning, and Retrieval

Building LLM Powered Applications

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.

Réaliser des économies en milieu d'année et donner de l'élan à sa carrière

Aidez votre équipe à s'élever

Foire Aux Questions

Puis-je avoir un aperçu d'un cours avant de m'inscrire ?

Quand aurai-je accès aux cours et aux devoirs ?

Qu'est-ce que j'obtiendrai en m'inscrivant ?

Plus de questions