Coursera

Préparation du texte pour les modèles IA

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Coursera

Préparation du texte pour les modèles IA

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

7 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

7 heures à compléter
Planning flexible
Apprenez à votre propre rythme

Compétences que vous acquerrez

  • Catégorie : Données non structurées
  • Catégorie : Exploration de texte
  • Catégorie : Collecte de données
  • Catégorie : Évaluation du modèle
  • Catégorie : Modélisation des grandes langues
  • Catégorie : Optimisation des jetons
  • Catégorie : Prétraitement des données
  • Catégorie : Mise au point
  • Catégorie : Éthique des données
  • Catégorie : Qualité des données
  • Catégorie : Nettoyage des données
  • Catégorie : Transformation des données
  • Catégorie : Validation des données
  • Catégorie : Pipelines de données
  • Catégorie : Traitement des données

Outils que vous découvrirez

  • Catégorie : IA générative
  • Catégorie : Visage étreint
  • Catégorie : Ingénierie rapide

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

janvier 2026

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise en Analyse des données

Ce cours fait partie de la Certificat Professionnel IA générative ouverte : construire avec des modèles et des outils ouverts
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à ce Certificat Professionnel.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable auprès de Coursera

Il y a 3 modules dans ce cours

Dans ce module, vous découvrirez les principales ressources que vous pourrez ajouter à votre boîte à outils pour trouver des ensembles de données textuelles. Vous explorerez des référentiels tels que Hugging Face, Kaggle et Common Crawl, et apprendrez à évaluer la taille, la qualité et la pertinence des ensembles de données par rapport à vos objectifs d’entraînement. Vous aborderez également les aspects juridiques et éthiques, et vous vous exercerez à importer et à convertir des ensembles de données entre les formats courants, afin de pouvoir sélectionner et préparer en toute confiance des données textuelles pour vos projets.

Inclus

3 vidéos3 lectures1 devoir1 laboratoire non noté

Dans ce module, vous mettrez en pratique des techniques de nettoyage de texte, comparerez différentes méthodes de tokenisation et concevrez des pipelines de prétraitement. Vous formaterez également des données en vue de l'optimisation des instructions et développerez des routines de traitement par lots, ce qui vous permettra d'acquérir une expérience pratique de plusieurs approches que vous pourrez adapter à vos propres workflows d'entraînement.

Inclus

3 vidéos1 lecture1 devoir1 laboratoire non noté

Dans ce module, vous apprendrez à transformer du texte brut en ensembles de données structurés, prêts à être utilisés pour l'entraînement. Vous concevrez et appliquerez des schémas d'annotation, vous vous exercerez à diviser des ensembles de données en sous-ensembles destinés à l'entraînement et à l'évaluation, et vous comparerez différentes approches d'organisation des données. Au fil de ce module, vous découvrirez comment les différentes méthodes influencent les performances des modèles, ce qui vous permettra de déterminer quelles stratégies de structuration sont les plus adaptées à vos projets.

Inclus

2 vidéos1 lecture1 devoir1 laboratoire non noté

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Professionals from the Industry
479 Cours109 487 apprenants

Offert par

Coursera

En savoir plus sur Analyse des données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.