Saviez-vous que 80 % des données mondiales sont constituées de texte non structuré ? Pourtant, la plupart des entreprises peinent à extraire des informations exploitables de cette mine d’or.
Cette formation courte a été conçue pour aider les professionnels de l’apprentissage automatique et de l’IA à mettre en œuvre le traitement du langage naturel dans des domaines spécifiques, grâce à une adaptation systématique des modèles et à des workflows robustes de prétraitement de texte. À l'issue de cette formation, vous serez capable d'affiner des modèles BERT sur des ensembles de données à spécialisation, de créer des pipelines spaCy automatisés pour la normalisation de texte et de déployer des solutions de TALN prêtes à l'emploi qui apporteront des améliorations mesurables en termes de performances dans votre prochain projet. À l’issue de ce cours, vous serez capable de : - Créer des modèles linguistiques Transformer finement ajustés pour des applications spécifiques à un domaine - Appliquer des techniques de prétraitement de texte afin de construire un pipeline permettant de nettoyer et de normaliser du texte brut Ce cours est unique en son genre, car il combine un ajustement pratique à l’aide de Hugging Face Trainer et la construction concrète de pipelines à l’aide de spaCy, vous offrant ainsi des compétences immédiatement applicables aux défis réels du TALN. Pour réussir ce projet, vous devez posséder des connaissances en programmation Python, maîtriser les concepts de base de l’apprentissage automatique et être familiarisé avec les architectures Transformer.


















