Images, audio, and video make up a growing share of the data companies generate today, but most pipelines are still built for structured data alone. This course teaches you to build AI-powered pipelines that process multimodal data and turn it into LLM-ready text.

Building Multimodal Data Pipelines


Expérience recommandée
Ce que vous apprendrez
Extract structured, queryable data from unstructured images, audio, and video using OCR, ASR, and Vision Language Models.
Build a VLM-backed pipeline that reasons across video frames to generate timestamped scene descriptions and track events over time.
Build a multimodal RAG app on real-world data—turning raw images, audio, and video into a queryable interface with grounded, cited answers.
Compétences que vous pratiquerez
- Catégorie : Unstructured Data
- Catégorie : Large Language Modeling
- Catégorie : Image Analysis
- Catégorie : Data Processing
- Catégorie : Data Pipelines
- Catégorie : Embeddings
- Catégorie : Computer Vision
- Catégorie : Multimodal Prompts
- Catégorie : Retrieval-Augmented Generation
- Catégorie : Natural Language Processing
- Catégorie : Text Mining
- Catégorie : Sampling (Statistics)
- Catégorie : Data Capture
Outils que vous utiliserez
- Catégorie : Prompt Engineering
- Catégorie : Vector Databases
- Catégorie : Generative AI
Détails à connaître
avril 2026
Disponible uniquement sur ordinateur
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Apprendre, pratiquer et appliquer des compétences prêtes à l’emploi en moins de 2 heures
- Bénéficiez d’une formation par des experts du secteur
- Gagnez en expérience pratique en effectuant des tâches professionnelles du monde réel

À propos de ce projet
Instructeur

Méthode d’apprentissage
Apprentissage pratique basé sur des projets
Mettez en pratique de nouvelles compétences en effectuant des tâches professionnelles à l’aide d’instructions étape par étape.
Aucun téléchargement ou installation requis(e)
Accédez aux outils et aux ressources dont vous avez besoin dans un environnement cloud.
Disponible uniquement sur ordinateur de bureau
Ce projet est conçu pour les ordinateurs portables ou de bureau disposant d’une connexion internet fiable, et non pour les appareils mobiles.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Vous aimerez peut-être aussi

Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique





