Coursera

Spécialisation Vision & Audio AI Systems

il reste 3 jours ! Acquérir des compétences de haut niveau avec Coursera Plus pour 199 $ (régulièrement 399 $). Économisez maintenant.

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Spécialisation Vision & Audio AI Systems

Build Multimodal AI for Vision and Audio. Design, debug, and deploy AI systems that unify visual and audio data processing.

Hurix Digital

Instructeur : Hurix Digital

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet
niveau Avancées

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet
niveau Avancées

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Design preprocessing pipelines for image, video, and audio data that transform raw inputs into model-ready features.

  • Implement cross-modal retrieval systems and fusion algorithms that unify visual and audio information effectively.

  • Debug and optimize multimodal AI systems through systematic error analysis and performance tuning techniques.

Compétences que vous acquerrez

  • Catégorie : Scalability
  • Catégorie : Image Analysis
  • Catégorie : Data Validation
  • Catégorie : MLOps (Machine Learning Operations)
  • Catégorie : Data Pipelines
  • Catégorie : Debugging
  • Catégorie : Data Quality
  • Catégorie : Model Evaluation
  • Catégorie : Feature Engineering
  • Catégorie : Transfer Learning
  • Catégorie : Performance Tuning
  • Catégorie : Deep Learning
  • Catégorie : Digital Signal Processing
  • Catégorie : Data Preprocessing
  • Catégorie : Computer Vision
  • Catégorie : Embeddings
  • Catégorie : Algorithms

Outils que vous découvrirez

  • Catégorie : PyTorch (Machine Learning Library)
  • Catégorie : Apache Airflow
  • Catégorie : Tensorflow

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

janvier 2026

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Coursera

Spécialisation - série de 2 cours

Ce que vous apprendrez

  • Multimodal architecture needs encoder-fusion-decoder pipelines balancing computational efficiency with cross-modal understanding capabilities.

  • Transfer learning transforms AI by enabling rapid adaptation of pre-trained knowledge to new domains with minimal data and training requirements.

  • Fine-tuning balances knowledge preservation and task adaptation through careful hyperparameter selection and strategic layer freezing techniques.

  • Production multimodal systems require systematic optimization approaches considering both model performance and computational resource constraints.

Compétences que vous acquerrez

Catégorie : Generative AI
Catégorie : Data Pipelines
Catégorie : Transfer Learning
Catégorie : Keras (Neural Network Library)
Catégorie : PyTorch (Machine Learning Library)
Catégorie : Large Language Modeling
Catégorie : Artificial Neural Networks
Catégorie : Knowledge Transfer
Catégorie : Scalability
Catégorie : Performance Tuning
Catégorie : Applied Machine Learning
Catégorie : Vision Transformer (ViT)
Catégorie : System Design and Implementation
Catégorie : Tensorflow
Catégorie : Image Analysis
Catégorie : Deep Learning

Ce que vous apprendrez

  • Systematic error analysis uncovers specific failure modes and root causes that guide focused model improvements.

  • Confusion matrices and error categories reveal class-level model strengths and weaknesses.

  • Visualizing predictions with ground truth adds qualitative insight to complement numeric metrics.

  • Linking errors to data traits enables targeted data collection and model tuning for stronger robustness.

Compétences que vous acquerrez

Catégorie : Anomaly Detection
Catégorie : Root Cause Analysis
Catégorie : Image Quality
Catégorie : Image Analysis
Catégorie : Computer Vision
Catégorie : Statistical Reporting
Catégorie : Model Evaluation
Catégorie : Failure Mode And Effects Analysis
Catégorie : Exploratory Data Analysis
Catégorie : Analysis

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Hurix Digital
Coursera
237 Cours 11 204 apprenants

Offert par

Coursera

Vous aimerez peut-être aussi

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions