Coursera

Optimizing AI Workflows and Deploying Edge Models

Développez vos compétences avec Coursera Plus pour 239 $/an (habituellement 399 $). Économisez maintenant.

Ce cours n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Optimizing AI Workflows and Deploying Edge Models

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

8 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

8 heures à compléter
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Implement and optimize neural network components using PyTorch tensor operations and automatic differentiation

  • Analyze ML workflow performance using experiment metrics, visualization tools, and GPU utilization insights

  • Build efficient data pipelines and deploy optimized AI models to edge environments

Compétences que vous acquerrez

  • Catégorie : Model Evaluation
  • Catégorie : Performance Tuning
  • Catégorie : MLOps (Machine Learning Operations)
  • Catégorie : Data Pipelines
  • Catégorie : Data Manipulation
  • Catégorie : Performance Analysis
  • Catégorie : Deep Learning
  • Catégorie : Artificial Neural Networks
  • Catégorie : Data Processing
  • Catégorie : Resource Utilization
  • Catégorie : Debugging
  • Catégorie : Dataflow
  • Catégorie : Performance Metric

Outils que vous découvrirez

  • Catégorie : AI Workflows
  • Catégorie : PyTorch (Machine Learning Library)
  • Catégorie : Tensorflow
  • Catégorie : Grafana
  • Catégorie : Model Deployment

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

mars 2026

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise en Machine Learning

Ce cours fait partie de la Eyes on AI - Computer Vision Engineering Certificat Professionnel
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à ce Certificat Professionnel.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable auprès de Coursera

Il y a 9 modules dans ce cours

You will move beyond the standard “out-of-the-box” components in PyTorch by building your own custom building block called Squeeze-and-Excite. You will understand why these custom components matter for real-world problems, and you will create one step by step while ensuring it behaves correctly. You will see how data flows through this custom block, how its parameters are stored and updated during learning, and how to verify that everything is connected properly. By the end, you will understand a general pattern you can reuse to build many other custom components for your neural networks.

Inclus

3 vidéos1 lecture2 devoirs

You will learn how to find and fix slowdowns in your AI training code, improving performance from data processing to model training. You will use built-in tools to identify issues such as slow data loading, then apply two practical techniques: one that makes mathematical computations faster while using less memory, and another that allows you to train with larger batches of data without running out of memory. Through quizzes, ready-to-copy code examples, and clear explanations, you will see how to keep your GPU working at full speed instead of sitting idle. By the end, you will be able to streamline complex training workflows into efficient processes that support business success.

Inclus

2 vidéos1 lecture3 devoirs

You will explore how visual dashboards help you understand model behavior and compare different training runs. You will learn how to interpret accuracy curves, loss trajectories, and compute trade-offs so you can choose the model variant that is best for the task. By the end, you will know how to evaluate experiments using clear visual evidence rather than guesswork.

Inclus

2 vidéos1 lecture1 devoir

You will practice structuring reusable ML workflows using modular components. You will explore LightningModule and DataModule patterns, strengthen your documentation habits, and understand how structured templates reduce errors.

Inclus

2 vidéos1 lecture2 devoirs

You will explore how data loading, batching, caching, and prefetching impact training speed. You will learn how frameworks like tf.data and PyTorch DataLoader parallelize input operations to keep GPUs busy.

Inclus

3 vidéos1 lecture1 devoir

You will explore how computational graphs work, why redundant operations exist, and how pruning them improves model inference latency. You will analyze a model graph, identify unnecessary reshape and identity operations, prune them, re-export the SavedModel, and measure the resulting latency improvements.

Inclus

1 vidéo1 lecture2 devoirs

You will explore how to evaluate ML models using slice-based performance analysis. You will discover how different environments, devices, and usage-context slices can expose hidden weaknesses in an otherwise accurate model. Through TFMA workflows and hands-on exploration, you will identify a real 5% drop in performance on low-light smartphone images and generate actionable recommendations to improve data quality and fairness. This lesson emphasizes practical robustness evaluation rather than purely theoretical metrics.

Inclus

2 vidéos1 lecture1 devoir

You will optimize and deploy models to edge hardware using TensorFlow Lite. You will convert a SavedModel into a quantized TFLite model, explore weight and integer quantization options, and deploy the optimized model on a Jetson Nano. You will measure changes in file size, inference speed (FPS), and accuracy, then summarize your results in a reproducible hand-off guide. By the end, you will understand the practical trade-offs between speed, footprint, and accuracy in real edge deployments.

Inclus

1 vidéo1 lecture2 devoirs

Real-world computer vision systems move through several stages before they are ready for deployment. Engineers must evaluate model experiments, diagnose workflow inefficiencies, improve training pipelines, and ensure that models can operate reliably under real-world and device constraints. These activities require combining performance analysis with practical engineering decisions about system design and deployment readiness. In this integration project, you will act as a machine learning engineer preparing a computer vision model for deployment on edge devices in a resource-constrained environment. You will analyze experiment results, identify performance bottlenecks, evaluate slice-level robustness, and propose workflow and deployment optimizations. The project integrates key engineering activities involved in preparing vision systems for production, including GPU performance diagnosis, experiment visualization and comparison, data pipeline optimization, workflow standardization, and edge deployment trade-off analysis. Rather than focusing on isolated techniques, you will evaluate the full machine learning workflow—from training inefficiencies and experiment interpretation to robustness risks and deployment feasibility. Your final deliverable will be an Optimization and Edge Deployment Strategy Brief, a structured technical report that identifies workflow bottlenecks, proposes targeted optimization strategies, evaluates slice-level risks, and presents a justified edge-deployment recommendation. The project reflects real-world ML engineering responsibilities where professionals must balance accuracy, speed, maintainability, and hardware constraints before approving production deployment.

Inclus

2 lectures1 devoir

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Professionals from the Industry
323 Cours 47 141 apprenants

Offert par

Coursera

En savoir plus sur Machine Learning

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.