Production ML models failing your latency targets? Learn how to make them run 3-5x faster without losing accuracy. This course helps ML engineers and data scientists optimize neural network inference for real-world deployment—across mobile, edge, and cloud environments. If you face slow model inference, high infrastructure costs, or deployment constraints, this course provides practical solutions. You'll master profiling techniques to identify performance bottlenecks, apply quantization to cut precision requirements, and make smart trade-offs between speed, accuracy, and resource constraints. You'll learn to benchmark optimization techniques and select the right approach for deployment scenarios. You'll explore inference profiling and metrics, pruning strategies, and quantization methods. You'll practice with real-world cases—from streaming platforms to autonomous vehicles—using industry-standard tools like PyTorch Profiler, TensorRT, and pruning utilities.

Optimize AI Inference Speed & Accuracy

Optimize AI Inference Speed & Accuracy
Ce cours fait partie de Spécialisation "AI Security: Security in the Age of Artificial Intelligence"


Instructeurs : Starweaver
Inclus avec
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire
Expérience recommandée
4 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Ce que vous apprendrez
Analyze inference bottlenecks to identify optimization opportunities in production ML systems.
Implement model pruning techniques to reduce computational complexity while maintaining acceptable accuracy.
Apply quantization methods and benchmark trade-offs for secure and efficient model deployment.
Compétences que vous acquerrez
- Catégorie : Model Optimization
- Catégorie : Project Performance
- Catégorie : Process Optimization
- Catégorie : Model Training
- Catégorie : Network Model
- Catégorie : Cloud Deployment
- Catégorie : Benchmarking
- Catégorie : Model Evaluation
- Catégorie : AI Security
- Catégorie : Numerical Analysis
Outils que vous découvrirez
- Catégorie : Keras (Neural Network Library)
- Catégorie : Model Deployment
Détails à connaître

Certificat partageable
Ajouter à votre profil LinkedIn
Récemment mis à jour !
décembre 2025
Évaluations
1 devoir
Enseigné en Anglais
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
Ce cours fait partie de la Spécialisation "AI Security: Security in the Age of Artificial Intelligence"
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 3 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Offert par
En savoir plus sur Machine Learning
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Foire Aux Questions
Plus de questions
Aide financière disponible,




