Production ML models failing your latency targets? Learn how to make them run 3-5x faster without losing accuracy. This course helps ML engineers and data scientists optimize neural network inference for real-world deployment—across mobile, edge, and cloud environments. If you face slow model inference, high infrastructure costs, or deployment constraints, this course provides practical solutions. You'll master profiling techniques to identify performance bottlenecks, apply quantization to cut precision requirements, and make smart trade-offs between speed, accuracy, and resource constraints. You'll learn to benchmark optimization techniques and select the right approach for deployment scenarios. You'll explore inference profiling and metrics, pruning strategies, and quantization methods. You'll practice with real-world cases—from streaming platforms to autonomous vehicles—using industry-standard tools like PyTorch Profiler, TensorRT, and pruning utilities.

Optimize AI Inference Speed & Accuracy

Optimize AI Inference Speed & Accuracy
Dieser Kurs ist Teil von Spezialisierung „AI Security: Security in the Age of Artificial Intelligence“


Dozenten: Starweaver
Bei enthalten
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel
Empfohlene Erfahrung
4 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Was Sie lernen werden
Analyze inference bottlenecks to identify optimization opportunities in production ML systems.
Implement model pruning techniques to reduce computational complexity while maintaining acceptable accuracy.
Apply quantization methods and benchmark trade-offs for secure and efficient model deployment.
Kompetenzen, die Sie erwerben
- Kategorie: Network Model
- Kategorie: Process Optimization
- Kategorie: Model Evaluation
- Kategorie: Model Training
- Kategorie: Numerical Analysis
- Kategorie: Cloud Deployment
- Kategorie: Project Performance
- Kategorie: AI Security
- Kategorie: Model Optimization
- Kategorie: Benchmarking
Werkzeuge, die Sie lernen werden
- Kategorie: Keras (Neural Network Library)
- Kategorie: Model Deployment
Wichtige Details

Zertifikat zur Vorlage
Zu Ihrem LinkedIn-Profil hinzufügen
Kürzlich aktualisiert!
Dezember 2025
Bewertungen
1 Aufgabe
Unterrichtet in Englisch
91% of learners achieved a positive career outcome
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
Dieser Kurs ist Teil der Spezialisierung Spezialisierung „AI Security: Security in the Age of Artificial Intelligence“
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 3 Module
Erwerben Sie ein Karrierezertifikat.
Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
von
Mehr von Machine Learning entdecken
Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Häufig gestellte Fragen
Weitere Fragen
Finanzielle Unterstützung verfügbar,







