The Optimizing Models for Production course prepares learners to make generative AI models more efficient, scalable, and cost-effective for real-world deployment. Learners begin with quantization, applying INT8 and INT4 precision reduction using tools like bitsandbytes while balancing accuracy and efficiency. Next, they explore inference optimization strategies, including batching, KV-cache management, and token-level computation scheduling to reduce latency in interactive applications.

Optimizing Models for Production
Cela se termine bientôt : Obtenez des compétences de niveau supérieur avec Coursera Plus pour 199 $ (régulièrement 399 $). Économisez maintenant.

Optimizing Models for Production
Ce cours fait partie de Open Generative AI: Build with Open Models and Tools Certificat Professionnel

Instructeur : Professionals from the Industry
Inclus avec
Expérience recommandée
Compétences que vous acquerrez
- Catégorie : MLOps (Machine Learning Operations)
- Catégorie : Performance Testing
- Catégorie : Generative AI
- Catégorie : Model Deployment
- Catégorie : Application Deployment
- Catégorie : Hardware Architecture
- Catégorie : Large Language Modeling
- Catégorie : PyTorch (Machine Learning Library)
- Catégorie : Performance Tuning
Détails à connaître

Ajouter à votre profil LinkedIn
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise en Machine Learning
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable auprès de Coursera

Il y a 4 modules dans ce cours
Inclus
1 laboratoire non noté
Inclus
1 laboratoire non noté
Inclus
1 laboratoire non noté
Inclus
1 laboratoire non noté
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeur

Offert par
En savoir plus sur Machine Learning
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?




Foire Aux Questions
To access the course materials, assignments and to earn a Certificate, you will need to purchase the Certificate experience when you enroll in a course. You can try a Free Trial instead, or apply for Financial Aid. The course may offer 'Full Course, No Certificate' instead. This option lets you see all course materials, submit required assessments, and get a final grade. This also means that you will not be able to purchase a Certificate experience.
When you enroll in the course, you get access to all of the courses in the Certificate, and you earn a certificate when you complete the work. Your electronic Certificate will be added to your Accomplishments page - from there, you can print your Certificate or add it to your LinkedIn profile.
Plus de questions
Aide financière disponible,








