Packt

Accelerate Model Training with PyTorch 2.X

noch 6 Tage! Erwerben Sie das nächste Level mit Coursera Plus für $199 (regulär $399). Jetzt sparen.

kurs ist nicht verfügbar in Deutsch (Deutschland)

Wir übersetzen es in weitere Sprachen.
Packt

Accelerate Model Training with PyTorch 2.X

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Anfänger

Empfohlene Erfahrung

8 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Anfänger

Empfohlene Erfahrung

8 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Optimize model training using PyTorch and performance tuning techniques.

  • Leverage specialized libraries to enhance CPU-based training.

  • Build efficient data pipelines to improve GPU utilization.

Kompetenzen, die Sie erwerben

  • Kategorie: Hardware Architecture
  • Kategorie: PyTorch (Machine Learning Library)
  • Kategorie: LLM Application
  • Kategorie: Scalability
  • Kategorie: Machine Learning
  • Kategorie: Distributed Computing
  • Kategorie: Data Pipelines
  • Kategorie: MLOps (Machine Learning Operations)
  • Kategorie: Computer Architecture
  • Kategorie: Model Deployment
  • Kategorie: Performance Tuning
  • Kategorie: Deep Learning
  • Kategorie: AI Workflows

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

Januar 2026

Bewertungen

11 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

In diesem Kurs gibt es 11 Module

In this section, we explore the training process of neural networks, analyze factors contributing to computational burden, and evaluate elements influencing training time.

Das ist alles enthalten

2 Videos3 Lektüren1 Aufgabe

In this section, we explore techniques to accelerate model training by modifying the software stack and scaling resources. Key concepts include vertical and horizontal scaling, application and environment layer optimizations, and practical strategies for improving efficiency.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In this section, we explore the PyTorch 2.0 Compile API to accelerate deep learning model training, focusing on graph mode benefits, API usage, and workflow components for performance optimization.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In this section, we explore using OpenMP for multithreading and IPEX to optimize PyTorch on Intel CPUs, enhancing performance through specialized libraries.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In this section, we explore building efficient data pipelines to prevent training bottlenecks. Key concepts include configuring workers, optimizing GPU memory transfer, and ensuring continuous data flow for ML model training.

Das ist alles enthalten

1 Video2 Lektüren1 Aufgabe

In this section, we explore model simplification through pruning and compression techniques to improve efficiency without sacrificing performance, using the Microsoft NNI toolkit for practical implementation.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In this section, we explore mixed precision strategies to optimize model training efficiency by reducing computational and memory demands without sacrificing accuracy, focusing on PyTorch implementation and hardware utilization.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In this section, we explore distributed training principles, parallel strategies, and PyTorch implementation to enhance model training efficiency through resource distribution.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In this section, we explore distributed training on multiple CPUs, focusing on benefits, implementation, and using Intel oneCCL for efficient communication in resource-constrained environments.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In this section, we explore multi-GPU training strategies, analyze interconnection topologies, and configure NCCL for efficient distributed deep learning operations.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In this section, we explore distributed training on computing clusters, focusing on Open MPI and NCCL for efficient communication and resource management across multiple machines.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

Dozent

Packt - Course Instructors
Packt
1.365 Kurse 361.750 Lernende

von

Packt

Mehr von Machine Learning entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Coursera Plus

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen