Packt

GPU-Programmierung mit C++ und CUDA

Sichern Sie sich eines unserer besten Angebote mit Coursera Plus für 199 $ (normalerweise 399 $). Jetzt sparen.

Packt

GPU-Programmierung mit C++ und CUDA

Bei Coursera Plus enthalten

Fragen Sie Coursera

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

1 Woche zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

1 Woche zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Beschleunigung praxisnaher Aufgaben durch GPU-Parallelität

  • Optimieren Sie die Leistung mit CUDA-Streams und maßgeschneiderten C++-Lösungen

  • GPU-Bibliotheken mit Python-Integration erstellen und freigeben

Kompetenzen, die Sie erwerben

  • Kategorie: Containerisierung
  • Kategorie: Fehlersuche
  • Kategorie: Test-Tools
  • Kategorie: Skripting
  • Kategorie: Hardware-Architektur
  • Kategorie: Computerarchitektur
  • Kategorie: Software-Entwicklungstools
  • Kategorie: Speicherverwaltung
  • Kategorie: Grundsätze der Programmierung
  • Kategorie: Software-definierte Netzwerke
  • Kategorie: Algorithmen
  • Kategorie: Leistungsoptimierung
  • Kategorie: Entwicklungstests
  • Kategorie: C und C++
  • Kategorie: System-Programmierung
  • Kategorie: Entwicklungsumgebung
  • Kategorie: Computerprogrammierung

Werkzeuge, die Sie lernen werden

  • Kategorie: C++ (Programmiersprache)
  • Kategorie: Docker (Software)
  • Kategorie: Python-Programmierung

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

März 2026

Bewertungen

10 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

In diesem Kurs gibt es 10 Module

In diesem Abschnitt befassen wir uns mit Parallelität in der Software, ihrer Bedeutung sowie den Unterschieden zwischen CPU- und GPU-Architekturen, um eine Grundlage für die GPU-Programmierung zu schaffen.

Das ist alles enthalten

2 Videos4 Lektüren1 Aufgabe

In diesem Abschnitt richten wir mithilfe von Docker eine GPU-Umgebung ein, suchen die offizielle Linux-Dokumentation und installieren das CUDA-Toolkit unter Ubuntu 20.04 oder 22.04 für KI- und Machine-Learning-Workflows.

Das ist alles enthalten

1 Video3 Lektüren1 Aufgabe

In diesem Abschnitt stellen wir die Grundlagen der GPU-Programmierung vor, darunter die Ausführung von Kerneln, die Überprüfung von Geräten und die Einrichtung einer Arbeitsumgebung für die CUDA-Entwicklung.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der SIMD-Ausführung, dem Datentransport und der parallelen Vektoraddition in der GPU-Programmierung.

Das ist alles enthalten

1 Video5 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit GPU-Thread-, Block- und Grid-Konfigurationen, asynchroner Datenübertragung, Streams, Ereignissen und gemeinsam genutztem Speicher, um die Leistung bei der parallelen Datenverarbeitung zu optimieren.

Das ist alles enthalten

1 Video5 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit dem Entwurf paralleler Algorithmen, wobei der Schwerpunkt auf Matrixoperationen, Reduktion und Lastverteilung für eine effiziente Ausführung auf der GPU liegt.

Das ist alles enthalten

1 Video8 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der GPU-Optimierung und -Profilierung mit NVIDIA Nsight Compute.

Das ist alles enthalten

1 Video5 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der Fehlersuche in CUDA-Code mit VS Code, der Verwendung von CUDA-Streams zur Überlappung von Speicher- und Kernel-Operationen sowie der Konfiguration mehrerer GPUs für die parallele Verarbeitung.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit Methoden zur Integration von C++-GPU-Code in Python, wobei der Schwerpunkt auf Ctypes, benutzerdefinierten Wrappern und der Leistungsanalyse für eine effiziente sprachübergreifende Ausführung liegt.

Das ist alles enthalten

1 Video4 Lektüren1 Aufgabe

In diesem Abschnitt befassen wir uns mit der GPU-Entwicklung unter Verwendung von cuBLAS und Thrust, optimieren den Code im Hinblick auf Speicher- und Thread-Effizienz und führen Tests mit GTest und Pytest durch, um Zuverlässigkeit und Leistung sicherzustellen.

Das ist alles enthalten

1 Video5 Lektüren1 Aufgabe

Dozent

Packt - Course Instructors
Packt
1.946 Kurse575.115 Lernende

von

Packt

Mehr von Software-Entwicklung entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen