Seminar CUDA Performance & Profiling: Nsight, Memory, Occupancy, Tuning

Seminar / Training CUDA Performance & Profiling: Nsight, Memory, Occupancy, Tuning

Inhaltsverzeichnis

  • Abstract
  • Zielgruppe und Voraussetzungen
  • Lernziele
  • Inhalte und Module
  • Praxisübungen und Fallstudien
  • Agenda

Abstract

Das Seminar fokussiert Performance Engineering für CUDA. Im Mittelpunkt stehen Messmethoden, Profiling-Workflows und konkrete Optimierungstechniken für Speicherzugriffe, Auslastung und Parallelität. Teilnehmende lernen, Performanceprobleme reproduzierbar zu isolieren, Metriken korrekt zu interpretieren und Optimierungen iterativ zu verifizieren. Hands-on-Übungen führen von „Baseline“ über Messung bis zur stabilen Beschleunigung mit dokumentierten Trade-offs.

Zielgruppe und Voraussetzungen

  • Zielgruppe: CUDA-Entwicklung, Performance Engineering, HPC
  • Voraussetzungen: sichere CUDA-Grundlagen (Kernel, Memory, Synchronisation). Empfehlenswert: Seminar CUDA Programmierung Grundlagen: Kernels, Memory, Toolchain oder gleichwertig

Lernziele

  • Profiling-Workflow: Hypothese → Messung → Optimierung → Verifikation
  • Bottlenecks identifizieren: Memory-bound vs compute-bound
  • Kernel-Tuning: Occupancy, Registerdruck, Shared Memory, Divergenz, Launch-Konfiguration
  • Performance-Regressions vermeiden: Benchmarking und Messdisziplin

Inhalte und Module

  • Metriken und Denkmodelle: Throughput, Latenz, Roofline, Amdahl/Overheads
  • Profiling-Werkzeuge (konzeptionell + Praxis): System- vs Kernelprofiling
  • Speicheroptimierung: Coalescing, Alignment, Cache-Nutzung, Shared Memory als Cache
  • Compute-Optimierung: Instruction Mix, ILP, Warp-Effizienz, Divergenz-Reduktion
  • Launch-Tuning: Blockgrößen, Occupancy, Limits durch Register/Shared Memory
  • Asynchronität-Grundlagen: Streams (als Performance-Hebel, Basislevel)
  • Benchmarking: Warmup, Wiederholungen, Varianz, Pinning, Takt-/Power-Effekte (praxisnah)

Praxisübungen und Fallstudien

  • Profiling eines gegebenen Kernels und Ableitung von Hypothesen
  • Speichergebundene Fallstudie: Layout/Coalescing verbessern
  • Computegebundene Fallstudie: Divergenz reduzieren, ILP erhöhen
  • Occupancy-Lab: Blockgröße und Registerdruck gegeneinander abwägen
  • Mini-Performance-Report als Ergebnisartefakt

Agenda

  • Tag 1
    • Messmethodik und Profiling-Workflow
    • Speicher-Tuning und Cache-/Shared-Strategien
    • Übungen: Speichergebundene Optimierung
  • Tag 2
    • Compute-Tuning, Divergenz, Launch-Konfiguration
    • Occupancy, Registerdruck, Trade-offs
    • Übungen: Iteratives Tuning + Verifikation

Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner

Seminar und Anbieter vergleichen

Öffentliche Schulung

Diese Seminarform ist auch als Präsenzseminar bekannt und bedeutet, dass Sie in unseren Räumlichkeiten von einem Trainer vor Ort geschult werden. Jeder Teilnehmer hat einen Arbeitsplatz mit virtueller Schulungsumgebung. Öffentliche Seminare werden in deutscher Sprache durchgeführt, die Unterlagen sind teilweise in Englisch.

Mehr dazu...

Inhausschulung

Diese Seminarform bietet sich für Unternehmen an, welche gleichzeitig mehrere Teilnehmer gleichzeitig schulen möchten. Der Trainer kommt zu Ihnen ins Haus und unterrichtet in Ihren Räumlichkeiten. Diese Seminare können auf Deutsch – bei Firmenseminaren ist auch Englisch möglich – gebucht werden.

Mehr dazu...

Webinar

Diese Art der Schulung ist geeignet, wenn Sie die Präsenz eines Trainers nicht benötigen, nicht reisen können und über das Internet an einer Schulung teilnehmen möchten.

Mehr dazu...

Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner

Seminardetails

   
Dauer: 2 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr, weitere Tage 09:00 Uhr
Preis: Öffentlich oder Live Stream: € 1.198 zzgl. MwSt.
Inhaus: € 3.400 zzgl. MwSt.
Teilnehmeranzahl: min. 2 - max. 8
Teilnehmer: CUDA-Entwicklung, Performance Engineering, HPC
Vorausetzung: sichere CUDA-Grundlagen (Kernel, Memory, Synchronisation). Empfehlenswert: Seminar CUDA Programmierung Grundlagen: Kernels, Memory, Toolchain oder gleichwertig
Standorte: Stream Live, Inhaus/Firmenseminar, Berlin, Bremen, Darmstadt, Dresden, Erfurt, Essen, Flensburg, Frankfurt, Freiburg, Friedrichshafen, Hamburg, Hamm, Hannover, Jena, Kassel, Köln, Konstanz, Leipzig, Luxemburg, Magdeburg, Mainz, München, Münster, Nürnberg, Paderborn, Potsdam, Regensburg, Rostock, Stuttgart, Trier, Ulm, Wuppertal, Würzburg
Methoden: Vortrag, Demonstrationen, praktische Übungen am System
Seminararten: Öffentlich, Webinar, Inhaus, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht
Durchführungsgarantie: ja, ab 2 Teilnehmern
Sprache: Deutsch - bei Firmenseminaren ist auch Englisch möglich
Seminarunterlage: Dokumentation auf Datenträger oder als Download
Teilnahmezertifikat: ja, selbstverständlich
Verpflegung: Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch)
Support: 3 Anrufe im Seminarpreis enthalten
Barrierefreier Zugang: an den meisten Standorten verfügbar
  Weitere Informationen unter + 49 (221) 74740055

Seminartermine

Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.

Seminar Startdatum Enddatum Ort Dauer
Luxemburg 2 Tage
Hannover 2 Tage
Stuttgart 2 Tage
Dresden 2 Tage
Madgeburg 2 Tage
Regensburg 2 Tage
Jena 2 Tage
Trier 2 Tage
München 2 Tage
Friedrichshafen 2 Tage
Kassel 2 Tage
Ulm 2 Tage
Münster 2 Tage
Nürnberg 2 Tage
Köln 2 Tage
Wuppertal 2 Tage
Bremen 2 Tage
Berlin 2 Tage
Mainz 2 Tage
Erfurt 2 Tage
Darmstadt 2 Tage
Frankfurt 2 Tage
Paderborn 2 Tage
Essen 2 Tage
Konstanz 2 Tage
Freiburg 2 Tage
Potsdam 2 Tage
Flensburg 2 Tage
Leipzig 2 Tage
Hamm 2 Tage
Rostock 2 Tage
Hamburg 2 Tage
Stuttgart 2 Tage
Dresden 2 Tage
Luxemburg 2 Tage
Hannover 2 Tage
Jena 2 Tage
Trier 2 Tage
Madgeburg 2 Tage
Regensburg 2 Tage
Nach oben
Seminare als Stream SRI zertifiziert
© 2026 www.seminar-experts.de All rights reserved. | Kontakt | Impressum | Nach oben