Seminar / Training CUDA Performance & Profiling: Nsight, Memory, Occupancy, Tuning
Inhaltsverzeichnis
- Abstract
- Zielgruppe und Voraussetzungen
- Lernziele
- Inhalte und Module
- Praxisübungen und Fallstudien
- Agenda
Abstract
Das Seminar fokussiert Performance Engineering für CUDA. Im Mittelpunkt stehen Messmethoden, Profiling-Workflows und konkrete Optimierungstechniken für Speicherzugriffe, Auslastung und Parallelität. Teilnehmende lernen, Performanceprobleme reproduzierbar zu isolieren, Metriken korrekt zu interpretieren und Optimierungen iterativ zu verifizieren. Hands-on-Übungen führen von „Baseline“ über Messung bis zur stabilen Beschleunigung mit dokumentierten Trade-offs.
Zielgruppe und Voraussetzungen
- Zielgruppe: CUDA-Entwicklung, Performance Engineering, HPC
- Voraussetzungen: sichere CUDA-Grundlagen (Kernel, Memory, Synchronisation). Empfehlenswert: Seminar CUDA Programmierung Grundlagen: Kernels, Memory, Toolchain oder gleichwertig
Lernziele
- Profiling-Workflow: Hypothese → Messung → Optimierung → Verifikation
- Bottlenecks identifizieren: Memory-bound vs compute-bound
- Kernel-Tuning: Occupancy, Registerdruck, Shared Memory, Divergenz, Launch-Konfiguration
- Performance-Regressions vermeiden: Benchmarking und Messdisziplin
Inhalte und Module
- Metriken und Denkmodelle: Throughput, Latenz, Roofline, Amdahl/Overheads
- Profiling-Werkzeuge (konzeptionell + Praxis): System- vs Kernelprofiling
- Speicheroptimierung: Coalescing, Alignment, Cache-Nutzung, Shared Memory als Cache
- Compute-Optimierung: Instruction Mix, ILP, Warp-Effizienz, Divergenz-Reduktion
- Launch-Tuning: Blockgrößen, Occupancy, Limits durch Register/Shared Memory
- Asynchronität-Grundlagen: Streams (als Performance-Hebel, Basislevel)
- Benchmarking: Warmup, Wiederholungen, Varianz, Pinning, Takt-/Power-Effekte (praxisnah)
Praxisübungen und Fallstudien
- Profiling eines gegebenen Kernels und Ableitung von Hypothesen
- Speichergebundene Fallstudie: Layout/Coalescing verbessern
- Computegebundene Fallstudie: Divergenz reduzieren, ILP erhöhen
- Occupancy-Lab: Blockgröße und Registerdruck gegeneinander abwägen
- Mini-Performance-Report als Ergebnisartefakt
Agenda
- Tag 1
- Messmethodik und Profiling-Workflow
- Speicher-Tuning und Cache-/Shared-Strategien
- Übungen: Speichergebundene Optimierung
- Tag 2
- Compute-Tuning, Divergenz, Launch-Konfiguration
- Occupancy, Registerdruck, Trade-offs
- Übungen: Iteratives Tuning + Verifikation
Seminar und Anbieter vergleichen
Öffentliche Schulung
Diese Seminarform ist auch als Präsenzseminar bekannt und bedeutet, dass Sie in unseren Räumlichkeiten von einem Trainer vor Ort geschult werden. Jeder Teilnehmer hat einen Arbeitsplatz mit virtueller Schulungsumgebung. Öffentliche Seminare werden in deutscher Sprache durchgeführt, die Unterlagen sind teilweise in Englisch.
Inhausschulung
Diese Seminarform bietet sich für Unternehmen an, welche gleichzeitig mehrere Teilnehmer gleichzeitig schulen möchten. Der Trainer kommt zu Ihnen ins Haus und unterrichtet in Ihren Räumlichkeiten. Diese Seminare können auf Deutsch – bei Firmenseminaren ist auch Englisch möglich – gebucht werden.
Webinar
Diese Art der Schulung ist geeignet, wenn Sie die Präsenz eines Trainers nicht benötigen, nicht reisen können und über das Internet an einer Schulung teilnehmen möchten.
Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner
-

Lucas Beich
Telefon: + 49 (221) 74740055
E-Mail: lucas.beich@seminar-experts.de
Seminardetails
| Dauer: | 2 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr, weitere Tage 09:00 Uhr |
| Preis: |
Öffentlich oder Live Stream: € 1.198 zzgl. MwSt. Inhaus: € 3.400 zzgl. MwSt. |
| Teilnehmeranzahl: | min. 2 - max. 8 |
| Teilnehmer: | CUDA-Entwicklung, Performance Engineering, HPC |
| Vorausetzung: | sichere CUDA-Grundlagen (Kernel, Memory, Synchronisation). Empfehlenswert: Seminar CUDA Programmierung Grundlagen: Kernels, Memory, Toolchain oder gleichwertig |
| Standorte: | Stream Live, Inhaus/Firmenseminar, Berlin, Bremen, Darmstadt, Dresden, Erfurt, Essen, Flensburg, Frankfurt, Freiburg, Friedrichshafen, Hamburg, Hamm, Hannover, Jena, Kassel, Köln, Konstanz, Leipzig, Luxemburg, Magdeburg, Mainz, München, Münster, Nürnberg, Paderborn, Potsdam, Regensburg, Rostock, Stuttgart, Trier, Ulm, Wuppertal, Würzburg |
| Methoden: | Vortrag, Demonstrationen, praktische Übungen am System |
| Seminararten: | Öffentlich, Webinar, Inhaus, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht |
| Durchführungsgarantie: | ja, ab 2 Teilnehmern |
| Sprache: | Deutsch - bei Firmenseminaren ist auch Englisch möglich |
| Seminarunterlage: | Dokumentation auf Datenträger oder als Download |
| Teilnahmezertifikat: | ja, selbstverständlich |
| Verpflegung: | Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch) |
| Support: | 3 Anrufe im Seminarpreis enthalten |
| Barrierefreier Zugang: | an den meisten Standorten verfügbar |
| Weitere Informationen unter + 49 (221) 74740055 |
Seminartermine
Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.
