Dieses zweitägige Seminar konzentriert sich auf den praktischen Weg von Rohdaten zu belastbaren Hive-Tabellen. Zwei Tage sind sinnvoll, weil Datenladung, Dateiformate, Partitionierungsstrategien, ACID-Verhalten und typische ETL-Muster eng zusammenhängen und nur in Kombination sauber verstanden werden.
Zielsetzung
Erarbeitet wird ein belastbarer Werkzeugkasten für den Aufbau von Hive-basierten Lade- und Aufbereitungsstrecken in analytischen Datenplattformen.
Inhalte
- Interne und externe Tabellen sowie geeignete Einsatzszenarien
- Dateiformate, Kompression und ihre Auswirkungen auf Verarbeitung und Speicherverbrauch
- Partitionierung, Bucketing und sinnvolle Datenorganisation
- Batch-Ladevorgänge, inkrementelle Beladung und typische ETL-Muster
- ACID-Tabellen, Transaktionen, Merge- und Änderungsprozesse
- Datenbereinigung, Qualitätsprüfungen und technische Plausibilisierung
- Fehlerbilder in Ladeprozessen und robuste Korrekturstrategien
Praxisanteil
Die Übungen führen durch komplette Lade- und Änderungsprozesse, von der Tabellendefinition über die Datenaufnahme bis zur kontrollierten Aktualisierung bestehender Bestände.
Nutzen im Projekt
Nach dem Seminar lassen sich ETL-Strecken klarer modellieren, Tabellen gezielter strukturieren und Änderungsprozesse mit weniger Überraschungen umsetzen.
Zielgruppe
Data Engineers, ETL-Entwickler, BI-Entwickler und Analytics-Teams, die Hive als Integrations- und Verarbeitungsschicht einsetzen.
Seminar und Anbieter vergleichen
Öffentliche Schulung
Diese Seminarform ist auch als Präsenzseminar bekannt und bedeutet, dass Sie in unseren Räumlichkeiten von einem Trainer vor Ort geschult werden. Jeder Teilnehmer hat einen Arbeitsplatz mit virtueller Schulungsumgebung. Öffentliche Seminare werden in deutscher Sprache durchgeführt, die Unterlagen sind teilweise in Englisch.
Inhausschulung
Diese Seminarform bietet sich für Unternehmen an, welche gleichzeitig mehrere Teilnehmer gleichzeitig schulen möchten. Der Trainer kommt zu Ihnen ins Haus und unterrichtet in Ihren Räumlichkeiten. Diese Seminare können auf Deutsch – bei Firmenseminaren ist auch Englisch möglich – gebucht werden.
Webinar
Diese Art der Schulung ist geeignet, wenn Sie die Präsenz eines Trainers nicht benötigen, nicht reisen können und über das Internet an einer Schulung teilnehmen möchten.
Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner
-

Lucas Beich
Telefon: + 49 (221) 74740055
E-Mail: lucas.beich@seminar-experts.de -

Paul Goldschmidt
Telefon: + 49 (221) 74740055
E-Mail: paul.goldschmidt@seminar-experts.de
Seminardetails
| Dauer: | 2 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr, weitere Tage 09:00 Uhr |
| Preis: |
Öffentlich oder Live Stream: € 1.198 zzgl. MwSt. Inhaus: € 3.400 zzgl. MwSt. |
| Teilnehmeranzahl: | min. 2 - max. 8 |
| Teilnehmer: | Data Engineers, ETL-Entwickler, BI-Entwickler und Analytics-Teams |
| Voraussetzungen: | SQL-Grundkenntnisse und erste Erfahrung mit Tabellen, Dateien oder ETL-Prozessen |
| Standorte: | Stream Live, Inhaus/Firmenseminar, Berlin, Bremen, Darmstadt, Dresden, Erfurt, Essen, Flensburg, Frankfurt, Freiburg, Friedrichshafen, Hamburg, Hamm, Hannover, Jena, Kassel, Köln, Konstanz, Leipzig, Luxemburg, Magdeburg, Mainz, München, Münster, Nürnberg, Paderborn, Potsdam, Regensburg, Rostock, Stuttgart, Trier, Ulm, Wuppertal, Würzburg |
| Methoden: | Vortrag, Demonstrationen sowie praktische ETL- und Abfrageübungen am System |
| Seminararten: | Öffentlich, Webinar, Inhaus, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht |
| Durchführungsgarantie: | ja, ab 2 Teilnehmern |
| Sprache: | Deutsch - bei Firmenseminaren ist auch Englisch möglich |
| Seminarunterlage: | Dokumentation auf Datenträger oder als Download |
| Teilnahmezertifikat: | ja, selbstverständlich |
| Verpflegung: | Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch) |
| Support: | 3 Anrufe im Seminarpreis enthalten |
| Barrierefreier Zugang: | an den meisten Standorten verfügbar |
| Weitere Informationen unter + 49 (221) 74740055 |
Seminartermine
Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.
