Seminar Cloudera Data Analyst

Seminar / Training Cloudera Data Analyst

  • Einführung
  • Hadoop Grundlagen
  • Einführung in Pig
  • Einfache Datenanalyse mit Pig
  • Komplexe Daten mit Pig verarbeiten
  • Multi-Dataset Operationen mit Pig
  • Pig erweitern
  • Pig Fehlerbereinigung und Optimierung
  • Einführung in Hive
  • Relationale Daten mit Hive analysieren
  • Hive Datenmanagement
  • Textverarbeitung mit Hive
  • Hive Optimierung
  • Einführung in Impala
  • Analyse von Daten mit Impala
  • Auswahl des richtigen Werkzeugs

Geschulte Softwareversion

Wir schulen die jeweils letzte, verfügbare Version der Software in unseren Seminaren.

Details und Inhalte dieses Seminars (bitte hier klicken)

Einheit 1 - Einführung

Einheit 2 - Hadoop Grundlagen

  • Gründe für Hadoop
  • Hadoop Übersicht
  • HDFS
  • MapReduce
  • Das Hadoop Ökosystem
  • Data Ingest mit den Hadoop Werkzeugen

Einheit 3 – Einführung in Pig

  • Was ist Pig?
  • Pigs Funktionen
  • Anwendungsszenarien für Pig
  • Interaktionen mit Pig

Einheit 4 – Einfache Datenanalyse mit Pig

  • Pig Latin Syntax
  • Daten laden
  • Einfache Datentypen
  • Felddefinitionen
  • Data Output
  • Betrachten des Schemas
  • Filtern und sortieren der Daten
  • Häufig genutzte Funktionen
  • Pig und ETL Verarbeitung

Einheit 5 – Komplexe Daten mit Pig verarbeiten

  • Storage Formate
  • Komplexe und verschachtelte Datentypen
  • Gruppieren
  • Funktionen für komplexe Daten
  • Aufzählen gruppierter Daten

Einheit 6 - Multi-Dataset Operationen mit Pig

  • Techniken für die Kombination von Data Sets
  • Verknüpfen von Daten in Pig
  • Set Operations
  • Teilen von Data Sets

Einheit 7 – Pig erweitern

  • Die Flexibilität durch Parameter erhöhen
  • Makros und Importe
  • UDFs
  • Contributed Functions
  • Verwenden anderer Sprachen mit die Analyse mit Pig
  • Pig mit Streaming und UDFs erweitern

Einheit 8 - Pig Fehlerbereinigung und Optimierung

  • Troubleshooting Pig
  • Logging
  • Hadoops Web UI
  • Debugging
  • Geschwindigkeitsübersicht
  • Ausführungspläne
  • Beschleunigen der Pig Aufträge

Einheit 9 – Einführung in Hive

  • Was ist Hive?
  • Hive Schema und Datenspeicherung
  • Vergleich von Hive mit traditionellen Datenbanken
  • Hive verglichen mit Pig
  • Hive Anwendungsfälle
  • Interaktion mit Hive

Einheit 10 – Relationale Daten mit Hive analysieren

  • Hive Datenbanken und Tabellen
  • HiveQL Syntax
  • Datentypen
  • Verbinden von Datensets
  • Wichtige Funktionen
  • Starten von Hive Abfragen mit Shell, Scripts und Hue

Einheit 11 - Hive Datenmanagement

  • Hive Datenformate
  • Anlegen und Anpassen von Datenbanken und Tabellen
  • Laden von Daten in Hive
  • Selbstverwaltete Tabellen
  • Abfragen mit Views vereinfachen
  • Speichern von Abfrageergebnissen
  • Zugriffsrechte steuern
  • Datenmanagement mit Hive

Einheit 12 – Textverarbeitung mit Hive

  • Übersicht
  • String Funktionen
  • Regular Expressions in Hive
  • Sentiment Analysis und N-Grams

Einheit 13 - Hive Optimierung

  • Abfragen beschleunigen
  • Jobausführung kontrollieren Plan
  • Partitioning
  • Bucketing
  • Indexing Data Extending Hive
  • SerDes
  • Datentransformationen mit Custom Scripts
  • Benutzerdefinierte Funktionen
  • Parameterübergabe bei Abfragen

Einheit 14 – Einführung in Impala

  • Was ist Impala?
  • Unterschiede zwischen Impala, Hive und Pig
  • Wie sich Impala von relationalen Datenbanken unterscheidet
  • Grenzen von Impala
  • Impala Shell

Einheit 15 - Analyse von Daten mit Impala

  • Syntax
  • Datentypen
  • Filtern, Sortieren und begrenzen des Ergebnisse
  • Verknüpfen und Sortieren des Ergebnis
  • Beschleunigen von Impala

Einheit 16 – Auswahl des richtigen Werkzeugs

  • Vergleich von MapReduce, Pig, Hive, Impala, und relationalen Datenbanken

Seminartermine

Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.

Seminar Startdatum Enddatum Ort Dauer
Jena 4 Tage
Trier 4 Tage
Madgeburg 4 Tage
Regensburg 4 Tage
Kassel 4 Tage
Ulm 4 Tage
München 4 Tage
Friedrichshafen 4 Tage
Köln 4 Tage
Wuppertal 4 Tage
Münster 4 Tage
Nürnberg 4 Tage
Erfurt 4 Tage
Bremen 4 Tage
Berlin 4 Tage
Mainz 4 Tage
Paderborn 4 Tage
Essen 4 Tage
Darmstadt 4 Tage
Frankfurt 4 Tage
Potsdam 4 Tage
Flensburg 4 Tage
Konstanz 4 Tage
Freiburg 4 Tage
Rostock 4 Tage
Hamburg 4 Tage
Leipzig 4 Tage
Hamm 4 Tage
Stuttgart 4 Tage
Dresden 4 Tage
Luxemburg 4 Tage
Hannover 4 Tage
Madgeburg 4 Tage
Regensburg 4 Tage
Jena 4 Tage
Trier 4 Tage
München 4 Tage
Friedrichshafen 4 Tage
Kassel 4 Tage
Ulm 4 Tage

Seminardetails

   
Dauer: 4 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr, weitere Tage 09:00 Uhr
Preis:

Öffentlich oder Live Stream: € 1.996 zzgl. MwSt.
Inhaus: € 5.400 zzgl. MwSt.

Teilnehmeranzahl: min. 2 - max. 8
Voraussetzungen: Linux Kenntnisse
Standorte: Stream Live, Inhaus/Firmenseminar, Berlin, Bremen, Darmstadt, Dresden, Erfurt, Essen, Flensburg, Frankfurt, Freiburg, Friedrichshafen, Hamburg, Hamm, Hannover, Jena, Kassel, Köln, Konstanz, Leipzig, Luxemburg, Magdeburg, Mainz, München, Münster, Nürnberg, Paderborn, Potsdam, Regensburg, Rostock, Stuttgart, Trier, Ulm, Wuppertal, Würzburg
Methoden: Vortrag, Demonstrationen, praktische Übungen am System
Seminararten: Öffentlich, Webinar, Inhaus, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht
Durchführungsgarantie: ja, ab 2 Teilnehmern
Sprache: Deutsch - bei Firmenseminaren ist auch Englisch möglich
Seminarunterlage: Dokumentation auf Datenträger oder als Download
Teilnahmezertifikat: ja, selbstverständlich
Verpflegung: Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch)
Support: 3 Anrufe im Seminarpreis enthalten
Barrierefreier Zugang: an den meisten Standorten verfügbar
 

Weitere Informationen unter +49 30 306 89 392

Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner

Seminar und Anbieter vergleichen

Öffentliche Schulung

Diese Seminarform ist auch als Präsenzseminar bekannt und bedeutet, dass Sie in unseren Räumlichkeiten von einem Trainer vor Ort geschult werden. Jeder Teilnehmer hat einen Arbeitsplatz mit virtueller Schulungsumgebung. Öffentliche Seminare werden in deutscher Sprache durchgeführt, die Unterlagen sind teilweise in Englisch.

Mehr dazu...

Inhausschulung

Diese Seminarform bietet sich für Unternehmen an, welche gleiche mehrere Teilnehmer gleichzeitig schulen möchten. Der Trainer kommt zu Ihnen ins Haus und unterrichtet in Ihren Räumlichkeiten. Diese Seminare können in Deutsch - bei Firmenseminaren ist auch Englisch möglich gebucht werden.

Mehr dazu...

Webinar

Diese Art der Schulung ist geeignet, wenn Sie die Präsenz eines Trainers nicht benötigen, nicht Reisen können und über das Internet an einer Schulung teilnehmen möchten.

Mehr dazu...

Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner

  • Lucas Beich

    Telefon: +49 30 306 89 392
    E-Mail: 

  • Paul Goldschmidt

    Telefon: +49 30 306 89 392
    E-Mail: 

Nach oben
Seminare als Stream SRI zertifiziert
© 2024 www.seminar-experts.de All rights reserved. | Webdesign | Kontakt | Impressum | Mobile Version | Nach oben