Seminar Data Analyst

Hadoop Data Analyst

  • Einführung
  • Hadoop Grundlagen
  • Einführung in Pig
  • Einfache Datenanalyse mit Pig
  • Komplexe Daten mit Pig verarbeiten
  • Multi-Dataset Operationen mit Pig
  • Pig erweitern
  • Pig Fehlerbereinigung und Optimierung
  • Einführung in Hive
  • Relationale Daten mit Hive analysieren
  • Hive Datenmanagement
  • Textverarbeitung mit Hive
  • Hive Optimierung
  • Einführung in Impala
  • Analyse von Daten mit Impala
  • Auswahl des richtigen Werkzeugs

Details und Inhalte dieses Seminars (bitte hier klicken)

Einheit 1 - Einführung

Einheit 2 - Hadoop Grundlagen

  • Gründe für Hadoop
  • Hadoop Übersicht
  • HDFS
  • MapReduce
  • Das Hadoop Ökosystem
  • Data Ingest mit den Hadoop Werkzeugen

Einheit 3 – Einführung in Pig

  • Was ist Pig?
  • Pigs Funktionen
  • Anwendungsszenarien für Pig >
  • Interaktionen mit Pig

Einheit 4 – Einfache Datenanalyse mit Pig

  • Pig Latin Syntax
  • Daten laden
  • Einfache Datentypen
  • Felddefinitionen
  • Data Output
  • Betrachten des Schemas
  • Filtern und sortieren der Daten
  • Häufig genutzte Funktionen
  • Pig und ETL Verarbeitung

Einheit 5 – Komplexe Daten mit Pig verarbeiten

  • Storage Formate
  • Komplexe und verschachtelte Datentypen
  • Gruppieren
  • Funktionen für komplexe Daten
  • Aufzählen gruppierter Daten

Einheit 6 - Multi-Dataset Operationen mit Pig

  • Techniken für die Kombination von Data Sets
  • Verknüpfen von Daten in Pig
  • Set Operations
  • Teilen von Data Sets

Einheit 7 – Pig erweitern

  • Die Flexibilätät durch Parameter erhöhen
  • Makros und Importe
  • UDFs
  • Contributed Functions
  • Verwenden anderer Sprachen mit die Analyse mit Pig
  • Pig mit Streaming und UDFs erweitern

Einheit 8 - Pig Fehlerbereinigung und Optimierung

  • Troubleshooting Pig
  • Logging
  • Hadoops Web UI
  • Debugging
  • Geschwindigkeitsübersicht
  • Ausführungspläne
  • Beschleunigen der Pig Aufträge

Einheit 9 – Einführung in Hive

  • Was ist Hive?
  • Hive Schema und Datenspeicherung
  • Vergleich von Hive mit traditionellen Datenbanken
  • Hive verglichen mit Pig
  • Hive Anwendungsfälle
  • Interaktion mit Hive

Einheit 10 – Relationale Daten mit Hive analysieren

  • Hive Datenbanken und Tabellen
  • HiveQL Syntax
  • Datentypen
  • Verbinden von Datensets
  • Wichtige Funktionen
  • Starten von Hive Abfragen mit Shell, Scripts und Hue

Einheit 11 - Hive Datenmanagement

  • Hive Datenformate
  • Anlegen und Anpassen von Datenbanken und Tabellen
  • Laden von Daten in Hive
  • Selbstverwaltete Tabellen
  • Abfragen mit Views vereinfachen
  • Speichern von Abfrageergebnissen
  • Zugriffsrechte steuern
  • Datenmanagement mit Hive

Einheit 12 – Textverarbeitung mit Hive

  • Übersicht
  • String Funktionen
  • Regular Expressions in Hive
  • Sentiment Analysis und N-Grams

Einheit 13 - Hive Optimierung

  • Abfragen beschleunigen
  • Jobausführung kontrollieren Plan
  • Partitioning
  • Bucketing
  • Indexing Data Extending Hive
  • SerDes
  • Datentransformationen mit Custom Scripts
  • Benutzerdefinierte Funktionen
  • Parameterübergabe bei Abfragen

Einheit 14 – Einführung in Impala

  • Was ist Impala?
  • Unterschiede zwischen Impala, Hive und Pig
  • Wie sich Impala von relationalen Datenbanken unterscheidet
  • Grenzen von Impala
  • Impala Shell

Einheit 15 - Analyse von Daten mit Impala

  • Syntax
  • Datentypen
  • Filtern, Sortieren und begrenzen des Ergebnisse
  • Verknüpfen und Sortieren des Ergebnis
  • Beschleunigen von Impala

Einheit 16 – Auswahl des richtigen Werkzeugs

  • Vergleich von MapReduce, Pig, Hive, Impala, und relationalen Datenbanken

Seminartermine

Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.

Seminar Startdatum Enddatum Ort Dauer
Darmstadt 4 Tage
Friedrichshafen 4 Tage
Hamburg 4 Tage
Berlin 4 Tage
Jena 4 Tage
Konstanz 4 Tage
Nürnberg 4 Tage
Dresden 4 Tage
Frankfurt 4 Tage
Kassel 4 Tage
Leipzig 4 Tage
Mainz 4 Tage
Trier 4 Tage
Freiburg 4 Tage
Köln 4 Tage
Luxemburg 4 Tage
Paderborn 4 Tage
Ulm 4 Tage
Hamm 4 Tage
Erfurt 4 Tage
Madgeburg 4 Tage
Potsdam 4 Tage
Wuppertal 4 Tage
Hannover 4 Tage
Essen 4 Tage
München 4 Tage
Rostock 4 Tage
Bremen 4 Tage
Regensburg 4 Tage
Flensburg 4 Tage
Münster 4 Tage
Stuttgart 4 Tage
Darmstadt 4 Tage
Friedrichshafen 4 Tage
Hamburg 4 Tage
Berlin 4 Tage
Jena 4 Tage
Konstanz 4 Tage
Nürnberg 4 Tage
Dresden 4 Tage

Seminardetails

Weitere Informationen unter +49 (0) 208 451 99 012
Dauer:4 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr, weitere Tage 09:00 Uhr
Preis:Öffentlich oder Live Stream: € 1.996 zzgl. MwSt.
Inhaus: € 5.400 zzgl. MwSt.
Teilnehmeranzahl:min. 2 - max. 8
Voraussetzungen:Linux Kenntnisse
Standorte:Stream Live, Inhaus/Firmenseminar, Berlin, Bremen, Darmstadt, Dresden, Erfurt, Essen, Flensburg, Frankfurt, Freiburg, Friedrichshafen, Hamburg, Hamm, Hannover, Jena, Kassel, Köln, Konstanz, Leipzig, Luxemburg, Magdeburg, Mainz, München, Münster, Nürnberg, Paderborn, Potsdam, Regensburg, Rostock, Stuttgart, Trier, Ulm, Wuppertal, Würzburg
Methoden:Vortrag, Demonstrationen, praktische Übungen am System
Seminararten:Öffentlich, Webinar, Inhaus, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht
Durchführungsgarantie:ja, ab 2 Teilnehmern
Sprache:Deutsch - bei Firmenseminaren ist auch Englisch möglich
Seminarunterlage:Dokumentation auf Datenträger oder als Download
Teilnahmezertifikat:ja, selbstverständlich
Verpflegung:Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch)
Support:3 Anrufe im Seminarpreis enthalten
Barrierefreier Zugang:an den meisten Standorten verfügbar

Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner

Seminar und Anbieter vergleichen

Bitte vergleichen Sie uns mit anderen Anbietern. Das vorbereitete PDF Formular können Sie hier kostenfrei laden. Wenn Sie dort ein passenderes Angebot erhalten, dann sprechen Sie uns bitte an. Wir möchten Sie gerne als Kunden gewinnen.

Abendseminare

Gerne bieten wir Ihnen unsere Seminare als Abendseminare mit angepassten Laufzeiten und Terminen an. Abendseminare können bei Ihnen vor Ort oder an unseren Standorten stattfinden. Die Termine sind flexibel anpassbar. Bitte sprechen Sie unsere Berater an.

Öffentliche Schulung

Diese Seminarform ist auch als Präsenzseminar bekannt und bedeutet, dass Sie in unseren Räumlichkeiten von einem Trainer vor Ort geschult werden. Jeder Teilnehmer hat einen Arbeitsplatz mit virtueller Schulungsumgebung. Öffentliche Seminare werden in deutscher Sprache durchgeführt, die Unterlagen sind teilweise in Englisch.

Mehr dazu...

Inhausschulung

Diese Seminarform bietet sich für Unternehmen an, welche gleiche mehrere Teilnehmer gleichzeitig schulen möchten. Der Trainer kommt zu Ihnen ins Haus und unterrichtet in Ihren Räumlichkeiten. Diese Seminare können in Deutsch - bei Firmenseminaren ist auch Englisch möglich gebucht werden.

Mehr dazu...

Webinar

Diese Art der Schulung ist geeignet, wenn Sie die Präsenz eines Trainers nicht benötigen, nicht Reisen können und über das Internet an einer Schulung teilnehmen möchten.

Mehr dazu...

Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner

Nach oben
© 2018 www.seminar-experts.de All rights reserved. | Webdesign | Kontakt | Impressum | Mobile Version | Nach oben