Seminarbeschreibung
Das Grundlagenseminar vermittelt den vollständigen Standard-Workflow eines Apache-Nutch-Crawls. Über drei Tage entsteht ein belastbares Verständnis dafür, wie aus Seed-Listen, Konfiguration und Plugin-Auswahl ein reproduzierbarer Crawl mit auswertbaren Ergebnissen aufgebaut wird.
Zielsetzung
Im Mittelpunkt steht ein sauberer Einstieg in die technische Arbeitsweise von Apache Nutch. Die Teilnehmenden lernen, die wichtigsten Komponenten korrekt einzuordnen, einfache Crawler aufzusetzen und Ergebnisse fachlich wie technisch zu bewerten.
Schwerpunkte
- Installation, Verzeichnisstruktur und zentrale Konfigurationsdateien wie nutch-site.xml und plugin.includes
- Durchgängiger Crawl-Prozess mit Seeds, Injection, Generate, Fetch, Parse, Update und Indexierung
- Grundverständnis für Parser, URL-Regeln, Metadaten, Filter und Indexfelder
- Analyse von Ergebnissen in CrawlDb und Segmenten sowie Einordnung typischer Fehlersituationen
- Aufbau einer ersten belastbaren Laborumgebung für Pilot-Crawls und Lernprojekte
Praxisnutzen
Nach dem Seminar steht nicht nur Theorie, sondern ein nachvollziehbarer End-to-End-Workflow. Damit können erste Fachquellen angebunden, Ergebnisse geprüft und die nächsten Ausbauschritte im Team sauber vorbereitet werden.
Seminar und Anbieter vergleichen
Öffentliche Schulung
Diese Seminarform ist auch als Präsenzseminar bekannt und bedeutet, dass Sie in unseren Räumlichkeiten von einem Trainer vor Ort geschult werden. Jeder Teilnehmer hat einen Arbeitsplatz mit virtueller Schulungsumgebung. Öffentliche Seminare werden in deutscher Sprache durchgeführt, die Unterlagen sind teilweise in Englisch.
Inhausschulung
Diese Seminarform bietet sich für Unternehmen an, welche gleichzeitig mehrere Teilnehmer gleichzeitig schulen möchten. Der Trainer kommt zu Ihnen ins Haus und unterrichtet in Ihren Räumlichkeiten. Diese Seminare können auf Deutsch – bei Firmenseminaren ist auch Englisch möglich – gebucht werden.
Webinar
Diese Art der Schulung ist geeignet, wenn Sie die Präsenz eines Trainers nicht benötigen, nicht reisen können und über das Internet an einer Schulung teilnehmen möchten.
Fachbereichsleitung / Trainerbetreuung / Ansprechpartner
-

Lucas Beich
Telefon: + 49 (221) 74740055
E-Mail: lucas.beich@seminar-experts.de -

Paul Goldschmidt
Telefon: + 49 (221) 74740055
E-Mail: paul.goldschmidt@seminar-experts.de
Seminardetails
| Dauer: | 3 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr, weitere Tage 09:00 Uhr |
| Preis: |
Öffentlich oder Live Stream: € 1.797 zzgl. MwSt. Inhaus: € 5.100 zzgl. MwSt. |
| Teilnehmeranzahl: | min. 2 - max. 8 |
| Teilnehmer: | Search-Teams, Administratorische Teams, Data- und Web-Engineering |
| Voraussetzungen: | Linux- und Shell-Grundlagen sowie Basiswissen zu HTML, HTTP und XML; Java-Kenntnisse sind nicht erforderlich. |
| Standorte: | Stream Live, Inhaus/Firmenseminar, Berlin, Bremen, Darmstadt, Dresden, Erfurt, Essen, Flensburg, Frankfurt, Freiburg, Friedrichshafen, Hamburg, Hamm, Hannover, Jena, Kassel, Köln, Konstanz, Leipzig, Luxemburg, Magdeburg, Mainz, München, Münster, Nürnberg, Paderborn, Potsdam, Regensburg, Rostock, Stuttgart, Trier, Ulm, Wuppertal, Würzburg |
| Methoden: | Vortrag, Demonstrationen, praktische Übungen am System |
| Seminararten: | Öffentlich, Webinar, Inhouse, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht |
| Durchführungsgarantie: | ja, ab 2 Teilnehmern |
| Sprache: | Deutsch - bei Firmenseminaren ist auch Englisch möglich |
| Seminarunterlage: | Dokumentation auf Datenträger oder als Download |
| Teilnahmezertifikat: | ja, selbstverständlich |
| Verpflegung: | Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch) |
| Support: | 3 Anrufe im Seminarpreis enthalten |
| Barrierefreier Zugang: | an den meisten Standorten verfügbar |
| Weitere Informationen unter + 49 (221) 74740055 |
Seminartermine
Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.
