Big Data Schulung – Einführung

Big Data - Einführung

Die Schulung „Big Data – eine Einführung in das Thema“ gibt einen Überblick, warum das Thema so wichtig ist. Jenseits des damit verbundenen Marketing-Spektakels werden die einzelnen Komponenten und ihr Zusammenwirken vorgestellt und mögliche Einsatzszenarien skizziert.

Schulungsunterlagen: nach Absprache

Dauer: 1 Tag

Zielgruppe

Entscheider, (Fach-)Anwender, Projektmanager

Voraussetzungen

IT-Grundkenntnisse

Agenda

Überblick
In diesem Abschnitt erfährt der Teilnehmer etwas über die riesigen Datenmengen, die durch die Welt bewegt werden und darüber, dass nicht das Speichern, sondern das Suchen und Analysieren von Informationen das Problem ist.

Hadoop-Bestandteile
Big Data wird zumeist mit Hadoop gleichgesetzt. Das ist zwar nicht ganz exakt, wird aber in diesem Seminar ebenso gehandhabt. In diesem Abschnitt erhält der Teilnehmer einen allerersten Überblick zu Hadoop. Die Nutzung einer Hadoop-Sandbox wird demonstriert.

Was ist anders
Personen, die im Umgang mit Datenbanken und strukturierten Daten vertraut sind, tun sich schwer mit dem Ansatz für Big Data. Hadoop tickt gänzlich anders als die vertraute relationale Welt. In diesem Abschnitt erfahren Teilnehmer das Wichtigste darüber, was Hadoop von dem klassischen Ansatz unterscheidet.

Hadoop Distributed File System (HDFS)
Das Kernstück von Hadoop ist ein leistungsstarkes, robustes und extrem skalierbares Dateisystem. In diesem Abschnitt erfahren Teilnehmer das Wichtigste über HDFS. Die Kommunikation von und mit HDFS wird demonstriert.

MapReduce
Die Java-basierte Klassenbibliothek für MapReduce ist der Maschinenraum von Hadoop. In diesem Abschnitt lernen die Teilnehmer das von Google eingeführte Programmiermodell für nebenläufige Berechnungen näher kennen. Die Anwendung von MapReduce wird demonstriert.

Hive
Mit Hive steht eine Schnittstelle zur Verfügung, die den Zugang zu strukturierten Daten in Hadoop mit einer SQL-ähnlichen Syntax erlaubt. In diesem Abschnitt lernen die Teilnehmer die Möglichkeiten und Grenzen von Hive kennen. Die Anwendung von Hive wird demonstriert.

Die Hardware für Hadoop
Hadoop stellt keine besonderen Hardware-Anforderungen. Das stimmt und stimmt wiederum auch nicht. In diesem Abschnitt wird der scheinbare Widerspruch aufgeklärt.

Anwendungsbeispiele für Hadoop
Und wozu der ganze Aufwand? In diesem abschließenden Abschnitt lernen die Teilnehmer mögliche Anwendungsfälle für Big Data kennen.