Beschreibung
In diesem Buch werden zunächst die Grundlagen zu Big Data und Data Warehouse erläutert. Im Anschluss daran erfolgt eine Beschreibung von Apache Hadoop. Im besonderen von HDFS, MapReduce und YARN. Hieran schließt sich die Darstellung ausgewählter Technologien aus dem Hadoop Ökosystem wie Hive, Pig, Oozie, Sqoop, Parquet, Avro und anderen an. Darauf folgend werden sieben Modelle vorgestellt, wie bestehende Data Warhouse Systeme um Big Data Technologien erweitert werden können. Zuletzt erfolgt eine exemplarische Implementierung eines der vorgestllten Modelle sowie ein Fazit.
Autorenporträt
Philipp Loer ist Berater im Datenbank- und Big Data-Umfeld bei großen deutschen Banken und Versicherungen sowie Schulungsreferent und Autor.
Herstellerkennzeichnung:
BoD - Books on Demand
In de Tarpen 42
22848 Norderstedt
DE
E-Mail: info@bod.de