Hadoop è un progetto open source che permette di analizzare enormi quantità di dati distribuiti su cluster e file system differenti. Progettato per essere scalabile da un singolo server fino a migliaia di macchine, Hadoop si occupa anche di gestire problemi e guasti a livello applicativo - piuttosto che hardware - contribuendo a ottimizzare il mantenimento dei dati archiviati. Questo libro è dedicato a chi vuole entrare nel mondo della gestione e dell'analisi di Big Data. Attraverso l'uso degli strumenti e dei framework che compongo Hadoop 2, il lettore viene guidato nella progettazione e nell'implementazione di soluzioni di complessità differente, in grado di adattarsi a necessità operative e gestionali diverse che considerano sia la creazione e il mantenimento di dataset, sia la loro elaborazione e analisi per ottenere il massimo dai dati collezionati.
Informatique et technologie