Занятие 1: Понятие «больших данных». Обзор экосистемы Apорhe Hadoop и дистрибутива Cloudera Hadoop
Занятие 2: Платформа Apache Hadoop. Файловая система HDFS. Форматы хранения данных. Компрессия данных.
Занятие 3: Планировщик выполнения задач на кластере Apache YARN
Занятие 4: SQL интерфейс к данным Apache Hive
Занятие 5: Паттерны распределенной обработки данных Map Reduce