5. Материализованные представления в Oracle. Обновление материализованных представлений.
6. Визуализация данных в системах Data Warehouse. Tableau Desktop.
7. Обзор NoSQL решений для обработки больших данных
8. Знакомство с платформой Hadoop, на примере дистрибутива Cloudera.
9. Платформа Apache Hadoop: файловая система HDFS, Форматы хранения данных в Hadoop: текст, Sequence, ORC, Parquet, Avro. Компрессия данных.
10. MapReduce и планировщик задач YARN. Паттерны обработки данных в MapReduce.
11. Дистрибутив Cloudera Hadoop: Hive, Impala, Spark, Pig, HBase, Oozie. Cloudera Manager. Практикум на Hive, HBase и Oozie.
13. Решения для полнотекстового поиска на базе Apache Lucene. Практикум на Elastic Search.
14. Обзор технологии Blockchain. Пример "умного контракта" на Ethereum.
Материалы
Исходные коды с примерами: https://bitbucket.org/eugav/hadoop-test/src